首页 \ 教程 \ hadoop

知识点

hadoop

Hadoop中DataNode与NameNode之间的心跳机制

微信-心跳机制

Hadoop源码分析之一(RPC机制之Server)

源码级强力分析Hadoop的RPC机制

Hadoop源码分析之二(RPC机制之Call处理)

Hadoop 中 IPC 的源码分析

Hadoop0.21.0源码流程分析

Hadoop源码分析HDFS ClientProtocol——create

Hadoop源码分析 HDFS ClientProtocol——addBlock

Hadoop目前的HA(High Availability)机制分析和源代码研究

Hadoop分析之二元数据备份方案的机制

Hadoop源码分析之RPC(Remote Procedure Call Protocol)

Storm DRPC实现机制分析

lucene的缓存机制分析

Hadoop Lzo 源码分析之分片/切片原理

Hadoop心跳机制源码分析

2019-03-28 13:42|来源: 网络

正文：

一．体系背景

首先和大家说明一下：Hadoop的心跳机制的底层是通过RPC机制实现的，这篇文章我只介绍心跳实现的代码，对于底层的具体实现，大家可以参考我的另几篇文章：

1. Hadoop的RPC机制（参考： http://www.linuxidc.com/Linux/2012-06/62081.htm ）
2. 动态代理（参考：http://www.linuxidc.com/Linux/2012-06/62079.htm ）
3. Java NIO（参考： http://www.linuxidc.com/Linux/2012-06/62080.htm ）

以上三篇文章和这篇文章完整地分析了hadoop的数据传输过程。大家可以当成一个体系来阅读。

二．心跳机制

1. hadoop集群是master/slave模式，master包括Namenode和Jobtracker，slave包括Datanode和Tasktracker。

2. master启动的时候，会开一个ipc server在那里，等待slave心跳。

3. slave启动时，会连接master，并每隔3秒钟主动向master发送一个“心跳”，这个时间可以通过”heartbeat.recheck.interval”属性来设置。将自己的状态信息告诉master，然后master也是通过这个心跳的返回值，向slave节点传达指令。

4. 需要指出的是：namenode与datanode之间的通信，jobtracker与tasktracker之间的通信，都是通过“心跳”完成的。

三．Datanode、Namenode心跳源码分析

既然“心跳”是Datanode主动给Namenode发送的。那Datanode是怎么样发送的呢？下面贴出Datanode.class中的关键代码：

代码一：

/**
* 循环调用“发送心跳”方法，直到shutdown
* 调用远程Namenode的方法
*/
public void offerService() throws Exception {
•••
while (shouldRun) {
try {
long startTime = now();
// heartBeatInterval是在启动Datanode时根据配置文件设置的，是心跳间隔时间
if (startTime - lastHeartbeat > heartBeatInterval) {
lastHeartbeat = startTime;
//Datanode发送心跳
DatanodeCommand[] cmds = namenode.sendHeartbeat(dnRegistration,
data.getCapacity(),
data.getDfSUSEd(),
data.getRemaining(),
xmitsInProgress.get(),
getXceiverCount());
myMetrics.addHeartBeat(now() - startTime);
if (!processCommand(cmds))
continue;
}
•••
}
} // while (shouldRun)
} // offerService

需要注意的是：发送心跳的对象并不是datanode，而是一个名为namenode的对象，难道在datanode端就直接有个namenode的引用吗？其实不然，我们来看看这个namenode吧：

代码二：

public DatanodeProtocol namenode = null;

namenode其实是一个DatanodeProtocol的引用，在对hadoop RPC机制分析的文章中我提到过，这是一个Datanode和Namenode通信的协议，其中有许多未实现的接口方法，sendHeartbeat()就是其中的一个。下面看看这个namenode对象是怎么被实例化的吧：

代码三：

this.namenode = (DatanodeProtocol)
RPC.waitForProxy(DatanodeProtocol.class,
DatanodeProtocol.versionID,
nameNodeAddr,
conf);

其实这个namenode并不是Namenode的一个对象，而只是一个Datanode端对Namenode的代理对象，正是这个代理完成了“心跳”。代理的底层实现就是RPC机制了。参考：http://www.linuxidc.com/Linux/2012-06/62081.htm 。

知识点

相关文章

最近更新

Hadoop心跳机制源码分析

相关问答

Hadoop源码分析如何下手？[2022-03-09]

jquery 源码分析[2022-08-08]

Linux源码情景分析[2023-08-23]

如何实现hadoop 的安全机制[2024-02-19]

《深入分析linux内核源码》[2022-08-04]

hadoop源码修改了，编译成功后，将编译后的hadoop文件直接拿来搭建么，还是需要经过什么处理呢？[2023-06-02]

如何对MFC源码进行分析呢？[2021-12-31]

eclipse关联好hadoop源码后，提示 source no found 是哪里没有设置好呢？[2021-12-01]

关于Hadoop的运行机制[2024-01-12]

分析Hadoop(Profiling Hadoop)[2022-02-05]

知识点

相关文章

最近更新

Hadoop心跳机制源码分析

相关问答

Hadoop源码分析如何下手？[2022-03-09]

jquery 源码 分析[2022-08-08]

Linux源码情景分析[2023-08-23]

如何实现hadoop 的安全机制[2024-02-19]

《深入分析linux内核源码》[2022-08-04]

hadoop源码修改了，编译成功后，将编译后的hadoop文件直接拿来搭建么，还是需要经过什么处理呢？[2023-06-02]

如何对MFC源码进行分析呢？[2021-12-31]

eclipse关联好hadoop源码后，提示 source no found 是哪里没有设置好呢？[2021-12-01]

关于Hadoop的运行机制[2024-01-12]

分析Hadoop(Profiling Hadoop)[2022-02-05]

jquery 源码分析[2022-08-08]