首页 \ 教程 \ hadoop

知识点

hadoop

Hadoop源码分析HDFS ClientProtocol——create

HDFS ClientProtocol——getBlockLocations

Hadoop HDFS源码学习笔记（四）

Hadoop HDFS源码学习笔记（一）

Hadoop HDFS源码namenode部分概述（一）

Hadoop-1.0.0 HDFS append操作深入分析

HDFS中DistributedFileSystem的创建

HDFS中namenode部分概述

基于HDFS的FTP

HDFS源码分析——格式化

源码级强力分析Hadoop的RPC机制

HDFS源码分析——RPC Client实现

Hadoop HDFS源码学习笔记（二）

Hadoop源代码分析之HDFS篇

HDFS中的通信协议

Hadoop源码分析 HDFS ClientProtocol——addBlock

2019-03-28 13:23|来源: 网络

addBlock()负责分配一个新的block以及该block备份存储的datanode。addBlock函数声明如下：

public LocatedBlock addBlock(String src, String clientName,DatanodeInfo[] excludedNodes)

其中src代表需要写入新block的文件；clientName代表写入该block的client、excludedNodes代表该block不能存储的datanode。

首先让我们思考一下addBlock应该如何实现。首先，我们需要修改src文件的INodeFile以便将新增block添加到INodeFile当中。因为INodeFile保存了最后一个Block存放的datanode，因此需要为新增的block分配datanode。下面我们看一下addBlock具体是怎么实现的。

在NameNode中，addBlock是通过FSNamesystem.getAdditionalBlock方法来实现的。在getAdditionalBlock中，首先检查内存中INode和block数量之和是否已经超过系统设置的阈值。然后检查Lease，查看当前client是否拥有文件写锁。除此之外，还需要检查INodeFile倒数第二个block是否已经完成所有备份存储的复制。如果所有这些检查都没有问题就挑选新block所有存储节点（datanode)。存储节点（datanode)挑选完成后，就new一个新的block。新block创建完成后，会在FSNamesystem.blocksMap中保存该block（其实是对应的BlockInfo)并且在INodeFile中添加该block。

注意：通过阅读源码我们可以知道，在addBlock方法中就已经将该block存入到blocksMap当中。这就需要我们考虑当DataNode不断的report该节点存放的block时修改的是不是blocksMap，其之间的逻辑关系是什么样子的。

public LocatedBlock getAdditionalBlock(String src, String clientName,

List<Node> excludedNodes) throws IOException {

long fileLength, blockSize;

int replication;

DatanodeDescriptor clientNode = null;

Block newBlock = null;

NameNode.stateChangeLog

.debug("BLOCK* NameSystem.getAdditionalBlock: file " + src

+ " for " + clientName);

synchronized (this) {

// have we exceeded the configured limit of fs objects.

checkFsObjectLimit();

INodeFileUnderConstruction pendingFile = checkLease(src, clientName);

// If we fail this, bad things happen!

if (!checkFileProgress(pendingFile, false)) {

throw new NotReplicatedYetException("Not replicated yet:" + src);

}

fileLength = pendingFile.computeContentSummary().getLength();

blockSize = pendingFile.getPreferredBlockSize();

clientNode = pendingFile.getClientNode();

replication = (int) pendingFile.getReplication();

}

// choose targets for the new block tobe allocated.

DatanodeDescriptor targets[] = replicator.chooseTarget(replication,

clientNode, excludedNodes, blockSize);

if (targets.length < this.minReplication) {

throw new IOException("File " + src

+ " could only be replicated to " + targets.length

+ " nodes, instead of " + minReplication);

}

// Allocate a new block and record it in the INode.

synchronized (this) {

if (isInSafeMode()) {

throw new SafeModeException("Cannot add block to " + src,

safeMode);

}

INode[] pathINodes = dir.getExistingPathINodes(src);

int inodesLen = pathINodes.length;

checkLease(src, clientName, pathINodes[inodesLen - 1]);

INodeFileUnderConstruction pendingFile = (INodeFileUnderConstruction) pathINodes[inodesLen - 1];

if (!checkFileProgress(pendingFile, false)) {

throw new NotReplicatedYetException("Not replicated yet:" + src);

}

// allocate new block record block locations in INode.

newBlock = allocateBlock(src, pathINodes);

pendingFile.setTargets(targets);

for (DatanodeDescriptor dn : targets) {

dn.incBlocksScheduled();

}

// Create next block

LocatedBlock b = new LocatedBlock(newBlock, targets, fileLength);

if (isAccessTokenEnabled) {

b.setBlockToken(accessTokenHandler.generateToken(b.getBlock(),

EnumSet.of(BlockTokenSecretManager.AccessMode.WRITE)));

}

return b;

}

private Block allocateBlock(String src, INode[] inodes) throws IOException {

Block b = new Block(FSNamesystem.randBlockId.nextLong(), 0, 0);

while (isValidBlock(b)) {

b.setBlockId(FSNamesystem.randBlockId.nextLong());

}

b.setGenerationStamp(getGenerationStamp());

b = dir.addBlock(src, inodes, b);

NameNode.stateChangeLog.info("BLOCK* NameSystem.allocateBlock: " + src

+ ". " + b);

return b;

}

Block addBlock(String path, INode[] inodes, Block block) throws IOException {

waitForReady();

synchronized (rootDir) {

INodeFile fileNode = (INodeFile) inodes[inodes.length - 1];

// check quota limits and updated space consumed

updateCount(

inodes,

inodes.length - 1,

fileNode.getPreferredBlockSize()

* fileNode.getReplication(), true);

// associate the new list of blocks with this file

namesystem.blocksMap.addINode(block, fileNode);

BlockInfo blockInfo = namesystem.blocksMap.getStoredBlock(block);

fileNode.addBlock(blockInfo);

NameNode.stateChangeLog.debug("DIR* FSDirectory.addFile: " + path

+ " with " + block + " block is added to the in-memory "

+ "file system");

}

return block;

}

知识点

相关文章

最近更新

Hadoop源码分析 HDFS ClientProtocol——addBlock

相关问答

用eclips 连hadoop报Unknown protocol to job tracker: org.apache.hadoop.hdfs.protocol.ClientProtocol[2023-07-17]

hadoop hdfs的问题[2021-10-30]

关于hadoop 本地文件向HDFS上传的问题[2023-02-08]

hadoop hdfs 源码怎么看[2024-04-01]

在Amazon Aws EC2上复制到HDFS时出现Hadoop警告和错误(Hadoop warning and error while copying to HDFS on Amazon Aws EC2)[2021-12-27]

hadoop hdfs指向file：///而不是hdfs：//(hadoop hdfs points to file:/// not hdfs://)[2022-02-06]

替换HDFS Hadoop(Replacing HDFS Hadoop)[2023-10-19]

Hadoop的HDFS与Spark(Hadoop's HDFS with Spark)[2023-10-09]

有可能只安装Hadoop HDFS吗？(It's possible only install Hadoop HDFS?)[2023-05-07]

Hadoop HDFS依赖(Hadoop HDFS dependency)[2022-10-17]