首页 \ 教程 \ hadoop

知识点

hadoop

Hadoop Namenode HA 合并到主干

Hadoop中的排序器/组合器/合并器

《Lucene、webservice、(svn_ant_maven)、DWR、Freemarker、POI视频教程》更新了Spring、JAXWs的整合并且完成了一个小项目[压缩包]

Memcached set 添加或更新数据命令

jsp、struts1和hibernate如何实现批量更新数据

使用 Apache Lucene 和 Solr 进行位置感知搜索——通过合并非结构化文本和空间数据改进搜索应用程序

多进程更新数据库情况下，还能使用hibernate吗?

SAP发布软件更新包集成HANA与Hadoop

Hadoop数据迁入到Hive

freebsd solr 索引更新数据报错解决一例

Hadoop处理数据的轨迹

jsp页面表单和数据库之间的动态更新

关于netbeans使用GWT框架失效或点击不显示的问题，最后导致生成失败

Hadoop——Microsoft大数据战略的核心

保障 Hadoop 数据安全的十大措施

Hadoop出现元数据不能更新且SNN合并失效

2019-03-28 13:47|来源: 网络

问题表现： NameNode 保存edits文件停留在5.3号凌晨。SNN执行合并文件报空指针错误，导致无法正常合并元数据

原因：要弄清原因首先需要清楚SNN合并流程，NN写editslog流程等等。简单说来如下：

1 在5.3号 SNN合并文件后并成功将合并的数据put到NN。当NN在关闭临时edit文件edit.new，打开edits文件时报错：unable to open

2 正常情况下，打开edits文件后，会将edits输出流加入前面已经清空的edits输出流列表。在1 失败下，该操作未做，所以edits输出流列表为空表对象

3 打开失败下，会将失败的路径自动移除掉，以便后面的自动尝试恢复。同时自动尝试恢复是在SNN合并文件时出发。但是咱们的情况是2个edits路径全部失败，导致路径集合为null。

4 新的SNN合并请求过来后会先得到存储路径集合，此时报Null退出。

5 对于文件操作的日志，因为2操作没有执行，没有可用的edits输出流列表，所以直接往下执行其他操作，导致edits文件也不再更新。

解决思路：

1 因为NN不再更新edits文件，SNN也无法合并Img，所以以前NN保存的元数据无法使用。所以必须恢复元数据到最新。这可以通过hdfs提供的api导出hdfs目录元数据并保存。

这个操作必须在安全模式下执行。

2 从上面5点看，很多操作时由于打不开edit后导致的edits输出流列表为空表（不是Null）和NN的元数据存储路径为Null

3 恢复edits输出流列表，才能让NN正常写edits，这个操作可以调用hdfs提供的api实现。

4 恢复NN的元数据存储路径也可以调用hdfs提供的api重新设置。

解决方案：

1 让集群进入安全模式，使用导出元数据的jsp ，导出最新元数据，停止集群，，拷贝新的元数据替换旧的元数据后重启集群。

2 让集群进入安全模式，使用导出元数据的jsp ，导出最新元数据，拷贝新的元数据替换旧的元数据。恢复edits流列表，恢复NN的元数据存储路径列表，离开安全模式。（测试正常，但没在线上应用）

附件：

1 导出元数据的jsp：

<%@ page
contentType="text/html; charset=UTF-8"
isThreadSafe="false"
import="java.io.*"
import="java.lang.reflect.*"
import="org.apache.Hadoop.hdfs.*"
import="org.apache.hadoop.hdfs.server.namenode.*"
import="org.apache.hadoop.hdfs.server.common.Storage.StorageDirectory"
import="org.apache.hadoop.hdfs.server.common.Storage.StorageDirType"
%>
<%
String path = request.getParameter("dir");
if (path == null) {
throw new IllegalArgumentException("specify dir parameter");
}
File dir = new File(path);
if (!dir.exists()) {
dir.mkdir();
}
NameNode nn = (NameNode)application.getAttribute("name.node");
if (!nn.isInSafeMode()) {
throw new IllegalStateException("not in safe mode");
}
// Use reflection to find saveCurrent()
FSImage image = nn.getFSImage();
Method m = FSImage.class.getDeclaredMethod("saveCurrent", StorageDirectory.class);
m.setAccessible(true);
// Use reflection to find the IMAGE_AND_EDITS enum, since it's package-protected
Class c = Class.forName("org.apache.hadoop.hdfs.server.namenode.FSImage$NameNodeDirType");
StorageDirType[] constants = (StorageDirType[])c.getEnumConstants();
StorageDirType t = null;
for (StorageDirType sdt : constants) {
if (sdt.toString().equals("IMAGE_AND_EDITS")) {
t = sdt;
}
}
if (t == null) {
throw new IllegalStateException("no type");
}
// Actually save
StorageDirectory sd = image.new StorageDirectory(dir, t);
m.invoke(image, sd);
%>
Saved image to <%= sd.getCurrentDir() %>

2 查看 edit流列表及存储路径集合及其他对象jsp：

<%@ page
contentType="text/html; charset=UTF-8"
isThreadSafe="false"
import="java.io.*"
import="java.util.*"
import="java.lang.reflect.*"
import="org.apache.hadoop.hdfs.*"
import="org.apache.hadoop.hdfs.server.namenode.*"
import="org.apache.hadoop.hdfs.server.common.Storage.StorageDirectory"
import="org.apache.hadoop.hdfs.server.common.Storage.StorageDirType"
%>
<%
NameNode nn = (NameNode)application.getAttribute("name.node");
out.println("namenode="+nn.toString());
final FSImage nnImage = (FSImage)application.getAttribute("name.system.image");
out.println("storagedirs="+nnImage.listStorageDirectories());
Method m = FSImage.class.getDeclaredMethod("getFsImageName", null);
m.setAccessible(true);
out.println("nnImage.getFsImageName()="+m.invoke(nnImage,null));
out.println("httpserver name.system.image="+nnImage.toString());
out.println("getFsImage from nn="+nn.getFSImage());
out.println("<br/>");
File eFile=new File("/data0/hadoop/hdfs/name/current/edits");
RandomAccessFile rp = new RandomAccessFile(eFile, "rw");
FileOutputStream fp = new FileOutputStream(rp.getFD());
// FSEditLog.EditLogOutputStream eStream = new FSEditLog.EditLogFileOutputStream(eFile);
out.println("fileoutputstream="+fp.toString());
out.println("<br/>");
m = FSImage.class.getDeclaredMethod("getRemovedStorageDirs", null);
m.setAccessible(true);
List<StorageDirectory> list=(List<StorageDirectory>)m.invoke(nnImage,null);
out.println("removedStorageDirs.size="+list.size());
for(StorageDirectory dir:list)
out.println("removeddir="+dir.getRoot().getPath().toString());
out.println("<br/>");
FSNamesystem fsNamesystem=nn.getNamesystem();
Method mm = FSNamesystem.class.getDeclaredMethod("getEditLog", null);
mm.setAccessible(true);
FSEditLog editlog=(FSEditLog)mm.invoke(fsNamesystem,null);
out.println("nn's editlog="+editlog.toString());
Method mm1 = FSEditLog.class.getDeclaredMethod("getNumEditStreams", null);
mm1.setAccessible(true);
out.println("getNumEditStreams="+mm1.invoke(editlog,null));
%>

知识点

相关文章

最近更新

Hadoop出现元数据不能更新且SNN合并失效

相关问答

mysql数据库索引失效求解[2022-12-09]

使用jclouds API仅在SoftLayer中更新对象的元数据(Updating only metadata of an object in SoftLayer using jclouds API)[2022-02-03]

Hadoop namenode元数据(Hadoop namenode metadata)[2021-08-30]

更新后的任何更改都包含元数据？(Any change in post update inlcuding metadata?)[2023-07-15]

将数据导入Hadoop(Getting data into Hadoop)[2021-12-20]

hadoop -appendToFile与hadoop -put之间的区别是什么用于连续更新流数据到hdfs(what is the difference between hadoop -appendToFile versus hadoop -put when used for updating stream data into hdfs continously)[2022-08-19]

创建或更新产品元数据的更好方法是什么？(A better way to create or update product metafield?)[2022-04-08]

通过API更新Socrata数据集元数据(Update Socrata dataset metadata through API)[2022-07-05]

动态更新Eureka实例元数据(Dynamically update Eureka instance metadata)[2023-04-08]

理解在Hadoop中合并减少方面(Understanding of merging in Hadoop on reduce side)[2023-09-03]