很多朋友在刚开始学习Hadoop的时候，都会以类似于下面的一个例子来开始自己的hadoop学习之旅：
public class MyHadoopCounter {

public static class MyHadoopMapper extends Mapper<LongWritable, Text, Text, Text> {

@Override
protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
System.out.println(" ===== " + value);
context.write(new Text("Info"), value);
}
}

public static void main(String[] args) throws Exception {
Configuration conf = new Configuration();
conf.addResource("core-site.xml");

Job myJob = new Job(conf, "MyJob");
myJob.setJarByClass(MyHadoopCounter.class);
myJob.setMapperClass(MyHadoopMapper.class);

FileInputFormat.addInputPath(myJob, new Path("data"));
FileOutputFormat.setOutputPath(myJob, new Path("out1"));

System.exit(myJob.waitForCompletion(true) ? 0 : 1);

}
}

(注：这个例子是我拷贝一位网友的)

然后，系统抛出了异常：
2011-12-17 17:17:37,912 INFO org.apache.hadoop.mapred.TaskInProgress: Error from attempt_201112171704_0004_m_000000_0: java.lang.RuntimeException: java.lang.ClassNotFoundException: com.xkq.hadoop.counter.MyHadoopCounter$MyHadoopMapper
at org.apache.hadoop.conf.Configuration.getClass(Configuration.java:866)
at org.apache.hadoop.mapreduce.JobContext.getMapperClass(JobContext.java:199)
at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:719)
at org.apache.hadoop.mapred.MapTask.run(MapTask.java:370)
at org.apache.hadoop.mapred.Child$4.run(Child.java:261)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:396)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1059)
at org.apache.hadoop.mapred.Child.main(Child.java:255)
Caused by: java.lang.ClassNotFoundException: com.xkq.hadoop.counter.MyHadoopCounter$MyHadoopMapper
at java.net.URLClassLoader$1.run(URLClassLoader.java:202)
at java.security.AccessController.doPrivileged(Native Method)
at java.net.URLClassLoader.findClass(URLClassLoader.java:190)
at java.lang.ClassLoader.loadClass(ClassLoader.java:306)
at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:301)
at java.lang.ClassLoader.loadClass(ClassLoader.java:247)
at java.lang.Class.forName0(Native Method)
at java.lang.Class.forName(Class.java:247)
at org.apache.hadoop.conf.Configuration.getClassByName(Configuration.java:819)
at org.apache.hadoop.conf.Configuration.getClass(Configuration.java:864)
... 8 more
2011-12-17 17:17:40,921 INFO org.apache.hadoop.mapred.JobTracker: Removing task 'attempt_201112171704_0004_m_000000_0'
2011-12-17 17:17:41,122 INFO org.apache.hadoop.mapred.JobInProgress: Choosing a failed task task_201112171704_0004_m_000000

我可以肯定这个异常绝大多数初学者都遇到过，所以我想说，你们遇到这个尴尬的问题是因为你们不懂Hadoop的源码。下面我来好好分析这个问题。

首先我想先说一个这个配置文件的加载，其实这位网友的conf.addResource("core-site.xml")在Configuration conf = new Configuration()之后根本就是多此一举，因为为在Configuration 类的静态代码中加入了

另外，在JobConf类的静态代码中也加入了

也就是说，Job的配置文件已经会默认包含core-default.xml、core-site.xml、mapred-default.xml、mapred-site.xml，这里还要特别注意的是，如果你不想要这些默认的配置文件，当你创建时应该这样

//false表示忽略默认的配置文件，true表示加载默认的配置文件，默认情况下是true

Configuration conf = new Configuration(false);

好，现在就来看看出现上面异常的原因，这个问题主要出在 myJob.setJarByClass(MyHadoopCounter.class)这条语句的本质是想获取MyHadoopCounter所在的jar包绝对路径，然后把这个绝对路径配置到作业的maprd.jar项,如果当前project中没有MyHadoopCounter所在的jar包的话，作业的配置文件中就没有maprd.jar项，当TaskTracker在执行该作业的任务时就找不到MyHadoopCounter类了，因此也就出现了上面的异常。

解决办法：

1.将上面的而是代码打成一个jar包，并将其引入加到当前工程中。

2.在客户端的配置文件mapred.site.xml中配置

<name>maprd.jar</name>

<value>MyHadoopCounter所在jar包的绝对路径</value>

</property>

知识点

相关文章

最近更新

Hadoop：客户端提交作业时发生的一个常见错误

相关问答

专利电子申请系统个人客户端，如何提交：意见陈述书和修改后的权利要求书？请详细些[2022-04-22]

hadoop客户端该如何配置[2023-10-18]

hive客户端需要hadoop吗[2022-01-10]

当NameNode关闭时，hadoop作业会发生什么？(What happens to hadoop job when the NameNode is down?)[2022-08-20]

如何从客户端Windows机器访问hadoop集群（unix）(How to access hadoop cluster (unix) from client windows machine)[2023-11-22]

为什么常见的Web服务客户端使用代理(Why do common web services client use a proxy)[2024-01-17]

当将一个巨大的文件加载到hadoop集群时，如果客户端在将数据传输到datanode时失败了会发生什么？(when loading a huge file into hadoop cluster , what happends if the client failed while transfering data to datanodes?)[2022-11-27]

pydoop vs hadoopy - hadoop python客户端[关闭](pydoop vs hadoopy - hadoop python client [closed])[2022-07-17]

将多个客户端数据加载到Hadoop的最佳实践(best practice to load multiple client data into Hadoop)[2022-07-30]

阻止其他常见的xmpp客户端登录XMPP(Block other common xmpp clients from logging in XMPP)[2022-01-14]

知识点