在Eclipse下搭建Hadoop开发环境各种问题的解决

2019-03-28 14:02|来源: 网络

这两天折腾在eclipse中写Hadoop map-reduce jobs,遇到了很多问题,解决如下:

环境:

Ubuntu11.10 / CentOS6.2

hadoop-0.20.203.0

eclipse-java-indigo-SR1-linux-gtk-x86_64

配置过程:

1、准备

装好操作系统,安装jdk(参考http://www.linuxidc.com/Linux/2011-12/48970.htm)、ssh,centos6.2装上之后一般就带有openssh,在Services里面启用即可。

然后配置ssh无密码登陆,为安装伪分布式hadoop集群做准备,执行命令:

  1. $ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa  
  2. $ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys  
  3. $ ssh localhost  

ubuntu很顺利,不用输入密码即可登陆。但在contos上配置ssh无密码登陆有点纠结,需要修改/etc/ssh/ssh_config文件和authorized_keys的权限(参考 http://www.linuxidc.com/Linux/2012-02/54595.htm )修改完最好把系统重启一下。

另外,不要将启动hadoop的用户的主目录加密,否则没法配置ssh无密码登陆(参考 http://www.linuxidc.com/Linux/2011-12/48968.htm )。

2、安装Hadoop

从hadoop官网下载hadoop-0.20.203.0rc1.tar.gz到某个目录,如/srv,解压之,注意一定要将解压之后的目录及其子目录和文件的所有者改为将要启动hadoop的用户(参考 http://www.linuxidc.com/Linux/2011-12/49389.htm )。

之后设置HADOOP_HOME和PATH环境变量。虽然不是必须的,但为了以后方便,建议设置一下。在/etc/profile文件末尾添加:

  1. export HADOOP_HOME=/srv/hadoop-0.20.203.0  
  2. export PATH=$PATH:$HADOOP_HOME/bin  

然后对hadoop进行配置,分别修改如下$HADOOP_HOME/conf中的6个文件:

hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml、masters、slaves

具体的配置参考hadoop文档。但有一点需要注意:尽管配置的是伪分布式集群,建议不要在配置文件中使用localhost,因为如果使用localhost,以后在其他计算机上通过网络连接本机的hadoop时,会出现“拒绝连接”的情况(参考 http://www.linuxidc.com/Linux/2012-02/54594.htm ),我猜测这是因为hadoop的datanode是直接和用户建立连接的,不通过namenode,所以配置为localhost可能会导致用户试图和'localhost'上的datanode建立连接,故连接失败,猜测而已,目前没有能力去查证,还望指教。

相关问答

更多
  • 下载个Eclipse的CDT插件。CDT是Eclipse专为C/C++语言开发做的开发工具包
  • 把你action class代码贴上来。 很有可能是你forward有问题。 如果对您有帮助,请记得采纳为满意答案,谢谢!祝您生活愉快! vaela
  • 百度不就好了,我们是软件工程时的课设。用老师的ppt再在图书馆借俩本书自己研究的。课程紧,没看过视频教程。 书的话,具体记不清,大概是叫web网络开发实战吧。你也应该是学生吧,去图书馆看看吧,这个我没什么好的建议了。
  • 下载JDK,安装,然后进行环境变量的配置 配置好以后,下载eclipse解压缩即可使用
  • 1.先安装 JDK,配置Java环境 2.下载eclipse这是编写代码用的IDE 3.下载AndroidSDK用于Android开发 4.eclipse安装adt插件,配置AndroidSDK 5.建立项目coding吧~
  • 第一步:下载jogl-2.0-windows-i586.zip   第二步:解压ZIP文件,在环境变量PATH中添加如下路径:%jogl-2.0-windows-i586%\lib(这个表示应该看的懂吧,就是要把压缩包中的整个lib文件的路径都包括到PATH路径中)   第三步:在lib文件中,有如下四个JAR包,必须将其路径写入classpath中。JAR包名称如下:   jogl.all.jar   nativewindow.all.jar   gluegen-rt.jar   newt.all.jar ...
  • 方法为: 在eclipse下建立一个project,此处以demo为例建立项目。 因为此处结合struts2我们首先对struts2做简单的配置,主要以下几个文件配置web.xml,struts.xml,同时导入相应的jar。 现在开始配置spring,问题在于导入哪些jar,结合我的经验,spring-3-2-0导入以下基本jar便可,若要使用其他功能要导入相应的jar。导入较多,如下图中,其中commons-logging-xx.jar是结合struts2是要导入的在struts2里面。 接下来配置ap ...
  • 在Eclipse的Windows->Preferences中,选择Hadoop Map/Reduce,设置好Hadoop的安装目录,这里,我直接从linux的/home/hadoop/hadoop-1.0.3拷贝过来的,点击OK按钮!
  • 1.关闭hdfs权限:hdfs-site.xml中 dfs.permissions false 2.检查eclipse插件是否设置了hadoop安装目录:将与linux下安装的hadoop相同版本的hadoop解压到windows下一个文件夹,然后指定hadoop插件目录,插件目录在preferences的map/reduce的hadoop installation location 3.在windows的hosts文件中添加hadoop所有节点的ip和主机名 4.关闭linux系统防火墙 5.把hadoo ...
  • 2. 配置ADT(图3.1至图3.10 ) 只有配置了ADT插件和Android SDK,才可以进行Android项目的开发。 ADT的配置: 第一步,打开eclipse, 双击eclipse.exe,点击OK,图3.1至图3.4 ; 第二步,在eclipse中,选择“help->Install New Software”->点击 “add”->选择“Archive...”,并选中ADT-0.9.1.zip文件,点击“OK”->选中 “Developer Tools”,点击 “Next”->点击 “Fini ...