CentOS 5.6下安装Hadoop完全分布式模式

2019-03-28 14:03|来源: 网络

实验环境
  1. 系统 : CentOS 5.6
  2. JDK  : jdk-6u26-linux-i586-rpm.bin
  3. 账号 : Hadoop
  4. 目录 : /usr/local/hadoop
  5. 主机名 :master slave1 slave2

相关阅读:CentOS 5下安装Hadoop-伪分布式模式 http://www.linuxidc.com/Linux/2012-02/53815.htm

实验目的

组建三台机器的群集

  • master: 部署namecode,JobTracker,DataNode,TaskTracker
  • slave1: 部署JobTracker,DataNode,TaskTracker
  • slave2: 部署JobTracker,DataNode,TaskTracker

其实这个不是最好的组建方法。实验为了更好的测试多节点而这样设置。

安装
  • 请确保每台机器都安装了sun jdk 将hadoop安装在相同的目录(/usr/local/hadoop)。
  • 请确保hadoop/conf/hadoop-env.sh 中JAVA_HOME=/usr/java/jdk1.6.0_26 设置并且正确。
  • 每台机器创建hadoop账户。
 #useradd hadoop
 #passwd hadoop
  • 确保master能无密码登录。
 $ssh-keygent -t dsa (我将密码设置为空方便测试。正常环境请安装keychain,keychain安装
)
 $cd .ssh
 $cat cat id_rsa.pub > authorized_keys
 $chmod 600 authorized_keys  (将权限设置为600否者ssh将不读取公钥信息)
    • 分发public key
 $ssh-copy-id slave1
 $ssh-copy-id slave2
配置文件概述
  • NameNode : core-site.xml
  • JobTracker : mapred-site.xml
  • DataNode : hdfs-site.xml
  • master : masters
  • slave : slaves
配置
  • 编辑namenode的配置文件
  $vi core-site.xml
  <configuration>
     <property>
       <name>fs.default.name</name>
       <value>hdfs://192.168.60.149:9000/</value>   
     </property>
     <property>
       <name>hadoop.tmp.dir</name> 
       <value>/usr/local/hadoop/hadooptmp</value>
     </property>
  </configuration>
  • 编辑JobTracker的配置
  $vi mapred-site.xml   
  <configuration>
    <property>
       <name>mapred.job.tracker</name>   
       <value>192.168.60.149:9001</value>
    </property>
    <property>
       <name>mapred.local.dir</name>
       <value>/usr/local/hadoop/mapred/local</value>
    </property>
    <property>
       <name>mapred.system.dir</name>
       <value>/tmp/hadoop/mapred/system</value>
    </property>
  </configuration>
  • 编辑DataNode配置
  $vi hdfs-site.xml
  <configuration>
  <property>
       <name>dfs.name.dir</name>
       <value>/usr/local/hadoop/hdfs/name</value>
    </property>
    <property>
       <name>dfs.data.dir</name>
       <value>/usr/local/hadoop/hdfs/data</value>
    </property>
    <property>
       <name>dfs.replication</name>   
       <value>3</value>
    </property>
  </configuration>
  • 修改slave1,slave2的配置
    • 修改slave1,slave2的JobTracker的配置
  $vi mapred-site.xml   
  <configuration>
    <property>
       <name>mapred.job.tracker</name>   
       <value>192.168.60.149:9001</value>
    </property>
    <property>
       <name>mapred.local.dir</name>
       <value>/usr/local/hadoop/mapred/local</value>
    </property>
    <property>
       <name>mapred.system.dir</name>
       <value>/tmp/hadoop/mapred/system</value>
    </property>
  </configuration>
    • 修改slave1,slave2的DataNode配置
  $vi hdfs-site.xml
  <configuration>
  <property>
       <name>dfs.name.dir</name>
       <value>/usr/local/hadoop/hdfs/name</value>
    </property>
    <property>
       <name>dfs.data.dir</name>
       <value>/usr/local/hadoop/hdfs/data</value>
    </property>
    <property>
       <name>dfs.replication</name>   
       <value>3</value>
    </property>
  </configuration>
  • 设置master
  $vi masters
  master
  • 设置slave
  $vi slaves
  master
  slave1
  slave2

相关问答

更多
  • 您好!很高兴为您答疑。   在centos7下安装火狐浏览器与在一般的linux系统下安装没有什么太大的差别。   1.首先从官网下载最新的火狐版本:http://firefox.com.cn/ 2.解压: tar -xjvf xxxx.tar.bz2 -C /usr/local 3.替换原有的 firefox 命令 # which firefox /usr/bin/firefox # mv /usr/bin/firefox /usr/bin/firefox-old # ln -s /usr/local/f ...
  • 有些软件会有 make uninstall 之类的功能,但大多都没有,所以只有手动删除,或者在configure的时候加个preifx参数,比如 --preifx=/opt/squid,这样当你不用的时候直接rm -rf /opt/squid 就可以了。
  • 序号 名称 描述 1 系统环境 Centos6.5 2 JAVA环境 JDK1.7 3 Haoop版本 hadoop2.2.0 安装步骤如下: 序号 步骤 1 解压hadoop,并配置环境变量 2 使用which hadoop命令,测试是否成功 3 配置core-site.xml 4 配置hdfs-site.xml 5 配置yarn-site.xml(非必须,使用默认也可) 6 配置mapred-site.xml 7 配置mapred-env.sh里面的JAVA路径 8 如上的配置完成后,需要新建几个文件夹 ...
  • 部署步骤 序号 操作 1 配置SSH无密码登陆 2 配置环境变量JAVA(必须),MAVEN,ANT 3 配置Hadoop环境变量 4 配置core-site.xml文件 5 配置hdfs-site.xml文件 6 配置mapred-site.xml文件 7 配置yarn-site.xml文件 8 配置slaves文件 9 分发到从机上 10 在每台机器上格式化namenode 11 启动集群sbin/start-all.sh 12 执行jps命令,查询master与slave的java进程 13 测试页面 ...
  • centos下安装php[2022-10-22]

    yum install -y php ## 这个只安装PHP ## 建议安装运行库及MySQL的支持 yum install -y php php-devel php-mysql ## 如果你的系统是CentOS 5.6那么上面这条命令安装的是PHP 5.1,要安装 PHP 5.3则执行下面的命令: yum install -y php53 php53-devel php53-mysql
  • centos下安装php[2023-10-05]

    yum install -y php ## 这个只安装PHP ## 建议安装运行库及MySQL的支持 yum install -y php php-devel php-mysql ## 如果你的系统是CentOS 5.6那么上面这条命令安装的是PHP 5.1,要安装 PHP 5.3则执行下面的命令: yum install -y php53 php53-devel php53-mysql
  • 你唯一的希望就是自己建造它。 了解CentOS / RHEL 5.x此时已超过4年。 世界已经基本上继续前进,尤其是与图形相关的东西。 我完全不会惊讶你找不到最近版本的Cairo的软件包。 如果你不能自己构建它,我可以推荐的下一个最好的事情就是等待CentOS 6(或者如果你愿意购买RHEL 6),或者切换发行版(转到Fedora不会是一个很大的飞跃,但是能为您提供最新的软件包,它是桌面的理想选择。 It's likely your only hope is to build it yourself. Un ...
  • 以下是安装Postgres-XL的关键点。 详细信息请参见https://ruihaijiang.wordpress.com/2015/09/17/postgres-xl-installation-example-on-linux/ 1.规划您的主机,IP,端口等。例如, GTM: hostname=host1 nodename=gtm IP=192.168.187.130 port=6666 Coordinator: hostname=host2 nodename=coord1 IP=192.168.1 ...
  • 您可以使用pecl install apc安装它 http://2bits.com/articles/installing-php-apc-gnulinux-centos-5.html这篇文章是完整指南......我也使用它安装了我的文章。 You can install that by using pecl install apc http://2bits.com/articles/installing-php-apc-gnulinux-centos-5.html This article is the ...
  • 这是一个不耐烦的快速入门: 下载Hive并将其安装到已安装Hadoop的同一目录中(例如,如果Hadoop位于/ opt / hadoop,则Hive应位于/ opt / hive中): wget http://apache.rediris.es/hive/hive-2.1.0/apache-hive-2.1.0-bin.tar.gz tar -xvf apache-hive-2.1.0-bin.tar.gz mv apache-hive-2.1.0-bin hive cd hive 生成德比Metas ...