知识点
相关文章
更多最近更新
更多Hadoop 伪分布式安装
2019-03-28 12:59|来源: 网络
Hadoop的安装分为本地模式、伪分布式模式、集群模式
在这里演示伪分布式模式的安装和部署,以下将演示hadoop安装在RedHat上的方法,首先要确保防火墙已经关闭。
1. 安装JDK,设置环境变量,这里选择JDK1. 6
2. 下载hadoop1.1.2安装文件,hadoop-1.1.2.tar.gz
3. 将该文件解压到linux机器上,配置hadoop环境变量,具体配置如下
exportJAVA_HOME=/usr/local/jdk
export HADOOP_HOME=/usr/local/hadoop
export PATH=.:$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin
4. 设置ssh自动登录
生成密钥文件,ssh-keygen -t rsa
修改生成文件的名字:cp id_rsa.pub authorized_keys, 这里一定要这么做
确认ssh自动登录已经成功:ssh hadoop,连续登录两次主机,第二次不用确认信息,说明设置成功
5. 配置hadoop文件
要配置伪分布式,这里要修改hadoop的配置文件
在hadoop中设置java home
1) 修改hadoop-env.sh
在hadoop/conf下打开hadoop-env.sh
export HADOOP_PID_DIR=/usr/local/hadoop/pids
export JAVA_HOME=/usr/local/java
2) 修改core-site.xml
在core-site.xml中加入以下行,设置hadoop file system的访问路径,以及tmp文件的存储路径,在源码中,你可以看到默认值
<property>
<name>fs.default.name</name>
<value>hdfs://hadoop:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop/tmp</value>
</property>
3) 修改hdfs-site.xml
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
4) 修改mapred-site.xml
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>hadoop:9001</value>
</property>
</configuration>
6. 格式化namenode
Hadoop namenode –format
7. 启动hadoop
start-all.sh,这里启动了五个java进程,有namenode, datanode, jobtracker,tasktracker, secondarynamenode, 可以用jps命令查看是否启动成功
8. 在浏览器中查看namenode是否启动成功
http://localhost.localdomain:50070/dfshealth.jsp
更多Hadoop相关信息见Hadoop 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=13
相关问答
更多-
怎样在hadoop伪分布式集群上安装mysql[2022-03-17]
先回答你标题的提问:hadoop完全分布式:3个及以上的实体机或者虚拟机组件的机群。hadoop伪分布式:一个节点看了以上两点相信你已经明白了,“用vm多装几个unbuntu配置完全分布式,然后做实验”这是完全可行的。实际上我们通常也是这么做的,当然可能要求你的电脑cpu和内存足够支撑你这一计划。一点建议:如果你要开发基于Hadoop的分布式程序,伪分布式足够你实验了。如果你要做很多其他事情,比如玩玩cm,玩玩oozie,玩玩hbase,建议装多个虚拟机。 -
如何配置hadoop伪分布式配置[2023-08-24]
0.关闭防火墙 service iptables start;#立即开启防火墙,但是重启后失效。 service iptables stop;#立即关闭防火墙,但是重启后失效。 重启后生效 chkconfig iptables on;#开启防火墙,重启后生效 chkconfig iptables off;#关闭防火墙,重启后生效 1.配置主机名 !!!!!注意安装hadoop的集群主机名不能有下划线!!不然会找不到主机!无法启动! 配置主机名 $vi /etc/sysconfig/network $sour ... -
学习hadoop到底是部署伪分布式还是安装集群[2023-03-30]
先回答你标题的提问:hadoop完全分布式:3个及以上的实体机或者虚拟机组件的机群。hadoop伪分布式:一个节点看了以上两点相信你已经明白了,“用vm多装几个unbuntu配置完全分布式,然后做实验”这是完全可行的。实际上我们通常也是这么做的,当然可能要求你的电脑cpu和内存足够支撑你这一计划。一点建议:如果你要开发基于Hadoop的分布式程序,伪分布式足够你实验了。如果你要做很多其他事情,比如玩玩cm,玩玩oozie,玩玩hbase,建议装多个虚拟机。 -
如何测试伪分布式hadoop是否安装成功[2023-06-02]
启动hdfs,mr和yarn服务看是否能够正常启动,然后用hadoop fs -ls /是否能够正常执行 -
如何判断伪分布式的hadoop安装成功[2023-07-01]
启动hdfs,mr和yarn服务看是否能够正常启动,然后用hadoop fs -ls /是否能够正常执行 -
什么是伪分布式?(hadoop中遇到的)[2022-04-23]
hadoop分为单机模式,伪分布式,和完全分布式。 你说的伪分布式是指:一个机器上,即当namenode,又当datanode,或者说即是jobtracker,又是tasktracker。没有所谓的在多台机器上进行真正的分布式计算,故称为"伪分布式"。 -
在 /usr/local/hadoop/ 下面启动,找到是/opt/Hadoop/下面的hadoop安装包,是不是HADOOP_HOME环境变量配置的有问题。 可以到海牛部落交流,那里有好多学习hadoop的朋友
-
hadoop配置了集群,但启动仍然是伪分布式下的启动状态[2022-08-22]
你可以输入JPS查看一下进程 一般你的master上是namenode secondarynamenode 和jobtracker三个进程 你的slaves上 有各自的datanode 和tasktracker两个进程 你看看是不是有各自进程都启动起来了 启动起来了就是分布式 如果只有一台机子有进程 那你就重新把那些配置文件再设置一下 -
hadoop 集群 和 hadoop 分布式 怎么理解啊[2022-02-07]
hadoop集群指的是一群机器在一起提供一个hadoop的集群的服务。 hadoop分布式指的是hadoop支持任务分布式运行,因为有hadoop集群提供服务,所以hadoop将任务分发到集群的多台机器运行,所以叫做分布式。 一个是服务器架构,一个是任务运行架构。 -
如何检查我的hadoop是否以伪分布式模式运行?(How to check if my hadoop is running in pseudo distributed mode?)[2023-03-05]
要知道您是以独立还是伪分布模式运行hadoop,请验证您的配置文件。 以下信息可能有帮助。 To know if you are running hadoop in Standalone or Pseudo distributed mode, verify your configuration files. Below information might help.