Hadoop+Zookeeper+HBase分布式安装部署

2019-03-28 13:33|来源: 网络

在实验室的机器上部署了HBase集群,遇到了很多问题,纠结了好几天。

其中有一个问题是:在CentOS和RHEL上,必须把/etc/sysconfig/network文件中的HOSTNAME也改掉,不让启动HBase时,总是Master和RegionServer无法连接。把权威指南和参考指南读了个遍也没找到解决方法,冥思了好几天才解决。

安装过程中学到的东西总结成了文档,如下:

集群情况: 4个节点,IP分别为:
node0: 192.168.181.136(NameNode/JobTracker/SecondaryNameNode/HMaster)
node1: 192.168.181.132(DataNode/TaskTracker/HRegionServer/QuorumPeerMain)
node2: 192.168.181.133(DataNode/TaskTracker/HRegionServer/QuorumPeerMain)
node3: 192.168.181.134(DataNode/TaskTracker/HRegionServer/QuorumPeerMain)

软件版本: CentOS Linux 6.2 x86_64(2.6.32) OpenJDK-1.6.0_24 Hadoop-1.0.2 Zookeeper-3.4.3 HBase-0.94.0

Note: 从CentOS镜像站下载系统: 系统安装之后可能没有自带完整的 GCC和JDK。如果是在VMWare虚拟机上安装系统的话,安装VMtools之前需要先安装GCC并更新Kernel,参考:http://blog.csdn.net/bhq2010/article/details/7364009 安装HBase需要先安装Hadoop和Zookeeper。在安装Hadoop之前,需要先确定所有节点的操作系统中安装了JDK 1.6,并正确设置JAVA_HOME、CLASSPATH、PATH环境变量。 此外,在所有的节点上建立同名的用户以便于后续的安装。下文所使用的shell命令(灰色方框内),以#开头表示在root用户下执行,以$开头表示在hadoop用户下执行。后续的安装过程如下。

Hadoop+Zookeeper+HBase分布式安装部署 PDF版下载

免费下载地址在 http://linux.linuxidc.com/

用户名与密码都是www.linuxidc.com

具体下载目录在 /2012年资料/7月/29日/Hadoop+Zookeeper+HBase分布式安装部署/

相关问答

更多
  • 1、能搭好环境说明水平还不错。 2、下边应该分以下几步走: 一,依据示例程序,自己手写wordcount之类的示例程序,以此充分了解m/r和hdfs的简单原理。 二,针对某些知识点,如hadoop应用场景、hadoop的简单应用等,去百度一下搞定,这样的问题最关键、最需要做的。 三,深入阅读hadoop的源码,把框架的数据流或说工作流搞个大致清楚。 四,试着用hadoop解决一些实际问题和项目应用。 参考下吧。
  • 先回答你标题的提问:hadoop完全分布式:3个及以上的实体机或者虚拟机组件的机群。hadoop伪分布式:一个节点看了以上两点相信你已经明白了,“用vm多装几个unbuntu配置完全分布式,然后做实验”这是完全可行的。实际上我们通常也是这么做的,当然可能要求你的电脑cpu和内存足够支撑你这一计划。一点建议:如果你要开发基于Hadoop的分布式程序,伪分布式足够你实验了。如果你要做很多其他事情,比如玩玩cm,玩玩oozie,玩玩hbase,建议装多个虚拟机。
  • 若在windows的Eclipse工程中直接启动mapreduc程序,需要先把hadoop集群的配置目录下的xml都拷贝到src目录下,让程序自动读取集群的地址后去进行分布式运行(您也可以自己写java代码去设置job的configuration属性)。   若不拷贝,工程中bin目录没有完整的xml配置文件,则windows执行的mapreduce程序全部通过本机的jvm执行,作业名也是带有“local"字眼的作业,如 job_local2062122004_0001。 这不是真正的分布式运行mapred ...
  • 搭建的文本,很久了,现在更新的最新版本搭建更加简单,建议你去看看黑马里边的教程,免费的
  • 1、什么是数据中心分布式部署 数据中心分布式部署,边缘数据中心是基础,是CDN的更下一层,服务对象是IDC及CDN需求的客户。对于流量大的客户,可多点分布,就近部署。 2、分布式部署的好处 A:在全国没有任何一个数据中心可以覆盖全国的每个角落,数据中心集中在一个点不能更好的服务全国各区域。分布式部署相当于在欧洲很多个国家之间的互联网关系。二三线城市就近布点,三级城市网络品质提升。针对网游、网络视频、网络下载等全国分布节点需求较高的客户,选择分布式节点托管在降低成本的同时还更好的保障了二、三级城市业务的网络运 ...
  • 对于分布式操作,一般来说有以下两种实现选择: 1、 在每个节点上使用单独的事务,只实现弱一致性。 2、 使用2PC保证强一致性。即分布式事务协调者先要求所有参与节点PREPARE,大家都说PREPARE成功后,再要求所有节点COMMIT。只要有一个节点PREP...
  • hadoop集群指的是一群机器在一起提供一个hadoop的集群的服务。 hadoop分布式指的是hadoop支持任务分布式运行,因为有hadoop集群提供服务,所以hadoop将任务分发到集群的多台机器运行,所以叫做分布式。 一个是服务器架构,一个是任务运行架构。
  • 我删除了/ etc / hosts中与127.0.0.1相关的所有条目并将hdfs-site.xml复制到所有节点中的$ HBASE_HOME / conf之后,问题得以解决 The problem solved after I removed all entries related to 127.0.0.1 in /etc/hosts and copied the hdfs-site.xml to $HBASE_HOME/conf in all nodes
  • 我发现我使用的是Docker版本1.8.2完全删除Docker然后安装旧版本(1.7.0)然后我的脚本正常运行 I found out that I'm using Docker version 1.8.2 After fully remove Docker then install the older one (1.7.0) then my script run normally
  • 是否在Qorum中配置了zookeepers服务器? 如果是这样,他们设法彼此连接并投票决定谁是领导者(这应该都在两个服务器的日志中)。 Zookeeper可能正在运行,但如果它们无法相互通信(防火墙规则或错过配置),那么zookeeper将不会接受即将到来的客户端连接 Are both the zookeepers servers configured in a Qorum? If so have they managed to connect to one another and vote on who ...