Ubuntu 13.04上搭建Hadoop环境

2019-03-28 13:00|来源: 网络

首先要了解一下Hadoop的运行模式:

单机模式(standalone)
单机模式是Hadoop的默认模式。当首次解压Hadoop的源码包时,Hadoop无法了解硬件安装环境,便保守地选择了最小配置。在这种默认模式下所有3个XML文件均为空。当配置文件为空时,Hadoop会完全运行在本地。因为不需要与其他节点交互,单机模式就不使用HDFS,也不加载任何Hadoop的守护进程。该模式主要用于开发调试MapReduce程序的应用逻辑。

伪分布模式(Pseudo-Distributed Mode)
伪分布模式在“单节点集群”上运行Hadoop,其中所有的守护进程都运行在同一台机器上。该模式在单机模式之上增加了代码调试功能,允许你检查内存使用情况,HDFS输入输出,以及其他的守护进程交互。
全分布模式(Fully Distributed Mode)

Hadoop守护进程运行在一个集群上。
版本:Ubuntu 13.04,Hadoop 1.2.0

1.添加hadoop用户到系统用户
安装前要做一件事——添加一个名为hadoop到系统用户,专门用来做Hadoop测试。

~$ sudo addgroup hadoop 
~$ sudo adduser --ingroup hadoop hadoop 

现在只是添加了一个用户hadoop,它并不具备管理员权限,因此我们需要将用户hadoop添加到管理员组:

~$ sudo usermod -aG admin hadoop 

2、安装JDK

教程很多,参考http://www.linuxidc.com/Linux/2012-11/74189.htm。这里不多说。我安装的是JDK 1.7 64位版本

3.安装ssh

由于Hadoop用ssh通信,先安装ssh

sudo apt-get install openssh-server 

ssh安装完成以后,先启动服务:

sudo /etc/init.d/ssh start

启动后,可以通过如下命令查看服务是否正确启动:

ps -e | grep ssh

建立ssh无密码登录本机.首先要转换成hadoop用户:

01.su - hadoop

作为一个安全通信协议,使用时需要密码,因此我们要设置成免密码登录,生成私钥和公钥:

hadoop@scgm-ProBook:~$ ssh-keygen -t rsa -P ""

因为我已有私钥,所以会提示是否覆盖当前私钥。第一次操作时会提示输入密码,按Enter直接过,这时会在~/home/{username}/.ssh下生成两个文件:id_rsa和id_rsa.pub,前者为私钥,后者为公钥,现在我们将公钥追加到authorized_keys中(authorized_keys用于保存所有允许以当前用户身份登录到ssh客户端用户的公钥内容):

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

现在可以登入ssh确认以后登录时不用输入密码:

ssh localhost

登出:

exit

第二次登录:

ssh localhost

登出:

exit

这样以后登录就不用输入密码了。 

相关问答

更多
  • 很简单,不要源安装, 下载好JDK, TOMCAT , eclipse这些工具的LINUX版本 以后。解压至你要目录,如我的就放在~/java (好多人都放在/opt下) 解压以后 就相当于安装完成了,这时候只要设置环境变量即可。 sudo gedit /etc/profile 在这个文件的末尾追加: 代码: export JAVA_HOME=/home/mao/java/jdk1.5.0_10/ #注意把新添加的JDK的bin目录追加在$PATH的最前面,这样当系统中安装有多个JDK版本时,程序会优先搜寻 ...
  • 当然是centos,因为有李明老师编写的教程,照葫芦画瓢就行。 “LAMP环境编译(上)”和“LAMP环境编译(下)”两个视频教程,还有“LAMP环境搭建源码包”。 在verycd有下载,输入php搜索,写有LAMP兄弟连的那个就是了。
  • ubuntu下gcc的使用[2022-07-20]

    先编写好一个C语言文件,比如abc.c 然后gcc abc.c 然后就会生成一个a.out文件,执行a.out文件 ./a.out 就可以运行 直接输入gcc,没有参数,当然告诉你no input files了
  • linux天生就是php+mysql+apache的最佳环境,sudonbsp;apt-getnbsp;installnbsp;XXX基本就可以搞定,具体方法:安装前的准备一些程序会检查是否安装PHP4(因为他们需要PHP4去运行),但是其他的程序可能会需要5。您需要去确认安装的apache和php的版本是吻合的。您无法同时在同一个apache中拥有PHP4和PHP5模块,这时就需要您去安装或者删除一个了。nbsp;绝大多数的网络应用程序都是基于apache2,php5和mysql5.0来运行的,如果它的说 ...
  • 叫阿里云帮你配一个lamp环境或者自己配置一个,如果自己不会用linux系统,就可以用wdcp之类的套件。
  • hadoop是使用Java开发的一个大数据平台,自然少不了Java运行环境的安装了,当然使用hadoop不一定需要java语言,hadoop的开发支持很多种语言。
  • 幸运的是,我在这些网站上找到了解决方案。 两个站点的说明是成功安装所必需的。 在Ubuntu 10.10中安装ARToolKit 2.72.1 在Ubuntu 11.10和12.04中安装ARToolKit 2.72.1 I found the solution on these sites by luck. Instructions from both sites were necessary for successful installation. Install ARToolKit 2.72.1 in ...
  • 错误消息明确指出不同的东西:“libncurses.so not found”。 所以你可能错过了安装所需的32位的东西: sudo apt-get install ia32-libs The error message clearly states something different: "libncurses.so not found". So you probably missed to install the needed 32-bit stuff: sudo apt-get install ia ...
  • 因此,出于某种原因删除旧的NDK并拆开新的NDK解决了这个问题。 相同的版本和一切。 某些文件必定已损坏。 So for one reason or another deleting the old NDK and unpacking a new one solved the problem. Same version and everything. Some files must have been corrupt.
  • 对于Ubuntu,获取包括g++在内的所有构建工具的最简单方法是 sudo apt-get install build-essential 我建议您查看AskUbuntu以获取更多信息。 For Ubuntu, the easiest way to get all the build tools including g++ is to sudo apt-get install build-essential I suggest you check AskUbuntu for more info.