首页 \ 教程 \ hadoop

知识点

hadoop

Ubuntu上搭建Hadoop环境（单机模式+伪分布模式）

Hadoop单机环境搭建笔记（Ubuntu）

Ubuntu 12.04搭建Hadoop单机版环境

单机版搭建Hadoop环境图文教程详解

Hadoop单机模式测试

在Ubuntu部署Hadoop之单机模式

Hadoop2安装——单机模式

基于linux的hadoop环境搭建

Linux下单机模式的Hadoop部署

在Ubuntu上安装Hadoop（单机模式）

Hadoop的Hbase环境搭建

Hadoop实战之安装与单机模式

Hadoop HDFS 单机开发环境建立

搭建Hadoop集群环境

Ubuntu 13.04上搭建Hadoop环境

Hadoop单机模式环境搭建关键步骤

2019-03-28 13:30|来源: 网络

Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下：

sudo apt-get install ssh

sudo apt-get install rsync

编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java安装路径。

Hadoop的集群分为三种模式：

单机模式
伪分布式模式
完全分布式模式
不管哪种模型，都需要系统能够免密码ssh设置：
$ssh localhost
看看是否需要登录本机需要密码，如果需要使用如下操作：
$ssh -keygen -t dsp -P '' -f ~/.ssh/id_dsa
$cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

执行：
格式化一个新的分布式文件系统
$bin/hadoop namenode -format
启动Hadoop守护进程：
$bin/start-all.sh

浏览NameNode和JobTracker的网络接口，默认地址分别为：
NameNode http://localhost:50070
JobTracker http://localhost:50030
将输入文件copy到分布式文件系统：
$bin/hadoop fs -put conf input
运行示例程序；
$bin/hadoop jar hadoop-*-examples.jar grep input output 'dfs[a-z.]+'
查看输出文件：
$bin/hadoop fs -get output output
$cat output/*
或者在分布式文件系统上查看输出文件：
$bin/hadoop fs -cat output/*

停止Hadoop守护进程：
$bin/stop-all.sh

完全分布式集群：
通常选择集群中的一台机器作为NameNode，另外一台不同的机器作为JobTracker，这些被称为Master，余下的机器即作为DataNode，又作为TaskTracker，这些被称为Slaves。
在conf/slaves文件中列出所有slaves的主机名称或者Ip地址，一行一个。

更具体的完全分布式环境搭建可以见经验总结文章： Hadoop环境搭建（http://www.linuxidc.com/Linux/2012-03/56692.htm）和 Hadoop搭建和Eclipse开发环境设置（http://www.linuxidc.com/Linux/2012-01/52914.htm）

知识点

相关文章

最近更新

Hadoop单机模式环境搭建关键步骤

相关问答

在线等！！关于hadoop环境搭建问题[2023-10-24]

hadoop搭建单机环境要在什么系统[2023-12-14]

怎么在windows上搭建hadoop环境[2022-06-20]

配置单机hadoop 环境[2024-02-24]

怎样在本地搭建hadoop测试环境[2024-01-29]

搭建hadoop环境时的网络设置问题[2022-05-05]

hadoop单机模式可以安装hive吗?[2022-07-09]

hadoop client 环境怎么搭建[2022-11-10]

搭建hadoop环境用linux哪个好[2022-03-18]

QT编译环境搭建步骤[2023-07-21]