首页 \ 教程 \ hadoop

知识点

hadoop

[HBase] 完全分布式安装过程详解

[Hive] 完全分布式安装过程（MetaStore: MySQL）

Hadoop实战之Hadoop完全分布式集群安装

[Hadoop] Sqoop安装过程详解

Hadoop伪分布式与集群式安装配置

Hadoop 伪分布式安装

Ubuntu 下 Hadoop1.0.4 安装过程 (单机伪分布模式)

Hadoop伪分布式安装

Hadoop分布式集群搭建

Hadoop分布式安装

通过单机的Hadoop伪分布式运行理解Hadoop运行过程

单节点Hadoop安装过程

我看分布式--hadoop的了解

Hadoop CDH4伪分布式安装

Hadoop伪分布式集群环境配置

[Hadoop] 完全分布式集群安装过程详解

2019-03-28 13:04|来源: 网络

1. 用VMware Workstation创建4个虚拟机，每个虚拟机都装上CentOS（版本：CentOS-6.3-x86_64），示意图如下：

2. 在所有结点上修改/etc/hosts，使彼此之间都能够用机器名解析IP

192.168.231.131 node01

192.168.231.132 node02

192.168.231.133 node03

192.168.231.134 node04

3. 在所有结点上安装JDK

首先，把jdk安装包（jdk-6u38-linux-x64.bin）放到/usr/java

增加可执行权限：

[root@localhost java]# chmod a+xjdk-6u38-linux-x64.bin

[root@localhost java]# ls -lrt

total 70376

-rwxr-xr-x. 1 root root 72058033 Jan 2907:21 jdk-6u38-linux-x64.bin

下面开始安装JDK：

[root@localhost java]# ./jdk-6u38-linux-x64.bin

更改/etc/profile，添加以下几行：

JAVA_HOME=/usr/java/jdk1.6.0_38

JRE_HOME=/usr/java/jdk1.6.0_38/jre/

CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/lib/tools.jar

PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH

测试是否安装成功：

[root@localhost java]# source /etc/profile

[root@localhost java]# java -version

java version "1.6.0_38"

Java(TM) SE Runtime Environment (build1.6.0_38-b05)

Java HotSpot(TM) 64-Bit Server VM (build20.13-b02, mixed mode)

4. 添加Hadoop用户

[root@node02 ~]# useradd hadoop -g root

[root@node02 ~]# passwd hadoop

Changing password for user hadoop.

New password:

BAD PASSWORD: it is too short

BAD PASSWORD: is too simple

Retype new password:

passwd: all authentication tokens updatedsuccessfully.

5. ssh 配置

注意：下面开始以hadoop用户操作

[hadoop@node01 ~]$ ssh-keygen -t rsa

Generating public/private rsa key pair.

Enter file in which to save the key(/home/hadoop/.ssh/id_rsa):

Created directory '/home/hadoop/.ssh'.

Enter passphrase (empty for no passphrase):

Enter same passphrase again:

Your identification has been saved in /home/hadoop/.ssh/id_rsa.

Your public key has been saved in/home/hadoop/.ssh/id_rsa.pub.

The key fingerprint is:

1d:03:8c:2f:99:95:98:c1:3d:8b:21:61:3e:a9:cb:bfhadoop@node01

The key's randomart image is:

+--[ RSA 2048]----+

| oo.B.. |

| o..* *. |

| +. B oo |

| ..= o. o |

| . .S . |

| . . |

| o |

| . |

| E. |

+-----------------+

[hadoop@node01 ~]$ cd .ssh

[hadoop@node01 .ssh]$ cp id_rsa.pubauthorized_keys

把所有结点的authorized_keys的内容都互相拷贝，这样就可以免密码ssh连入。

相关问答

怎样在hadoop伪分布式集群上安装mysql[2022-03-17]

先回答你标题的提问：hadoop完全分布式：3个及以上的实体机或者虚拟机组件的机群。hadoop伪分布式：一个节点看了以上两点相信你已经明白了，“用vm多装几个unbuntu配置完全分布式，然后做实验”这是完全可行的。实际上我们通常也是这么做的，当然可能要求你的电脑cpu和内存足够支撑你这一计划。一点建议：如果你要开发基于Hadoop的分布式程序，伪分布式足够你实验了。如果你要做很多其他事情，比如玩玩cm，玩玩oozie，玩玩hbase，建议装多个虚拟机。
hadoop搭建完全分布式完成，可是不会用[2023-08-27]

1、能搭好环境说明水平还不错。 2、下边应该分以下几步走：一，依据示例程序，自己手写wordcount之类的示例程序，以此充分了解m/r和hdfs的简单原理。二，针对某些知识点，如hadoop应用场景、hadoop的简单应用等，去百度一下搞定，这样的问题最关键、最需要做的。三，深入阅读hadoop的源码，把框架的数据流或说工作流搞个大致清楚。四，试着用hadoop解决一些实际问题和项目应用。参考下吧。
在Hadoop安装过程中，要格式化分布式系统，遇到下图问题，请问是哪里不对？[2022-06-16]

这个就是你的java环境变量不对，所以没识别java，通过在.bashrc文件设置环境变量，在hadoop的hadoop-env.sh设置也行....祝你好运
学习hadoop到底是部署伪分布式还是安装集群[2023-03-30]

先回答你标题的提问：hadoop完全分布式：3个及以上的实体机或者虚拟机组件的机群。hadoop伪分布式：一个节点看了以上两点相信你已经明白了，“用vm多装几个unbuntu配置完全分布式，然后做实验”这是完全可行的。实际上我们通常也是这么做的，当然可能要求你的电脑cpu和内存足够支撑你这一计划。一点建议：如果你要开发基于Hadoop的分布式程序，伪分布式足够你实验了。如果你要做很多其他事情，比如玩玩cm，玩玩oozie，玩玩hbase，建议装多个虚拟机。
关于分布式Hadoop在WINDOWS上操作问题[2023-09-09]

若在windows的Eclipse工程中直接启动mapreduc程序，需要先把hadoop集群的配置目录下的xml都拷贝到src目录下，让程序自动读取集群的地址后去进行分布式运行(您也可以自己写java代码去设置job的configuration属性)。　　若不拷贝，工程中bin目录没有完整的xml配置文件，则windows执行的mapreduce程序全部通过本机的jvm执行，作业名也是带有“local"字眼的作业，如 job_local2062122004_0001。这不是真正的分布式运行mapred ...
hadoop搭建完全分布式完成，可是不会用[2022-04-01]

搭建的文本，很久了，现在更新的最新版本搭建更加简单，建议你去看看黑马里边的教程，免费的
Hadoop与Spark的关系，Spark集群必须依赖Hadoop吗？[2022-05-30]

必须在hadoop集群上，它的数据来源是HDFS，本质上是yarn上的一个计算框架，像MR一样。
hadoop配置了集群，但启动仍然是伪分布式下的启动状态[2022-08-22]

你可以输入JPS查看一下进程一般你的master上是namenode secondarynamenode 和jobtracker三个进程你的slaves上有各自的datanode 和tasktracker两个进程你看看是不是有各自进程都启动起来了启动起来了就是分布式如果只有一台机子有进程那你就重新把那些配置文件再设置一下
hadoop 集群和 hadoop 分布式怎么理解啊[2022-02-07]

hadoop集群指的是一群机器在一起提供一个hadoop的集群的服务。 hadoop分布式指的是hadoop支持任务分布式运行，因为有hadoop集群提供服务，所以hadoop将任务分发到集群的多台机器运行，所以叫做分布式。一个是服务器架构，一个是任务运行架构。
分布式集群Hadoop和Hbase(Distributed Cluster Hadoop and Hbase)[2022-11-27]

我删除了/ etc / hosts中与127.0.0.1相关的所有条目并将hdfs-site.xml复制到所有节点中的$ HBASE_HOME / conf之后，问题得以解决 The problem solved after I removed all entries related to 127.0.0.1 in /etc/hosts and copied the hdfs-site.xml to $HBASE_HOME/conf in all nodes

知识点

相关文章

最近更新

[Hadoop] 完全分布式集群安装过程详解

相关问答

怎样在hadoop伪分布式集群上安装mysql[2022-03-17]

hadoop搭建完全分布式完成，可是不会用[2023-08-27]

在Hadoop安装过程中，要格式化分布式系统，遇到下图问题，请问是哪里不对？[2022-06-16]

学习hadoop到底是部署伪分布式还是安装集群[2023-03-30]

关于分布式Hadoop在WINDOWS上操作问题[2023-09-09]

hadoop搭建完全分布式完成，可是不会用[2022-04-01]

Hadoop与Spark的关系，Spark集群必须依赖Hadoop吗？[2022-05-30]

hadoop配置了集群，但启动仍然是伪分布式下的启动状态[2022-08-22]

hadoop 集群和 hadoop 分布式怎么理解啊[2022-02-07]

分布式集群Hadoop和Hbase(Distributed Cluster Hadoop and Hbase)[2022-11-27]

知识点

相关文章

最近更新

[Hadoop] 完全分布式集群安装过程详解

相关问答

怎样在hadoop伪分布式集群上安装mysql[2022-03-17]

hadoop搭建完全分布式完成，可是不会用[2023-08-27]

在Hadoop安装过程中，要格式化分布式系统，遇到下图问题，请问是哪里不对？[2022-06-16]

学习hadoop到底是部署伪分布式还是安装集群[2023-03-30]

关于分布式Hadoop在WINDOWS上操作问题[2023-09-09]

hadoop搭建完全分布式完成，可是不会用[2022-04-01]

Hadoop与Spark的关系，Spark集群必须依赖Hadoop吗？[2022-05-30]

hadoop配置了集群，但启动仍然是伪分布式下的启动状态[2022-08-22]

hadoop 集群 和 hadoop 分布式 怎么理解啊[2022-02-07]

分布式集群Hadoop和Hbase(Distributed Cluster Hadoop and Hbase)[2022-11-27]

hadoop 集群和 hadoop 分布式怎么理解啊[2022-02-07]