首页 \ 教程 \ hadoop

知识点

hadoop

相关文章

更多

Hadoop实战之分布式模式

Hadoop完全分布式模式配置

Hadoop实战之Hadoop完全分布式集群安装

CentOS 5.6下安装Hadoop完全分布式模式

Hadoop2安装——伪分布式模式

【Hadoop实战】在Mac OS上配置Hadoop伪分布式环境

我看分布式--hadoop的了解

Hadoop伪分布式模式测试(hadoop-0.20.2)

Hadoop笔记之安装及伪分布式模式配置

Hadoop全分布式集群模式的搭建实验

CentOS 5下安装Hadoop-伪分布式模式

Hadoop伪分布式和完全分布式配置

实战： SOLR的分布式部署（复制模式 CollectionDistribute）部署流程详解（二）

实战： SOLR的分布式部署（复制模式 CollectionDistribute）部署流程详解（二）

Hadoop 伪分布式安装

最近更新

更多

java线程状态详解(6种)

redis从库只读设置-redis集群管理

Netty环境配置

Netty基于流的传输处理

Netty入门实例-使用POJO代替ByteBuf

Netty入门实例-时间服务器

Netty入门实例-编写服务器端程序

Netty开发环境配置

电商平台数据库设计

HttpClient 上传文件

MongoDB常用命令

快速了解MongoDB【基本概念与体系结构】

windows系统安装MongoDB

Spring boot整合MyBatis-Plus 之二：增删改查

分布式ID生成器【snowflake雪花算法】

Hadoop实战之伪分布式模式

2019-03-28 14:05|来源: 网络

Hadoop可以在单节点上以所谓的伪分布式模式运行，此时每一个Hadoop守护进程都作为一个独立的Java进程运行，这种运行方式的配置和操作如下：

关于hadoop的安装和测试可以参考hadoop学习之安装与单机模式见 http://www.linuxidc.com/Linux/2012-01/52765.htm

这里仍假定${HADOOP_HOME}为位置是/data/fkong/hadoop-0.20.203.0

1. 修改hadoop配置

1.1 编辑${HADOOP_HOME}/conf/core-site.xml文件，内容修改如下：

[plain] view plaincopyprint?

<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>

1.2 编辑${HADOOP_HOME}/conf/hdfs-site.xml文件，内如修改如下：

[plain] view plaincopyprint?

<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>

1.3 编辑${HADOOP_HOME}/conf/mapred-site.xml文件，内如修改如下：

[plain] view plaincopyprint?

<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>

2. 设置linux上ssh是用户可以自动登录

[plain] view plaincopyprint?

$ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

3. 格式化一个新的分布式文件系统:

[plain] view plaincopyprint?

$ bin/hadoop namenode -format

4. 执行hadoop

4.1 启动hadoop后台daemon

[plain] view plaincopyprint?

$ bin/start-all.sh

启动后可以通过以下w网页方式查看NameNode和JobTracker状态

[plain] view plaincopyprint?

NameNode - http://localhost:50070/
JobTracker - http://localhost:50030/

4.2 复制文件到分布式文件系统上

[plain] view plaincopyprint?

$ bin/hadoop fs -put conf input

4.3 运行测试

[plain] view plaincopyprint?

$ bin/hadoop jar hadoop-examples-*.jar grep input output 'dfs[a-z.]+'

4.4 获取测试程序的执行结果

[plain] view plaincopyprint?

$ bin/hadoop fs -cat output/*

4.5 停止hadoop后台daemon

[plain] view plaincopyprint?

$ bin/stop-all.sh

相关问答

更多

如何配置hadoop伪分布式配置[2023-08-24]

0.关闭防火墙 service iptables start;#立即开启防火墙，但是重启后失效。 service iptables stop;#立即关闭防火墙，但是重启后失效。重启后生效 chkconfig iptables on;#开启防火墙，重启后生效 chkconfig iptables off;#关闭防火墙，重启后生效 1.配置主机名 !!!!!注意安装hadoop的集群主机名不能有下划线!!不然会找不到主机!无法启动! 配置主机名 $vi /etc/sysconfig/network $sour ...
hadoop伪分布式搭建用什么linuix[2024-02-21]

第一步：安装JDK 因为 Hadoop 运行必须安装 JDK 环境，因此在安装好 Linux 后进入系统的第一步便是安装 JDK ，安装过程和在 Windows 环境中的安装步骤很类似，首先去Oracle 官网去下载安装包，然后直接进行解压。我自己解压在路径 /usr/jvm 下面，假如你的安装包现在已经下载在 jvm 文件夹下面，然后按 Ctrl+Alt+t 进去命令行，然后输入 cd /usr/jvm 进入到jvm文件夹下面，然后再输入如下命令进行解压： sudo tar -zxvf jdk-7 ...
hadoop伪分布式需要配置yarn么[2022-01-21]

Hadoop 有两个主要版本，Hadoop 1.x.y 和 Hadoop 2.x.y 系列，比较老的教材上用的可能是 0.20 这样的版本。Hadoop 2.x 版本在不断更新，本教程均可适用如果需安装 0.20，1.2.1这样的版本，本教程也可以作为参考，主要差别在于配置项，配置请参考官网教程或其他教程。
hadoop单机模式和伪分布式模式的异同[2022-03-27]

可以，hadoop安装分为单机模式，伪分布式模式，完全分布式模式。你装成单机模式或者伪分布式模式就可以了。单机模式：Hadoop会完全运行在本地。因为不需要与其他节点交互，单机模式就不使用HDFS，也不加载任何Hadoop的守护进程
什么是伪分布式？（hadoop中遇到的）[2022-04-23]

hadoop分为单机模式，伪分布式，和完全分布式。你说的伪分布式是指：一个机器上，即当namenode，又当datanode,或者说即是jobtracker,又是tasktracker。没有所谓的在多台机器上进行真正的分布式计算，故称为"伪分布式"。
hadoop2.7.3配置伪分布式，开始namenode和datanode守护进程时，结点配置问题[2022-12-05]

在 /usr/local/hadoop/ 下面启动，找到是/opt/Hadoop/下面的hadoop安装包，是不是HADOOP_HOME环境变量配置的有问题。可以到海牛部落交流，那里有好多学习hadoop的朋友
hadoop 集群和 hadoop 分布式怎么理解啊[2022-02-07]

hadoop集群指的是一群机器在一起提供一个hadoop的集群的服务。 hadoop分布式指的是hadoop支持任务分布式运行，因为有hadoop集群提供服务，所以hadoop将任务分发到集群的多台机器运行，所以叫做分布式。一个是服务器架构，一个是任务运行架构。
Eclipse远程调试在伪分布式模式下不适用于hadoop(Eclipse remote debugging doesn't work with hadoop in pseudo-distributed mode)[2022-04-05]

请参阅上面的Lorand的评论。远程调试仅适用于独立模式。 See Lorand's comment above. Remote debugging will only work in standalone mode.
如何检查我的hadoop是否以伪分布式模式运行？(How to check if my hadoop is running in pseudo distributed mode?)[2023-03-05]

要知道您是以独立还是伪分布模式运行hadoop，请验证您的配置文件。以下信息可能有帮助。 To know if you are running hadoop in Standalone or Pseudo distributed mode, verify your configuration files. Below information might help.
Hadoop伪分布式模式 - Datanode和tasktracker无法启动(Hadoop pseudo distributed mode - Datanode and tasktracker not starting)[2022-05-02]

修改/etc/hosts以包含主机名环回映射： 127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4 127.0.1.1 is-joshbloom-hadoop ::1 localhost localhost.localdomain localhost6 localhost6.localdomain6 您的问题是您的机器不知道如何解析主机名is-joshbloom-hadoop到特定 ...