首页 \ 教程 \ hadoop

知识点

hadoop

Hadoop集群内lzo的安装与配置

Hadoop集群lzo的安装

Hadoop集群配置详解

Hadoop集群上使用Lzo压缩

Hadoop LZO 安装教程

Hadoop集群lzo文件的并行map处理

FreeBSD下安装配置Hadoop集群(一)

Hadoop集群（第5期）_Hadoop安装配置

Hadoop集群安装配置系列（目录）

使用Hadoop的lzo问题

FreeBSD下安装配置Hadoop集群(二)

Hadoop集群（第3期）_VSFTP安装配置

Hadoop集群（第1期）_CentOS安装配置

Hadoop配置文件详解、安装及相关操作

Hadoop lzo 正确安装及问题解决

Hadoop集群内lzo的安装与配置详解

2019-03-28 14:22|来源: 网络

操作系统：CentOS 5.5，Hadoop版本：hadoop-0.20.2-CDH3B4

安装lzo所需要软件包：gcc、ant、lzo、lzo编码/解码器，另外，还需要lzo-devel依赖

配置lzo的文件：core-site.xml、mapred-site.xml

大致步骤：

1）安装和更新gcc、ant

2）在各个节点安装lzo
3）安装lzo编码/解码器
4）修改配置文件，并同步各节点的配置文件
注：没有特别指出的话，所有操作都是在Namenode中进行的

一、lzo库安装：

1、gcc的安装：yum即可，记得同时更新lib*、glibc*、gcc*

2、ant的安装：
删除旧版本：yum remove ant
安装新版本：

wget http://labs.renren.com/apache-mirror//ant/binaries/apache-ant-1.8.2-bin.tar.gz

tar zxvf apache-ant-1.8.2-bin.tar.gz

# vi /etc/profile

export ANT_HOME=/usr/local/apache-ant-1.8.2

export PATH=$PATH:$ANT_HOME/bin

source /etc/profile 使配置文件生效

lzo的安装

wget http://www.oberhumer.com/opensource/lzo/download/lzo-2.04.tar.gz

tar -zxvf lzo-2.04.tar.gz

cd lzo-2.04

./configure --enable-shared

make && make install

库文件被默认安装到了/usr/local/lib，我们需要进一步指定lzo库文件的路径，两个方法都可以：
1)拷贝/usr/local/lib目录下的lzo库文件到/usr/lib（32位平台），或/usr/lib64（64位平台）
2)在/etc/ld.so.conf.d/目录下新建lzo.conf文件，写入lzo库文件的路径，然后运行/sbin/ldconfig -v，使配置生效

在各个节点安装lzo：
Namenode和Datanode都要安装lzo！
所需软件包：gcc、ant、lzo-2.04.tar.gz、lzo2-2.02-3.el5.rf.x86_64.rpm、lzo2-devel-2.02-3.el5.rf.x86_64.rpm。

wget http://mirrors.axint.net/repos/RedHat/el5/en/x86_64/RPMS.dag/lzo2-2.02-3.el5.rf.x86_64.rpm

wget http://mirrors.axint.net/repos/redhat/el5/en/x86_64/RPMS.dag/lzo2-devel-2.02-3.el5.rf.x86_64.rpm

安装lzo2-2.02-3.el5.rf.x86_64.rpm、lzo2-devel-2.02-3.el5.rf.x86_64.rpm。

# rpm -ivh lzo2-2.02-3.el5.rf.x86_64.rpm

# rpm -ivh lzo2-devel-2.02-3.el5.rf.x86_64.rpm

lzo编码/解码器的安装

这里必须要说明：如果hadoop是cloudera版的，那么lzo编码/解码器就不要用google官方的那个！到这里下载：

https://github.com/kevinweil/hadoop-lzo

下载文件kevinweil-hadoop-lzo-23e8370.tar.gz

# tar zxvf kevinweil-hadoop-lzo-23e8370.tar.gz

# cd kevinweil-hadoop-lzo-23e8370

#export CFLAGS=-m64

#ant compile-native tar

编译成功后，还需要把编码/解码器以及native库拷贝到$HADOOP_HOME/lib目录下

# cp build/hadoop-lzo-0.4.13.jar /usr/local/hadoop/lib/

#tar -cBf - -C build/native . | tar -xBvf - -C /usr/local/hadoop/lib/native

# cd /usr/local/hadoop/lib/

# chown -R hadoop:hadoop native/

同步各节点的hadoop-lzo-0.4.10.jar和hadoop的native目录

配置lzo：

1、主要是往hadoop目录下conf目录中的core-site.xml和mapred-site.xml文件添加一些属性：

vi core-site.xml 添加配置

<property>
<name>io.compression.codecs</name>
<value>org.apache.hadoop.io.compress.GzipCodec,org.apache.hadoop.io.compress.DefaultCodec,com.hadoop.compression.lzo.LzoCodec,com.hadoop.compression.lzo.LzopCodec,org.apache.hadoop.io.compress.BZip2Codec</value>
</property>
<property>
<name>io.compression.codec.lzo.class</name>
<value>com.hadoop.compression.lzo.LzoCodec</value>
</property>

vi mapred-site.xml：

<property>
<name>mapreduce.map.output.compress</name>
<value>true</value>
</property>
<property>
<name>mapred.child.env</name>
<value>JAVA_LIBRARY_PATH=/usr/local/hadoop/lib/native/Linux-amd64-64</value>
</property>
<property>
<name>mapreduce.map.output.compress.codec</name>
<value>com.hadoop.compression.lzo.LzoCodec</value>
</property>

同步各节点的配置文件！

hadoop集群内测试lzo：

首先，安装lzop，生成一些lzo文件

wget http://www.lzop.org/download/lzop-1.03.tar.gz

tar -zxvf lzop-1.03

cd lzop-1.03

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/lib

./configure

make && make install

压缩日志文件lzop -U -9 nginx.log

利用hive导入到hdfs中hive> load data local inpath '/home/log/nginx.log.lzo' overwrite into table nginxlog;

测试hive语句 hive>select count(1) from nginxlog;

如果出现错误Failed with exception java.io.IOException:java.lang.RuntimeException: native-lzo library not available

删除$HADOOP_HOME/lib目录下的hadoop-gpl-compression-0.1.0.jar

cd kevinweil-hadoop-lzo-23e8370/build/native/Linux-amd64-64/lib

cp * $HADOOP_HOME/lib/native/Linux-amd64-64

重启hadoop

测试hive语句即可成功执行

知识点

相关文章

最近更新

Hadoop集群内lzo的安装与配置详解

相关问答

在docker中搭建hadoop集群有什么好方法配置ip[2024-01-02]

Hadoop集群中namenode节点需要安装zookeeper吗[2022-05-23]

求教搭建hadoop集群，在配置ssh时遇到的一个问题，非常感谢！[2022-04-22]

配置hadoop集群是怎么配置的[2023-12-15]

在安装hadoop全集群中，需要安装openssh，主节点需要能够ssh到localhost和其他的从节点上，[2024-02-25]

hadoop 集群安装完成，怎么使用[2023-08-02]

hadoop配置了集群，但启动仍然是伪分布式下的启动状态[2022-08-22]

配置hadoop集群用哪个版本linux最好[2024-04-14]

安装和配置多节点Hadoop集群(Installing and configuring a multi-node Hadoop cluster)[2023-05-08]

配置Hadoop集群时应该设置多少个映射器/缩减器？(How many mappers/reducers should be set when configuring Hadoop cluster?)[2022-06-25]