首页 \ 教程 \ hadoop

知识点

hadoop

用 Ganglia 监控Hadoop集群

使用Ganglia监控Hadoop

CentOS5.2下使用Ganglia对Hadoop进行监控

Hadoop和HBase集群的JMX监控

Ganglia监控Solr

关于Hadoop集成Ganglia相关问题

Hadoop笔记：Ganglia结构和安装

使用EHM图形化安装、配置、监控Hadoop集群

storm集群的监控

在VMware Workstation的Ubuntu下安装和配置Hadoop与Ganglia

Hadoop系统监控脚本

用Python编写Nagios Hadoop监控脚本

Hadoop Web项目使用Ajax监控Mapreduce过程

Hadoop集群搭建(Hadoop)

基于Hadoop集群的HBase集群的配置

使用Ganglia监控Hadoop集群

2019-03-28 13:43|来源: 网络

0 环境

1 安装Ganglia

1.1 添加EPEL软件仓库
1.2 Ganglia服务器端安装
1.3 Ganglia客户端安装

2 配置Ganglia

2.1 监控端配置
2.2 服务器端
2.3服务器端Apache配置

3 配置Hadoop metrics

0 环境

操作系统：CentOS 6.2

hadoop版本：hadoop-1.0.1

集群中三台机器：

192.168.137.101 namenode

192.168.137.103 datanode1

192.168.137.104 datanode2

1 安装Ganglia

1.1 添加EPEL软件仓库

CentOS官方软件仓库中没有Ganglia，而Ganglia依赖又太多，本人花了一天时间才把它的一个依赖项rrdtool安装好。后来放弃源码安装，改用yum。添加仓库的方法参考：http://www.linuxidc.com/Linux/2012-05/61350.htm 。需要注意的是，EPEL安装包的地址已经发生了变化，链接中的下载地址已经不适用，可以google一下最新的地址。还要注意匹配操作系统的版本。

1.2 Ganglia服务器端安装

Ganglia服务器端收集监控端信息，并提供访问接口，使用以下命令安装：

yum install ganglia ganglia-devel ganglia-gmetad ganglia-gmond ganglia-web ganglia-gmond-python

1.3 Ganglia客户端安装

$ yum install ganglia ganglia-gmond

2 配置Ganglia

2.1 监控端配置

$ vim /etc/ganglia/gmond.conf

将cluster选项中 name设置为gmetad中data_source指定的名称即可。

$ service gmond start

2.2 服务器端

$ sudo vim /etc/ganglia/gmetad.conf

data_source "hdfs" datanode1 datanode2

只需要更改 data_source一行，"hdfs"代表集群的名字，datanode1,datanode2，就是要监控的机器列表。默认端口8649。

启动服务

service gmetad start
chkconfig gmetad on

2.3服务器端Apache配置

vim /etc/httpd/conf.d/ganglia.conf

Alias /ganglia /usr/share/ganglia

<Location /ganglia>
Order deny,allow
# Deny from all
# Allow from 127.0.0.1
# Allow from ::1
Allow from all
# Allow from .example.com
</Location>

测试用的话可以做如上配置。

打开浏览器： http://serverip/ganglia。

如果出现错误： There was an error collecting ganglia data (127.0.0.1:8652): fsockopen error: Permission denied

则需要关闭selinux：vi /etc/selinux/config，把SELINUX=enforcing改成SELINUX=disable；该方法需要重启机器。

可以使用命令setenforce 0来关闭selinux而不需要重启，刷新页面，即可访问！但此方法只是一权宜之计。要想永久修改selinux设置，还是要使用第一种方法。

3 配置Hadoop metrics

hadoop-1.0.1的配置文件为： hadoop-1.0.1/conf/hadoop-metrics2.properties。我安装的Ganglia为版本为3.1，找到配置文件中for Ganglia 3.1 support。将需要监控的项目前面注释去掉，*.servers的配置为 239.2.11.71：8649,这个地址是Ganglia的广播地址，是固定的。

# for Ganglia 3.1 support
*.sink.ganglia.class=org.apache.hadoop.metrics2.sink.ganglia.GangliaSink31

*.sink.ganglia.period=10

# default for supportsparse is false
*.sink.ganglia.supportsparse=true

*.sink.ganglia.slope=jvm.metrics.gcCount=zero,jvm.metrics.memHeapUsedM=both
*.sink.ganglia.dmax=jvm.metrics.threadsBlocked=70,jvm.metrics.memHeapUsedM=40

namenode.sink.ganglia.servers=239.2.11.71:8649

datanode.sink.ganglia.servers=239.2.11.71:8649

jobtracker.sink.ganglia.servers=239.2.11.71:8649

tasktracker.sink.ganglia.servers=239.2.11.71:8649

maptask.sink.ganglia.servers=239.2.11.71:8649

reducetask.sink.ganglia.servers=239.2.11.71:8649

重启集群即可。

更多Hadoop相关信息见Hadoop 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=13

知识点

相关文章

最近更新

使用Ganglia监控Hadoop集群

0 环境

1 安装Ganglia

1.1 添加EPEL软件仓库

1.2 Ganglia服务器端安装

1.3 Ganglia客户端安装

2 配置Ganglia

2.1 监控端配置

2.2 服务器端

2.3服务器端Apache配置

3 配置Hadoop metrics

相关问答

Hadoop与Spark的关系，Spark集群必须依赖Hadoop吗？[2022-05-30]

如何在虚拟机中搭建linux集群[2021-12-24]

如何通过脚本监控hadoop集群的状态[2022-06-23]

有人知道监控HADOOP集群的方法吗？求指导[2022-12-27]

在ubuntu上安装ganglia(installing ganglia on ubuntu)[2023-06-03]

Ganglia无法与Apache HBase通信(Ganglia fails to communicate with Apache HBase)[2022-01-29]

Ganglia监控Hadoop多节点集群(Monitering Hadoop multi node cluster by Ganglia)[2023-06-29]

如何获得原始的hadoop指标(How to get raw hadoop metrics)[2022-01-24]

神经节：我停止hadoop datanode后神经节remians图不变(ganglia: the graph in ganglia remians unchanged after I stop hadoop datanode)[2021-04-16]

ganglia生成了太多的rrd文件并且无法自动删除(ganglia generated too much rrd files & cannot automatic deleted)[2022-07-25]