Hadoop权威指南(中文版-带目录索引)PDF

2019-03-28 13:02|来源: 网络

什么是谷歌帝国的基石?MapReduce算法是也!Apache Hadoop架构作为MapReduce算法的一种开源应用,是应对海量数据的理想工具。项目负责人Tom White透过本书详细阐述了如何使用Hadoop构建可靠、可伸缩的分布式系统,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装和运行Hadoop集群。     

本书是您纵情享用数据之美的得力助手。作为处理海量数据集的理想工具,Apache Hadoop架构是MapReduce算法的一种开源应用,是Google(谷歌)开创其帝国的重要基石。本书内容丰富,展示了如何使用Hadoop构建可靠、可伸缩的分布式系统,程序员可从中探索如何分析海量数据集,管理员可以了解如何建立与运行Hadoop集群。

本书完全通过案例学习来展示如何用Hadoop解决特殊问题,它将帮助您:

使用Hadoop分布式文件系统(HDFS)来存储海量数据集,通过MapReduce对这些数据集运行分布式计算..

熟悉Hadoop的数据和I/O构件,用于压缩、数据集成、序列化和持久处理

洞悉编写MapReduce实际应用程序时常见陷阱和高级特性

设计、构建和管理专用的Hadoop集群或在云上运行Hadoop

使用Pig这种高级的查询语言来处理大规模数据

利用HBase这个Hadoop数据库来处理结构化和半结构化数据

学习Zookeeper,这是一个用于构建分布式系统的协作原语工具箱

如果您拥有海量数据,无论是GB级还是PB级,Hadoop都是完美的选择。本书是这方面最全面的参考。

目录:

第1章 初识Hadoop
第2章 MapReduce简介
第3章 Hadoop分布式文件系统
第4章 Hadoop的I/O
第5章 MapReduce应用开发
第6章 MapReduce的工作原理
第7章 MapReduce的类型与格式
第8章 MapReduce特性
第9章 Hadoop集群的安装
第10章 Hadoop的管理
第11章 Pig简介
第12章 Hbase简介
第13章 ZooKeeper简介
第14章 案例研究
附录A Apache Hadoop的安装
附录B Cloudera的Hadoop分发包
附录C 预备NCDC气象资料

Hadoop权威指南(中文版-带目录索引)PDF下载:

**************************************************************

下载在Linux公社的1号FTP服务器里,下载地址:

FTP地址:ftp://ftp1.linuxidc.com

用户名:www.6688.cc

密码:www.linuxidc.com

在 2013年LinuxIDC.com\5月\Hadoop权威指南(中文版-带目录索引)PDF

下载方法见 http://www.linuxidc.net/thread-1187-1-1.html

**************************************************************

或者到百度网盘下载: http://pan.baidu.com/share/link?shareid=587400&uk=487907638

相关阅读:Hadoop权威指南(中文第2版)PDF http://www.linuxidc.com/Linux/2012-07/65972.htm

更多Hadoop相关信息见Hadoop 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=13

相关问答

更多