你好,游客 登录
背景:
阅读新闻

504页电子书《Hadoop权威指南》(英文版)

[日期:2010-02-21] 来源:  作者: [字体: ]

       作为处理海量数据集的理想工具,Apache Hadoop架构是MapReduce算法的一种开源应用,是Google(谷歌)开创其帝国的重要基石。本书内容丰富,展示了如何使用Hadoop构建可靠、可伸缩的分布式系统,程序员可从中探索如何分析海量数据集,管理员可以了解如何建立与运行Hadoop集群。
       本书完全通过案例学习来展示如何用Hadoop解决特殊问题,它将帮助您:
       使用Hadoop分布式文件系统(HDFS)来存储海量数据集,通过MapReduce对这些数据集运行分布式计算。
       熟悉Hadoop的数据和I/O构件,用于压缩、数据集成、序列化和持久处理。
       洞悉编写MapReduce实际应用程序时常见陷阱和高级特性。
       设计、构建和管理专用的Hadoop集群或在云上运行Hadoop。
       使用Pig这种高级的查询语言来处理大规模数据。
       利用HBase这个Hadoop数据库来处理结构化和半结构化数据。
       学习Zookeeper,这是一个用于构建分布式系统的协作原语工具箱。
       如果您拥有海量数据,无论是GB级还是PB级,Hadoop都是完美的选择。本书是这方面最全面的参考。


 

 

Table of Contents

1. Meet Hadoop

2. MapReduce

3. The Hadoop Distributed Filesystem

4. Hadoop I/O

5. Developing a MapReduce Application

6. How MapReduce Works

7. MapReduce Types and Formats

8. MapReduce Features

9. Setting Up a Hadoop Cluster

10. Administering Hadoop

11. Pig

12. HBase

13. ZooKeeper

14. Case Studies

请点击以下链接下载:http://bbs.chinacloud.cn/showtopic-277.aspx

推荐 打印 | 录入: | 阅读:
相关新闻      
本文评论   
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款