本文共 647 字,大约阅读时间需要 2 分钟。
Hadoop实战手册
本书能帮助开发者更方便地使用Hadoop,从而熟练地解决问题。读者会更加熟悉Hadoop相关的各种工具从而进行最佳的实践。本书指导读者使用各种工具解决各种问题。这些工具包括:Apache Hive、Pig、MapReduce、Mahout、Giraph、HDFS、Accumulo、Redis以及Ganglia。
本书提供了深入的解释以及代码实例。每章的内容包含一组问题集的描述,并对面临的技术挑战提出了解决方案,最后完整地解决了这些问题。每节将单一问题分解成不同的步骤,这样更容易按照步骤执行相关操作。本书覆盖的内容包括:关于HDFS的导入、导出数据,使用Giraph进行图分析,使用Hive、Pig以及MapReduce进行批量数据分析,使用Mahout进行机器学习方法,调试并修改MapReduce作业的错误,使用Apache Accumulo对结构数据进行列存储与检索。
本书的示例中涉及的Hadoop技术同样也可以应用于读者自己所面对的问题。
第1章
1.1 1.2 1.3 1.4 使用Sqoop从MySQL数据库导入数据到HDFS[](1.5 1.6 1.7 1.81.91.10 1.11第2章HDFS第3章 抽取和转换数据第4章使用Hive、Pig和MapReduce处理常见的任务第5章高级连接操作第6章大数据分析第7章高级大数据分析第8章调试第9章系统管理第10章使用Apache Accumulo进行持久化转载地址:http://vixwm.baihongyu.com/