Hadoop+Spark生态系统操作与实战指南

12/16/2018 9:53:18 PM 0人评论 29次

通过实际操作，快速学习Hadoop+Spark大数据技术。解析Hadoop + Spark常用组件原理和实战操作，让读者快速了解组件原理和应用。结合Hadoop + Spark原生态组件操作，使得读者了解当今互联网应用极为广泛的集群技术。帮助读者构建Hadoop + Spark两大生态系统全局观。

Hadoop+Spark生态系统操作与实战指南

编辑推荐

通过实际操作，快速学习Hadoop+Spark大数据技术。

解析Hadoop + Spark常用组件原理和实战操作，让读者快速了解组件原理和应用。

结合Hadoop + Spark原生态组件操作，使得读者了解当今互联网应用极为广泛的集群技术。

帮助读者构建Hadoop + Spark两大生态系统全局观。

内容简介

　　本书用于Hadoop+Spark快速上手，全面解析Hadoop和Spark生态系统，通过原理解说和实例操作每一个组件，让读者能够轻松跨入大数据分析与开发的大门。

　　全书共12章，大致分为3个部分，第1部分（第1~7章）讲解Hadoop的原生态组件，包括Hadoop、ZooKeeper、HBase、Hive环境搭建与安装，以及介绍MapReduce、HDFS、ZooKeeper、HBase、Hive原理和Apache版本环境下实战操作。第2部分（第8~11章）讲解Spark的原生态组件，包括SparkCore、SparkSQL、SparkStreaming、DataFrame，以及介绍Scala、SparkAPI、SparkSQL、SparkStreaming、DataFrame原理和CDH版本环境下实战操作，其中Flume和Kafka属于Apache*开源项目也放在本篇讲解。第3部分（第12章）讲解两个大数据项目，包络网页日志离线项目和实时项目，在CDH版本环境下通过这两个项目将Hadoop和Spark原生态组件进行整合，一步步带领读者学习和实战操作。

　　本书适合想要快速掌握大数据技术的初学者，也适合作为高等院校和培训机构相关专业师生的教学参考书和实验用书。

作者简介

　　余辉，中国科学院大学硕士研究生毕业，研究方向为云计算和大数据。现供职于某上市公司担任技术经理，并在 Oracle OAEC人才产业集团大数据学院担任大数据讲师。曾在清华大学电子工程系NGNLab研究室担任软件工程师。

附件下载

下载

百度网盘下载

下载：7次所需积分：90
积分获取方法：先给账户进行充值，然后进行积分兑换，积分兑换比例：1元可兑换10个积分.
具体可参考帮助如何获取积分说明

上一篇：R的极客理想：量化投资篇

下一篇：ACM-ICPC程序设计系列：基础训练题解

人气排行

推荐资源

Hadoop+Spark生态系统操作与实战指南

附件下载

百度网盘下载

相关资源

Fortran程序设计（第四版）

人机交互基础教程（第3版）

C++面向对象程序设计（第三版）/“十三五”高校计算机应用技术系列规划教材

算法零基础一本通（Python版全彩印刷）_电子书PDF格式百度云网盘下载