当前位置: 首页 > 资源下载  > 电子书 > 计算机

Hadoop数据分析

12/16/2018 9:53:18 PM 人评论

通过提供分布式数据存储和并行计算框架,Hadoop已经从集群计算的抽象演变成了大数据操作系统。本书从数据科学的视角,介绍Hadoop集群计算和分析,重点关注可构建的具体分析、数据仓储技术和高阶数据流。书中主要内容如下:.Hadoop和集群计算背后的核心概念.使用设计模式和

Hadoop数据分析

Hadoop数据分析

编辑推荐

通过提供分布式数据存储和并行计算框架,Hadoop已经从集群计算的抽象演变成了大数据操作系统。本书从数据科学的视角,介绍Hadoop集群计算和分析,重点关注可构建的具体分析、数据仓储技术和高阶数据流。
书中主要内容如下:
.Hadoop和集群计算背后的核心概念
.使用设计模式和并行分析算法创建分布式数据分析作业
.在分布式环境下使用Apache Hive和HBase进行数据管理、数据挖掘和数据仓储
.使用Sqoop和Apache Flume从关系数据库采集数据
.使用Apache Pig和Spark DataFrame编写复杂的Hadoop和Spark应用程序
.通过Spark MLlib运用分类、聚类和协同过滤等机器学习技术

“我还未见过比本书更好的Hadoop框架讲解。”
——Marck Vaisman,博思艾伦咨询公司数据科学家、乔治?华盛顿大学兼职教授、数据社区DC联合创始人

“每个概念都得以清晰明了的解读,在容易忽略细节的部分又都有补充资源,供读者深入学习,这对于专业人员和初学者都非常友好。本书中的讲解总是与示例相辅相成,让读者在学习之后又能投入实战,深入了解系统功能——我认为这才是熟悉新领域的关键所在。”
——读者

内容简介

通过提供分布式数据存储和并行计算框架,Hadoop已经从一个集群计算的抽象演化成了一个大数据的操作系统。本书旨在通过以可读且直观的方式提供集群计算和分析的概览,为数据科学家深入了解特定主题领域铺平道路,从数据科学家的视角介绍Hadoop集群计算和分析。本书分为两大部分,* 一部分从非常高的层次介绍分布式计算,讨论如何在集群上运行计算;* 二部分则重点关注数据科学家应该了解的工具和技术,意在为各种分析和大规模数据管理提供动力。

作者简介

Benjamin Bengfort,数据科学家,目前正在马里兰大学攻读博士学位,方向为机器学习和分布式计算;熟悉自然语言处理、Python数据科学、Hadoop和Spark分析等。
Jenny Kim,经验丰富的大数据工程师,不仅进行商业软件的开发,在学术界也有所建树,在海量数据、机器学习以及生产和研究环境的Hadoop实施方面有深入研究。目前任职于Cloudera的Hue团队。

附件下载

  • 下载

    百度网盘下载

    下载: 所需积分:90

  • 积分获取方法:先给账户进行充值,然后进行积分兑换,积分兑换比例:1元可兑换10个积分.
    具体可参考帮助如何获取积分说明

相关资源

  • 图解黄帝宅经全新图解认识中国居住之道

    住宅文化是中国古代关于居住环境规划和设计的一门学问,历史悠久 ,渊远流长,是中国传统文化的独特产物。《黄帝宅经》相传是黄帝所作 ,它综述了中国住宅文化的精髓,强调了要根据环境综合考察阳宅,相宅 应当“以形势为身体,以泉水为血脉,以土地为皮肉,以草木为毛发

    10/19/2024 8:39:11 PM
  • Java2认证考试指南与试题解析

    Java2认证考试指南与试题解析作者:孙卫琴,李洪成编著ISBN:9787532366279出版社:上海科学技术出版社出版日期:2002年01月市场价:78.00内容简介Sun公司在Unix领域一直是技术和市场占有率的领先者,近年来她又推出了Java技术,并成为业界的标准。目前,Java的培训和认证…

    9/21/2024 8:42:52 PM
  • 精通Struts:基于MVC的JavaWeb设计与开发

    Struts是目前非常流行的基于MVC的Java Web框架。《精通Struts:基于MVC的Java Web设计与开发》详细介绍了在的Struts1.1以及不久将推出的Struts1.2版本上设计和开发Java Web应用的各种技术。本书章到第3章为入门篇,通过两个Struts应用实例,引导读者把握设计、开发和部署…

    9/21/2024 8:31:16 PM
  • JAVA开发专家·精通Hibernate:Java对象持久化技术详解(第2版)

    凝聚Java魅力,成就开发专家 看清Java万花筒的本质,从复杂的表象中寻找普遍的规律,深刻理解Java的核心思想 本书在第1版的基础上,并结合作者多年经验,将更新的理论知识,精心细致地介绍新技术应用。 《精通Hibernate:Java对象持久化技术详解(第2版)…

    9/20/2024 11:09:15 PM