高性能分布式计算系统开发与实现:基于Hadoop、Scalding和Spark
内容简介
本书分两部分,共8章,介绍了如何使用开源工具和技术开发与实现大规模分布式处理系统,涵盖构建高性能分布式计算系统的方法和佳实践。第 一部分(第1~4章)介绍了高性能分布式计算编程的基础知识,包括分布式系统、Hadoop入门、Spark入门、Scalding入门等;第二部分(第5~8章)给出了使用Hadoop、Spark、Scalding的案例研究,涉及数据聚类、数据分类、回归分析、推荐系统等。本书适合作为高等院校计算机相关专业的教材,也适合作为软件工程师、应用开发人员、科研人员的参考书。
作者简介
K.G.斯里尼瓦沙(K.G.Srinivasa)于2007年获得班加罗尔大学计算机科学与工程博士学位。现就职于班加罗尔的M.S.拉迈阿理工学院计算机科学与工程系,任教授兼主任。他在国际会议和期刊上共发表过一百多篇研究论文,曾作为访问学者出访过许多大学。他是UGC、DRDO和DST资助的多个项目的首席研究员,其研究领域包括数据挖掘、机器学习、高性能计算和云计算。他是IEEE和ACM的高级成员。 阿尼尔·库马尔·穆帕拉(Anil Kumar Muppalla)既是一位研究者也是一个作家。具有计算机科学和工程学学位。他是很多行业的软件开发者和顾问。他是活跃的研究者,并在国际会议和期刊上发表诸多文章。他研究的方向包括使用Hadoop、Scalding和Spark进行应用开发。