Spark权威指南(影印版英文版)[SparkTheDefinitiveGuide]
内容简介
为了帮助读者学习如何使用、部署和维护Apache Spark,该开源集群计算框架的部分创建者编写了本书这本综合指南。
本书作者比尔·钱伯斯和马太·扎哈里亚在强调Spark 2.0的改进和新功能的同时,将Spark题分为不同的部分,每个部分都有其独特的目标。
你将探索Spark的结构化API的基本操作和常见功能以及Structured Streaming,后者是用于构建端到端流应用的一种全新的高层API。开发人员和系统管理员会学Spark监控、调优、调试的基础知识,探索机器学习技术以及Spark可扩展机器学习库MLlib的部署场景。