流式架构:Kafka与MapRStreams数据流处理
编辑推荐
适读人群 :软件开发人员,相关的技术人员和非技术人员 对于数据驱动型公司,设计和构建流式数据架构能够实现实时或近实时应用,提升整个组织的效率。《流式架构:Kafka与MapR Streams数据流处理》简明的指南讲述了流设计中的关键因素(聚焦于消息层的关键特性)、新的消息技术 ApacheKafka 和 MapR Streams、流架构是如何支持微服务的,以及当下可供选择的流技术:Apache Spark Streaming、Apache Flink、Apache Storm和 Apache Apex,适合架构师、大数据科学家及 IT 工程师阅读。
内容简介
所有连续的事件流都可以称为数据流。对连续数据流设计和构建流式数据架构,能够实现实时或近实时应用,提升整个组织的效率。本书以Apache Kafka 和MapRStreams为例,重点讲解如何确定使用流数据的时机、如何为多用户系统设计流式架构、为什么要求消息传递层具备某些特定功能,以及为什么需要微服务,并且描述了目前*符合流式设计需求的消息传递和流分析工具,适合架构师、大数据科学家及IT工程师阅读。
作者简介
TedDunning,MapRTechnologies首席应用架构师,开源社区的活跃成员。现任ApacheFoundation孵化器的VP,是大量项目的冠军得主和导师,也是ApacheZooKeeper和Drill项目的贡献者和PMC成员。 EllenFriedman,解决方案咨询师,著名演讲者和作家,目前主要撰写大数据方面的著作。她是ApacheDrill和ApacheMahout项目的贡献者。 译者简介 唐李洋,博士,研究方向为云计算、并行计算、数据挖掘与分析等。曾经在Cisco从事过数据架构方面的设计与分析工作。