多种网盘链接检测插件 购买前,请先检测网盘链接是否有效
《构建ApacheKafka流数据应用》_蒋守壮译_1
《构建ApacheKafka流数据应用》_蒋守壮译_2
《构建ApacheKafka流数据应用》_蒋守壮译_3
内容简介:
构建 Apache Kafka
流数据应用
印]曼尼施·库MA尔 anish Kumar))
印]尚沙勒·辛格( Chanchal Singh)/著
大学出版社
北
内容简介
Apache Kafka是
行的分布式流平台,充当消息队列或企业消息传递系统。它用来发布和订阅数据流
并在发生错误时以容错方式处理它们
本书共13章,全面介绍使用 Apache Kafka等大数据工具设计和构建企业级流应用方面的内容,包括构建流
应用程序的最佳实践,并解决了一些常见的挑战,例如如何高效地使用 Kafka轻松处理高容量数据。完成本书的
学习后,读者能使用 Kafka设计高效的流数据应用程序
本书既适合Kaka初学者、大数据应用开发人员、大数据应用运维人员阅读,也适合高等院校与培训学校相
关专业的师生教学参考
本书为 Packt Publishing有限公司授权出版发行的中文简体字版本
北京市版权局著作权合同登记号图字:01-20181023
本书封面貼有清华大学出版社防伪标
版权所有,侵权必究。侵权举报电话:0106278298913701121933
图书在版编目(c|P)数据
构建 Apache Katka流数据应用
施·库MA尔( Manish Kumar),(印)尚沙勒·辛格( Chance
ngh)著:蒋守壮译.一北京:清华大学出版社,2018
书名原文: Building Data Streaming Applicationswith Apache Kafk
SBN978-7-302-50936-3
L①构...①曼.②尚③蒋.ⅢL①分布式操作系统ⅣV①TP3164
中guo版本图书馆CIP数据核字(2018)第191103号
责任编辑:夏毓彦
责任印制:董瑾
出版发行:清华大学出版社
地址:北京清华大学学研大厦A座
http://www.tup.com.cn
邮编:100084
社总机
投稿与读者服务:010-62776969,C-service@tuptsinghua.edu.cn
质量反馈:010-62702015,zhuliang@tuptsinghua.edu.cn
印装者:北京鑫海金澳胶印有限公司
经销:全guo新华书店
字数:352千字
版次:2018年9月第1版
018年9月第1次印刷
定价:79.00元
产品编号:079765-0
译者序
我将 Kafka应用到生产环境中已经很多年了,应用场景也是多种多样,包括ri志收集、流
处理、实时监控、事件追溯和指标度量等, Kafka大部分都是和其他系统集成使用,包括 Spark
Storm、Fink和Fume等。这几年生产环境中的Kfka也经历了好几个版本,从0.8版本到如今
的11版本,而且 Kafka最近几个版本还是有不少变化的,比如0.9版本引入.安.全.特性(包括提
供 Kerberos和TLs身份认证,提供数据加密传输),重新设计 Consumer接口,提供统一的
Consumer APl,另外 Kafka自身可以维护 offset, Consumer可以不借助 Zookeeper等:0.,11版本
支持EOS(幂等的 producer.,支持事务,支持EoS流处理)等。下决心翻译这本书的原因大概
有两方面:一是 Kafka社区圈子里面不少朋友的推荐,毕竟有读者才有动力,真诚希望这本书
可以帮助更多想了解和使用Kaka的朋友:另一方面就是结合多年的Kaka生产实战经验,从原
著中体会到很多有价值的经验和教训,可以帮助读者更好地理解和应用 Kafka。在这里,我将社
理由总结以下几点
1.完整地阐述了 Kafka架构体系中的每个组件,帮助读者对 Kafka生态圈有一个体系化的
认知,加深对 Kafka的理解
结合当前常用的 Kafka生产环境,探讨了与Kfka集成的流数据应用的架构,比如 Spark
5 treaming、 Storm等
3.针对企业中 Kafka集群部署、规划、数据.安.全.、数据治理等提供合理建议
4.针对不同的应用场景,书中都给出了具体的示例,方便读者加深理解和实战,甚至
些示例稍加修改就可以应用到生产环境中解决实际问题
虽然 Kafka版本更新迭代较快,但是 Kafka核心思想和架构没有改变,本书不受限于读
者使用的 Kafka版本。可能给读者带来一点不便的是,书中有些代码需要根据 Kafka
spak和 Storm不同的版本进行调整,读者只需要查看对应的AP接口进行变更即可
构建 Apache Kafka流数据应用
我相信本书无论对 Kafka新手还是对 Kafka有实战经验的朋友都会带来帮助,希望本书可以
帮助朋友们更好地理解 Kafka,并应用在自己的业务场景中进行实战。第一次翻译书籍,经验
尚浅,非常感谢清华大学出版社夏毓彦老师的帮助和指导,以及争取到翻译的版权,感谢出版
社中所有为此书付出辛勤劳动的各位老师。感谢项目组同事的大力支持,解决翻译中遇到的
些问题。最后,感谢我的家人,给予我的不懈支持,一如既往地照颗我的生活,给予我充足的
时间用来写作
蒋守壮
2018年7月
推荐序
十几年来,我一直从事和大数据相关的工作,经历了很多阶段,涉及金融、互联网、实体
和餐饮等行业,简单介绍一下个人背景
1.目前负责Mai当劳中guo战略、I、大数据,以及联合中信资本投资的新创公司 Infiniti
深见 ABC Labs下 Deeplnsight洞见AI实验室、 DeepSource深源区块链实验室、 Deep Fabric深
网云计算实验室
2. Altius One基金会AX人工智能+区块链项目联合创始人; Linux基金会超级账本
***rledger项目董事会成员、前工信部区块链发展论坛副理事长、中guo电子学会区块链专家委
员会专家、guo际数字经济联盟理事专家委
3.前万达网络科技集团总裁助理兼首席数据官/首席架构师,负责大数据、人工智能、区
块链和分布式计算(AB2C)战略和实施,支持实体+互联网(飞凡)、网络金融(快钱支付
小贷、理财、征信)等板块以及万达集团的商业地产、文旅集团设计院、金融集团保险等业务
是数字权益( AppStore“万益通”App)和共享商业两个区块链创新事业部的联合创始人
4.此前,在伦敦投行担任首席架构师,创建了大数据、云计算卓越中心;是西欧地区超过
万会员的人工智能、数据科学家社区DSL联合创始人兼CTO:被英guo媒体《信息时代》评
选为全英2015/16年度前50名数据领袖和最有影响者
今天看到大数据卓越中心的技术人员在翻译大数据领域的技术书籍,非常高兴,而且目前
公司也采用 Apache Kafka构建企业流实时平台,收集和处理公司各业务数据的来源等问题
Apache Kafka是一种高吞吐量的分布式发布订阅消息系统,它最初是由 LinkedIn公司开发
之后成为 Apache级开源项目,在大数据和云计算技术体系中扮演重要的角色。另外,Kaka
也有商业公司 Confluent提供商业化服务支持,推进Kaka在企业中更好地应用,译者在本书中
也介绍 Confluent Platform,它是一个流数据平台,能够组织管理来自不同数据灝的数据,拥有
稳定高效的系统
Katka具有高吞吐量、低延迟、可持久化、分布式和支持流数据处理等诸多特性,也正是
由于Kaka具备这些特性,使 Kafka在大型推荐系统、广告搜索、ri志收集、实时监控、实时
#############################################
|
|