多种网盘链接检测插件 购买前,请先检测网盘链接是否有效
《SparkStreaming技术内幕及源码剖析》_1
《SparkStreaming技术内幕及源码剖析》_2
《SparkStreaming技术内幕及源码剖析》_3
内容简介:
m作者简介
王家林
中guo著名的park培训专家, Apache Spark
创始人和首席专家, Android软硬件整合专家。
深入研究了 Spark从0.50到210中共28个版本
的 Spark源码,目前致力于开发优化的 Spark中
guo版本,尤其擅长 Spark在生产环境下各种类
型和场贔故障的排除和解决,痴迷于 Spark在
生产环境下任意类型(例如 Shuffle和各种_内.存_
问题及数据倾斜问题等)的深度性能优化
夏阳
系统架构师,从事平台和应用软件研发工作多
年,行业阅历丰富,对行业技术发展有独到见
解和精准判断,曾就职于中创中间件公司、蚊
坊软件公司、任子行网络技术股份有限公司
对大数据处理、机器学习、图计算、文本处理
等技术领域有丰富的实战经验和浓厚兴趣。
Spark
Streaming
技术内幕及源码剖析
王家林夏阳编著
请大学出版社
内容简介
本书以大数据处理引擎 Spark的稳定版本16x为基础,从应用案例、原理、源码、流程、调
优等多个角度剖析 Spark上的实时计算框架 Spark Streaming。在勾勒出 Spark Streaming架构轮廓的
基础上,从基本源码开始进行剖析,由浅入深地引导已具有Spak和 Spark Streaming基础技术知识
的读者进行 Spark Streaming的进阶学习,理解 Spark Streaming的原理和运行机制,为流数据处理
的决策和应用提供了技术参考:结合 Spark Streaming的深入应用的需要,对 Spark Streaming的性
能调优进行了分析,也对 Spark Streaming功能的改造和扩展提供了指导
本书适合大数据领域CTO、架构师、高级软件工程师,尤其是 Spark领域已有 Spark Streaming
基础知识的从业人员阅读,也可供需要深入学习 Spark、 Spark Streaming的高校研究生和高年级本
科生参考
本书封面貼有清华大学出版社防伪标签,无标签者不得销售。
版权所有,侵权必究。侵权举报电话:0106278298913701121
图书在版编目(cP)数据
Spark Streaming技术内幕及源码剖析/王家林,夏阳编著.一北京:清华大学出版社,2017
ISBN9787-302-46491-4
1.①s…Ⅱ.①王…②夏…Ⅲ.①数据处理软件Ⅳ.①TP274
中guo版本图书馆CIP数据核字(2017)第025588号
责任编辑:袁金敏战晓雷
封面设计:
责任校对
责任印制
出版发行:清华大学出版社
网址:htp/www:tup.com.cn,htp/www.wqbook.com
地址:北京清华大学学研大厦A座
邮编:100084
杜总机:010-62770175
邮购:010-62786544
投稿与读者服务:010-62776969,c-service(@tuptsinghua.edu.cn
质量反馈:01062772015, zhiliang@ tup tsinghua.e
印装者:清华大学印刷
经销:全guo新华书店
开本:185mm×230mm
印张:16.25
字数:264千字
版次:2017年5月第1版
印次:2017年5月第1次印刷
定价
产品编号:072312-01
前言
大数据浪潮汹涌来袭,这绝不仅仅是信息技术领域的ge命,更是在全球范围引领社会
变革的机遇。大数据的集群计算开源软件 Spark在大数据计算平台应用领域ri益凸显其重
要地位。如果大数据技术领域从业人员的技术水平仍停留在只知使用开源软件,而不从开
源软件的原理、架构上去理解,不到源码中去体会细节,则难以从根本上彻底解决现实
作中遇到的技术问题,更难以胜任大数据领域的技术创新工作
可以预见,大数据的处理将越来越强调实时处理。 Spark Streaming是建立在 Spark.上的
实时计算框架,在 Spark的各子框架中处于举足轻重的地位。彻底掌握 Spark Streaming的
同时,也能加深对 Spark Core技术的理解和掌握,还能具备开发同样高端的 Spark应用程序
的实力。对于有志向的 Spark学习进阶者来说,深入了解 Spark Streaming的源码是提高核心
竞争力的捷径
本书不仅对 Spark Streaming的AP做总结性介绍,而且重点针对 Spark1.6.x的 Spark
Streaming进行源码剖析。该书的开始部分对 Spark的基本原理有一些阐述,但主要是彻底
深入剖析 Spark Streaming的内部原理
卖源码的人都怕自己走进大量源码的迷宫。为了提高源码学习效率,本书在剖析源
码前,会对源码实现的功能的大致原理和流程轮廓进行介绍。书中有方便源码剖析的流程
图,这对于理解和掌握 Spark Streaming的各个功能非常重要。读者看到复杂的流程图时
不一定要立刻全部理解掌握,但可以在源码学习过程中经常回过头来对照流程图以加深
印象
为了在书的页面内清晰展示复杂的流程图,书中绝大多数流程图采取了从上至下的树
状结构来体现调用关系。每个方框中注明了类和方法,被其调用的类的方法会在下一行从
Zuo至右依次显示,调用和被调用的类方法间用有向线连接。有些方框上部会给出类的成员
I Spark Streaming技术内幕及源码剖析
变量,其类型就是方框中指明的类。粗箭头不是表示调用关系,而是表示传递消息
源码剖析过程中,源码中关键的类名、方法名、注释会以粗体显示,使读者清楚重
点。读者应以粗体部分为重点进行阅读,其他部分可以粗略浏览。有些源码篇幅过大,可
能会省略其中的部分代码,以突出当前读者需要阅读的源码主体
2017年2月27ri于北京
#############################################
|
|