电子书:《大数据搜索引擎原理分析及编程实现》

[复制链接]
查看1278 | 回复1 | 2019-12-24 13:31:33 | 显示全部楼层 |阅读模式

多种网盘链接检测插件
购买前,请先检测网盘链接是否有效


                       

《大数据搜索引擎原理分析及编程实现》_1

《大数据搜索引擎原理分析及编程实现》_1

《大数据搜索引擎原理分析及编程实现》_2

《大数据搜索引擎原理分析及编程实现》_2

《大数据搜索引擎原理分析及编程实现》_3

《大数据搜索引擎原理分析及编程实现》_3


内容简介:

作者简介
Liu凡平
硕士,毕业于中guo科学技术大学软
件系统设计专业。曾任职于微软亚太研
发集团、百度(中guo)有限公司。现任
薇问(北京)科技有限公司首席技术
官,负责搜索引擎技术与大数据人工智
能平台研发工作。擅长于搜索引擎、大
数据分析、分布式计算等相关研发工
作,是veey开源搜索引擎的主要贡献
者之一,也是执着于将互联网技术演绎
为艺术的完美追求者。
大数据搜索引擊
原理分析及编程实现
Liu凡平编著
電子工掌出版
blishing House of Electronics Industry
北京· BEUING
本书向读者提供了一套完整的大数据时代背景下的搜索引解决方案,详尽地介绍了
搜索引擘的技术架构、算法体系及取得的效果,以模块化的方式进行组织。着重介绍了机器
学习在搜索引中的应用,包括中文分词、聚类、分类等核心的机器学习算法,井结合示例
加以介绍和分析,使读者可以更好地理解机器学习在搜索引中的价值。还阐述了大数据给
搜素引擎带来的新特性,结合目前大数据分析的主流工具,在搜索引繁中构建知识图谐,以
及进行ri志反惯学习机制,使得搜索引更加智能
本书适合作为互联网行业从业者的技术参考书,也适合作为搜索引擎爱好者的参考读物
所不方
目(CIP)数据
引原理分析及编程实现/Liu凡平编著.一北京:电子工业出版社,2016.7
ISBN978-7-121-29164-7
1.①大…I.①Liu….①搜索引擎一程序设计Ⅳ.①TP3913
中guo版本图书馆CIP数据核字(2016)第141781号
策划编辑i冰
责任编辑i冰
特约编辑:田学清罗树利
印刷:北京季蜂印刷有限公司
装订:北京季蜂印刷有限公司
出版发行;电子工业出版社
北京市海淀区万寿路173信箱
编:100036
开本;720X10001/16印张:20.5字数:525千字
版次:2016年7月第1版
印次:2016年7月第1次印刷
定价:59.00
凡所购买电子工业出版社图书有缺损问题,请向购买书店调换。若书店售缺,请与本社
发行部联系,联系及邮电话010)88254888,8825888
质量投诉请发郎件至zlts(aphei.com.cn,盗版侵权举报请发邮件至dbq@phei.com.cn
本书咨询联系方式:libing(aphei.com.cn
搜索引擎本身作为一门综合性的互联网技术,在行业中一直具备较高的关
注度。随着最近几年大数据的发展,搜索引弊的关注度越来越高,原因在于搜
索引技术是大数据应用最前线的领域,也是最容易产生价值的大数据应用
大数据存储、大数据计算都是从搜索引繁中衍生出的新领域。目前搜索引摹技
术的发展不仅以大数据为基础,还利用分布式实时计算对数据进行高性能处理
以及利用机器学习将数据变得更具价值。在行业中吸引了包括搜索研发工程师
算法研发工程师、大数据分析工程师、自然语言处理工程师、计算平台架构师
数据挖掘工程师等行业各类精英的关注,这些工程师占据了整个互联网研发体
系的50^60??BAT中,甚至超过60?是研发人员
这类群体薪资水平处于互联网研发人员中较高水平,以猎聘网公布的数据
显示,北京地区搜索引擎研发工程师年薪为35万~60万元,大数据工程师年
薪为20万~25万元,大数据架构师年薪为40万~70万元,等等。也正是由
水平处于较高位,很多互联网相关从业者也积极关注大数据搜索引擎领
本书通过介绍大数据下的自然语言处理框架、大数据存储引擎、搜索引擎
的分布式实时计算、高性能可扩展爬虫,以及利用大数据构建知识图谱、基于
大数据ri志的搜索引擎反馈学习等相关信息,不仅使读者对当代搜索引研发
体系有一定的认识,还可以使读者在搜索引擎领域及大数据领域进行深入思考
本书特色
本书以当前搜索引擎主流技术为基础,密切结合前沿技术发展趋势,行文
大数据索引原理分析及蝙实现
通俗易懂,由初步的原理性了解到各模块应用示例,并结合分布式存储、实时
计算等,向读者提供了一套完整的大数据时代背景下人工智能搜索引擎的解决
(1)内容循序渐进、行文有条有序地介绍搜索引擎知识
本书充分考虑了不同层次的读者对搜索引擎的理解程度,因此本书由简入
深、独特的技术写作视角符合广大读者对于技术类读物的理解需求,使得读者
能够在掌握捜索引擎基础的情况下,不断按照搜索引擎的设计深入理解
(2)技术前性强,注重最新主流技术在现代搜索引擎中的应用
本书充分利用了最新技术发展的应用成果,在自然语言处理的基础上不仅
结合大数据分析,还包括分布式计算、机器学习、知识图谱等当前大数据应用
与分析处理的主流技术,摒弃了传统过时的研发体系及算法。本书中相关研发
成果在当前甚至在未来3~5年,都具有实际意义
3)将技术理论与应用范例结合,具备较高的商业实用价值
本书内容紧密结合当前一线工程师工作研究成果,将众多的技术理论以实
际工作经验的方式展示应用效果。本书介绍的内容也广泛结合工作中的应用示
例,并以搜索引擎工程实践的脉络流程介绍技术要点,使读者在短时间内能够
掌握当前搜索引擎研发的技术理论
本书结构
本书按照由浅入深、循序渐进的顺序对现代搜索引擎原理和实现进行介绍。
全书分为10章,各章的主要内容如下
第1章针对搜索引繁发展的过去、现在、未来的相关概要介绍,以及现代
搜索引与大数据、人工智能的相互关系,使广大读者能够在了解现代搜索引
繁的背景之下,去了解本书的后续内容

#############################################


回复

使用道具 举报

小Y | 2019-12-24 13:31:37 | 显示全部楼层
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则