多种网盘链接检测插件 购买前,请先检测网盘链接是否有效
《大数据搜索与ri志挖掘及可视化方案ELKStack-Elasticsearch-Logstash-Kibana(第2版)》_1 ... ...
《大数据搜索与ri志挖掘及可视化方案ELKStack-Elasticsearch-Logstash-Kibana(第2版)》_2 ... ...
《大数据搜索与ri志挖掘及可视化方案ELKStack-Elasticsearch-Logstash-Kibana(第2版)》_3 ... ...
内容简介:
高凯,汉族、教授,博士毕业于上海交通大学计
算机应用技术专业,省级重点学科“计算机软件
与理论”中“信息检索与云计算”方向学术带头
人,硕士研究生导师;中guo计算机学会会员
International Joumal of Computer Applications in
7 echnology副主编(2013-2017),5th、6th
7th International Conference on Modelling
dentification and Contro程序委员会委员;主
研究方向为大数据搜索与挖掘、自然语言处理
网络信息检索、社会计算等;近几年出版了《大
数据搜索与挖掘》、《信息检索与智能处理》
网络信息检索技术及搜索引擎系统开发》等学
术专著及多部规划教材,在guo内外学术期刊
Expert Systems With Applications, Intemational
Journal on intelligent information and Database
ystem, Intemational Jouma/ on Modelling
dentification and Contro、《中文信息学报
电子学报》、《小型微型计算机系统》等以及
PAKDD等guo际学术会议上发表学术论文几十篇
主持及参与guo家、省级科研课题多项;申请软件
著作权登记十余项;目前在研课题有guo家自然科
学基金课題、省自然科学基金课題等。
大数据搜索与ri志挖掘
及可视化方案高凯等编著
ELK Stack: Elasticsearch、 Logstash、 Kiana
(第2版)
清华大学出版社
内容简介
对大数据的搜索与挖掘,在当今的“互联网+”时代是很有必要的。本书提出的分布式大数据搜索与ri
志挖掘及可视化方案是基于 ELK Stack而提出的,它能有效应对海量大数据所带来的分布式存储与处理
全文检索、ri志挖掘、可视化等问题。构建在全文检索开源软件 Lucene之上的 Elastiesearch,不仅能对海
量规模的数据完成分布式索引与检索,还能提供数据聚合分析。据guo际权威的数据库产品评测机构D
Engines的统计,在2016年1月, Elastiesearch已超过Solr等,成为排名第一的搜索引擎类应用; Logstash
能有效处理来源于各种数据源的ri志信息; Kiana能得出可视化分析结果,了解基于 ELK Stack的大数
据搜索与ri志挖掘及可视化方案,掌握 Elasticsearch、 Logstash、 Kiana的基本使用方法和技巧,很有必要
全书以模块化的方式进行组织。和第一版相比,本书力求反映 ELK Stack的最新成果,内容新颖、强
调实践。本书也可为高等学校相关专业(如计算机科学与技术、软件工程,物联网、信息管理与信息系统)
学生的学习和科研工作提供帮助,同时对于从事大数据搜索与挖据、ri志分析、信息可视化技术的工程技
术人员和希望了解网络信息检索技术的人员也具有较高的参考价值和工程应用价值
本书封面贴有清华大学出版社防伪标签,无标
示签者不得销售
版权所有,侵权必究。侵权举报电话:010-6278298913701121933
图书在版编目(C1P数据
大数据搜索与ri志挖据及可视化方案: ELK Stack: Elasticsearch, stash、 Khana/高凯等编著.-2版
一北京:清华大学出版社,2016(2016.9重印)
1.①大…Ⅱ.①高…Ⅲ.①情报检索一研究②数据采集一研究Ⅳ.①G354②TP274
中guo版本图书馆CIP数据核字(2016)第051612号
责任编辑:焦虹
封面设计:Fu瑞学
责任校对:Li建庄
责任印制:何芊
出版发行;清华大学出版社
www, abook.
地址:北京清华大学学研大厦A座
部编:100084
社总机:01062770175
部购:010-6278654
投稿与读者服务:0106277696
rvice(@ tup tsinghua. edu
质量反馈:01062721 zhiliang(@tup. tsinghua.ed.ca
课件下载:htp://www.tup.com.cn,010-6279595
印刷者:三河市君旺印务有限公司
装订者:三河市新茂装订有限公司
经销:全guo新华书店
开本:185mmx240mm
印张:18.25
字数:411千字
版次:2015年6月第1版2016年6月第2版印次:2016年9月第2次印刷
产品编号:06892201
Preface
序:言
云计算、智慧城市、移动互联网、大数据与物联网已经成为大数据时代的
前瞻技术,实现了人、机器与实物的多维互联互通,监测数据、内容数据、社交
数据、关系数据裂变式增长,大数据时代已全方位到来。大数据具有多(体量
大)、快(生成速度快)、好(价值大)、省(高效)的特征,传统的信息搜索、数据
挖掘与知识呈现技术难以满足当下多样化的需求。大数据的理念与理论已
经成为人所共知的科学常识,但是大数据搜索、挖掘与可视化等落地的工程
实践尚有较大距离,也是当下的工程急需
本书从分布式大数据搜索、ri志挖掘与可视化三个角度出发,以非结构
化文本信息、半结构化的ri志数据为处理对象,进行宏观解决方案与微观方
法技巧的全面阐释。具体地说,如何利用在全文检索开源软件 Lucene之上
的 Elasticsearch对大数据进行分布式计算与全文检索;如何利用 Logstash
对ri志文件进行智能分析与处理;如何利用Web接口 Kiana对ri志进行高
效的搜索、可视化、分析等,是本书的论述重点。
从工程实践的角度掌握 ElasticSearch、 Logstash、 Kiana的基本使用方
法和技巧,很有必要。目前,guo内专门针对 Elasticsearch, Logstash、 Kiana
进行介绍的书很少。本书是目前guo内较早综合介绍ELK架构的图书,涉及
范围广泛,内容新颖,条理清晰,组织合理
高凯老师是我多年的朋友,我们都在大数据搜索与挖掘方向上从事教
学、科研与开发工作。他严谨的治学态度、理论联系实际的做法以及敬业的
态度也一直为我所学习。非常荣幸能够有这个机会来为高老师的新著作序。
认真拜读后,我以为本书实战性很强,是大数据搜索与挖掘所需的上乘之作
是大数据“知著、见微、晓意”的必备工具,值得推荐!
张华平博士,副教授,北京理工大学大数据搜索挖掘实验室主任
ICTCLAS及 NLPIR分词软件发明者。)
第2版前言
本书第1版《实战 Elasticsearch、 Logstash、 Kiana—分布式大数据搜
索与ri志挖掘及可视化解决方案》从出版发行到现在,虽过去短短的半年时
间,但在这期间,伴随着《中共中央关于制定guo民经济和社会发展第十三个五
年规划的建议》中guo家大数据战略的实施,伴随着海量数据管理技术在guo民出苦
经济以及互联网+、物联网、移动计算等各个领域的广泛应用,分布式大
数据搜索与ri志挖掘及可视化解决方案正ri益受到各行各业人员的普
遍关注。开源的、基于 Lucene的全文搜索引擎 Elasticsearch以其独到
的分布式数据处理能力,正发挥着越来越重要的作用。根据guo际权威的
数据库产品评测机构 DB- Engines统计,在2016年1月, Elasticsearch已超
过Solr等,成为排名第一的搜索引擎类应用
意量的高胖意
ELK Stack是以 Elasticsearch、 Logstash、 Kiana三个开源软件为t
主的大数据处理工具集,也是目前开源的最流行的大数据分析解决方
案,它为编程人员提供了一个分布式可扩展的信息存储和全文检索机
制、基于 Logstash的ri志处理机制、基于 Kiana的挖掘结果可视化的
机制。不仅如此, ELK Stack还有 Shield(.安.全.和管理插件,如权限控
制、加密通信、审计等)、 Watcher(性能监控平台等)、 Beats(官方提供
用来收集ri志的 Filebeat、用来收集系统基础设置数据的 Topbeat统计
收集网络信息的 Packetbeat)等中间件。在实时大数据处理的应用中
上述软件通常配合使用。因此,从实战的角度掌握 Elasticsearch
Logstash、 Kiana等软件的基本使用方法和技巧,很有必要。
考虑到部分读者对本书第1版的修改意见,我们对其中的部分内容
进行了必要的补充和修改、完善。一方面,对 ELK Stack的最新版本进
行了简述,力求反映 ELK Stack的最新成果;同时,考虑到与本书第1版
的内容衔接,对部分使用上无差异的操作,仍旧以 Elasticsearch、
Logstash、 Kiana的经典版本为基础进行介绍。另一方面,对
Elasticsearch中涉及索引、检索、统计、Java实现、集群管理的内容(主要
涉及第1版中的第2~6章的内容),给出了实例。同第1版一样,本书
第2版仍强调实践和面向初学者,并通过实战讲解的方式,让读者更好
#############################################
|
|