多种网盘链接检测插件 购买前,请先检测网盘链接是否有效
《机器学习Web应用》_1
《机器学习Web应用》_2
《机器学习Web应用》_3
内容简介:
图书在版编目(CIP)数据
机器学习Web应用/(意)爱索尼克( 安drea Soni)
著;杜春晓译.-一北京:人民邮电出版社,2017
ISBN978-7-115-45852
1.①机…I.①爱…②杜….①机器学习
中guo版本图书馆CIP数据核字(2017)第141915号
版权声明
opyright C2016 Packt Publishing, First published in the English language under the title
Machine Learning for the Web
All rights reserved
本书由英guo Packt Publishing公司投权人民邮电出版社出版。未经出版者书面许可,对本书的任何部分不
得以任何方式或任何手段复制和传插。
意] 安drea Soni
杜春晓
责任编辑Chen冀康
责任印制
◆人民邮电出版社出版发行北京市率台区成寿寺路11号
卸编100164电子邮件315@ptpress.com.cn
网址htp/www.ptpress.com.cn
北京鑫正大印刷有限公司印刷
4开本800x1000
印数1-2400册
2017年8月北京第1次印
著作权合同登记号图字:01-2016-8595号
定价:59.00元
卖者服务热线010)81055410印装质量热线01081055316
反盗版热线010)81055315
广告经营许可证:京东工商广登字20170147号
内容提要
机器学习可用来处理由用户产生的、数量不断增长的Web数据。
本书讲解如何用 Python语言、 Django框架开发一款Web商业应用,以及如何用
现成的库和工具( stearn、 scipy、nltk和 Django等)处理和分析应用所生成或使用的数据
本书不仅涉及机器学习的核心概念,还介绍了如何将数据部署到用 Django框架开发的Web
应用,包括Web、文档和服.务.器端数据的挖掘和推荐引擎的搭建方法
本书适合有志于成为或刚刚成为数据科学家的读者学习,也适合对机器学习、Web数
据挖掘等技术实践感兴趣的读者参考阅读
序
机器学习是什么?2016年,无论参加大会、研讨会,还是接受采访,很多人都让我给
机器学习下个定义。人们对机器学习是什么,抱有诸多疑问。理解这一新鲜事物可能为生
活帯来的潜在影响以及它ri后对我们有何种意义之前,天性要求我们先给出其定义
跟其他陡升为显学的学科类似,机器学习并不是新生事物。科学社区多年来一直致力
于研制算法,实现重复性工作的自动化。参数固定的算法叫作静态算法,其输出是可预测
的,输出只是输入变量的函数。还有一种情况,算法的参数是动态变化的,算法的输出是
外部因素(最常见的是同一算法先前的输出)的函数,这种算法叫作动态算法,其输出不
仅仅是输入变量的函数。动态算法是机器学习的支柱:从先前迭代生成的数据中,学习到
组规则,以改善之后的输出
科学家、开发人员和工程师研究和使用模糊逻辑、神经网络和其他类型的机器学习技
术已有多个年头,但直到今天,随着机器学习应用离开实验室,进入市场营销、销售和金
融行业,这门学科才流行起来,基本上来讲,需要重复执行相同运算的活动都可以受益于
机器学习
机器学习的影响很容易理解,它将给我们的社会带来巨大冲击。关于下一个5到10
机器学习将给我们带来什么,我能想到的最佳描述方式是:不妨回想工业ge命时期发
生了什么。蒸汽机发明之前,很多人从事高度重复性的体力工作。为了赚取少得不能再少
的工资,他们往往要冒着生命危险或以牺牲健康为代价。工业ge命出现后,社会得以发展
机器接管了生产过程的重要步骤,这带来了产量的增加,并且产出的可预测性更强和更稳
定。与之相应的是,产品质量的提升和新工种的出现,操控机器这类新兴的工作取代了体
力劳动。我们将造物的责任委托给由我们设计和发明的工具,这在人类历史上可是第一次。
机器学习将以相同的方式,改变执行数据运算的方式,减少人工干预的需要,将优化的工
作交给机器和算法。数据处理人员将不再直接控制数据,而是通过控制算法间接控制数据
因此,运算的执行速度将会变得更快,更少的人将能控制规模更大的数据集,错误将会减
少,从而结果的稳定性更高和可预測性更强。跟其他对我们生活产生重大影响的事物一样
爱幕和憎恶它的人都有。爱幕者称赞机器学习为他们生活带来便利;恶者批评,机器学
习方法要有效,需要大量的迭代,因此需要大量数据。而通常来讲,我们“喂给”算法的
数据可是我们的个人信息
事实上,机器学习作为一种工具得以迅速发展,其主要应用在于提升市场营销和顾客
支持的效率。为顾客提供个性化服务,促使他们购买而不只是浏览,或让他们高兴而不是
失望,需要对顾客有着深入的理解
例如,就市场营销而言,如今市场营销人员开始考虑位置、设备、购买历史、访问过
的网站、天气状况等信息(仅举几个例子)来决定公司是否向一组特定顾客展示广告
通过电视或报纸这样无法追踪的媒体传播营销信息的ri子已然成为遥远的过去。如今
市场营销人员希望知道谁点击和购买了他们商品等一切信息,他们好优化创意和投入,合
理分配预算,以充分利用他们手中的资源。这就要求提供前所未有的高度个性化服务,若
使用合理,可以让顾客感到他们是受尊重的个体而不只是某一社会人口学分组的一部分。
机器学习既吸引人又充满挑战,但无疑下一个十年的赢家,将会是那些能够理解非结
构化数据,并且能够基于这些数据以可扩展的方式做出决策的公司或个人:除了机器学习
我还没有看到哪种方式能实现这样的伟业
安drea Soni的这本书朝这个世界迈出了一步:读它就好像是向下窥视兔子的洞穴,你
能从中看到用机器学习技术实现的几个应用,作者将机器学习技术整合到Wcb应用中。访
问用机器学习技术创建的个性化服务网站,顾客能从中体验到为他们个人提供的优化过的
如果你想为ri后的职业生涯提前做好准备,该书是你必須要读的:下一个十年跟数据
打交道的任何人若想成功的话,都需要熟练掌握这些技术
Bay公司 EU 安alytics部门负责人
言外之意,隐私受到成。一一译者注
译者序
。o年前,BM研制的深蓝计算机强战胜罗斯棋王卡斯帕罗夫,它在体力上的优势
比智力方面更明显。但刚刚过去的这一年,GuGe的 Alphago计算机程序打败了围棋高
手Li世石,它的升级版 Master F威力更是了得,横扫中riHan高手,它擅长走快棋,招法狠毒
令人类高手胆。由此可见,近年来,人工智能技术随着硬件、大数据、机器学习技术的
发展,取得了长足的进步
机器学习技术作为人工智能的一个子领域,研究和应用热潮不减,研讨会、学习班和
创业项目层出不穷:guo内学者入选 AAAL Fellow;该领域的书籍一印再印:人脸识别、自
动驾驶、机器翻译、智能客服、物流无人机和家居、医疗、教育机器人等各种应用不断推
向市场。从以上种种表现来看,我们处在人工智能时代的风口和前夕。作为该领域的从业
者,我们不能满足于看热闹,应努力掌握背后的核心技术ー一机器学习,力求弄懂该技术,
并努力探索其他可能的实现人工智能的方法,把人类智慧的边界向前推进一步。更令人鼓
舞的是,大数据产业发展己上升到guo家战略层面,我guo要实现从数据大guo向数据强guo的转
变,需要一批掌握了数据挖据、机器学习等相关技术的人才
本书讲解的是商业网站数据分析和挖掘所用到的机器学习理论和技术。作者先介绍了
机器学习的基本概念、 Python机器学习工具栈( Numpy、 pandas和 matplotlib等),接着分
别讲解了无监督和有监督机器学习理论,每种方法都给出形式化描述,其间用到了大量概
率统计、线性代数等数学知识,比如最小二乘、相关性、贝叶斯概率和奇异值分解等。作
者的统计学背景在这一点上得到了很好的体现。这部分数学知识能够较好地满足有志于深
入学习的读者的需要,水平高的读者可以从中感受机器学习模型的数学魅力。介绍完这两
大类机器学习理论,作者又从Web结构和内容两个方面讲解了Web挖掘技术:介绍了信思
#############################################
|
|