多种网盘链接检测插件 购买前,请先检测网盘链接是否有效
《R语言与数据挖掘》_1
《R语言与数据挖掘》_2
《R语言与数据挖掘》_3
内容简介:
内容简介
这是一本适合教学和零基础自学的R语言与数
据挖掘教程,即便完全没有R语言编程基础和数据
挖掘基础,根据本书中的理论知识和上机实
你也能迅速掌握如何使用R语言进行数据挖掘的方
法。本书已经被多所高校预定为教材,为了便于教
学,书中还提供了大量的上机实验和教学资源
基础篇(1-5章),主要包括R语言及图形操
作工具 STudio的安装及使用方法,数据类型和数
据对象,数据预处理的常用操作(包括数据重命
名、缺失值分析、排序、随机抽样等),绘图功能
(包括散点图、直方图、条形图、箱线图等)。
建模应用篇(6-10章),主要介绍了数据挖
掘中常用算法的函数在R语言中的使用方法及其结
果,涵盖了目前数据挖据的5大类算法,包括分类
与预测、聚类分析、关联规则、智能推荐和时间序
。按照从模型建立到模型评价架构的顺序进行介
绍,使读者能熟练地掌握从建模到对模型评价的完
整建模过程
Rale篇(11章),介绍了R语言的图形界面
工具 Rattle,此工具能够在一个图形化的界面上对
本书所介绍的R语言功能进行操作,使读者能更好
地体验到使用R语言进行数据挖掘的整个流程
书中配套提供了原始样本数据文件及对应章节
示例代码。每个章节有对应的练习实验,读者可通
过完成对应的练习,迅速掌握R语言的用法和数拒
挖掘的方法。
S
技术丛书
R and data mining
R语言与数据挖掘
张良均谢佳标杨坦Xiao刚黄博Chen玉辉万正勇◎著
Q想撼玉出出凰基
图书在版编目(CIP)数据
语言与数据挖掘/张良均等著,一北京:机械工业出版社,2016.6(2017.1重
(大数据技术丛书)
ISBN978-7-111-54052-6
1.R…Ⅱl张…ⅢI数据处理Ⅳ.TP274
中guo版本图书馆CP数据核字(2016)第130201号
R语言与数据挖掘
出版发行:机械工业出版社(北京市西城区万庄大售22号邮政编码:1000
责任编辑i艺
责任校对:殷虹
印:三河市宏图印务有限公司
版次:2017年1月第1版第2次印刷
开本:186mmx240mm1/16
印,张:19.5
书号:1SBN978-7-111-54052-6
定价:59.00元
凡购本书,如有缺页、倒页、脱页,由本社发行部调
客服热线010)8837942688361066
投稿热线010)88379604
购书热线010)683262948837964968995259读者信箱:hzit@ hzbook com
版权所有·侵权必究
封底无防伪标均为盗版
书法律颖问:北京大成律师事务所Han光/邻晓东
A4c/w前言
为什么要写本书
R语言是什么
R是一种适用于统计分析计算和图像处理的语言,受S语言和 Scheme语言影响发展而
来。早期R是基于S
一个GNU项目,所以也可以当作S语言的一种实现,通常用S
言编写的代码都可以不做任何修改地在R环境下运行。R的语法来自 Scheme,作为
诞生于20世纪90年代的语言,R已经成为S统计编程语言的一类实现方式
R编程语言在数字分析与机器学习领域已经成为一款重要的工具。随着机器逐步成为愈
发核心的数据生成器,该语言的人气也一路攀升。正如 Tiobe、PyPL以及 Redmonk等编程语
言人气排名所指出,R语言所受到的关注程度正在快速提升。 Rexer 安alytics发布的2013年
数据挖掘人员调查显示,70c?数据挖掘人员使用R软件进行分析工作,其中有24??其作
为主要工具。这些结果类似于2013年 NUggets调查的结果,该调查指出有61c?响应者
表示正在使用R处理分析、数据挖掘和数据科学工作。相比前一年,这一比例上升了16&, {"words": "R语言有一些明显的优
R语言有一些明显的优
1)R语言作为一款开源软件,是完全免费的,对比昂贵的SPSs和SAS等统计软件,
这无疑是一个巨大的优势
2)R语言拥有一个庞大的社区来进行维护,庞大的软件包生态系统无疑是R语言最为
出的优势之
3)R语言具备可扩展能力且拥有丰富的功能选项,帮助开发人员构建自己的工具及方
法,从而顺利实现数据分析
4)R语言简单易学。虽与C语言之类的程序设计语言已差别很大(比如语言结构相对
松散,使用变量前不需要明确正式定义变量类型等),但仍保留了程序设计语言的基础逻辑
与自然的语言风格
从R的普及来看,guo外的普及度要明显好于guo内,与盗版 Windows的泛滥会影响
Linux在中guo的普及一样,_破_解_的 MATLAB与SPSS的存在也影响了R在中guo的使用。但
在guo外高校的统计系,R几乎是一门必修的语言,具有统治性的地位。在工业界,作为互
联网公司翘楚的 GuGe内部也有不少工程使用R进行数据分析工作。随着数据挖掘在guo内
的发展,guo内对R语言的需求必将随之一起发展
的来说,R语言是一款用于统计分析、数据可视化和预测建模的数据分析软件,它不
单单只是一门语言,更是一个数据计算与分析的环境。R支持几乎所有数据分析所需的数
据处理、统计模型和图表,支持大量的第三方功能包,涵盖了从统计计算到机器学习,从
金融分析到生物信息,从社会网络分析到自然语言处理,从各种数据库各种语言接口到高
性能计算模型等内容。随着大数据时代的来临,数据挖掘将更加广泛地_渗.透_到各行各业中
去,而R语言作为数据挖掘里的热门工具,将会有更多其他行业的人加入到R语言的使用
者行列中来。R语言的使用课程成为高校中数学与统计学专业的重要课程将是必然的趋势。
本书特色
本书从实际应用出发,结合实例及应用场景,深人浅出地介绍了R语言应用的相关知
识:R语言的安装及使用、数据对象与数据读写、常用数据管理、图形探索、高级绘图工
具及常用的建模算法在R语言中的实现方式。书中以R语言的函数应用为主,先介绍了函
数的应用场景及使用格式,再给出函数的应用实例,最后对函数的运行结果做出了解释
将掌握函数应用的所需知识点按照实际使用的流程展示出来
为方便理解R语言中相关函数的使用,本书提供示例代码及所用数据等相关资源下载
读者可以从“泰迪杯”全guo数据挖掘挑战赛网站(htp:/www.tipdm.org/ts/747jhtml)免费
获取。也可以通过热线电话(40068-40020)、企业QQ(4006840020)及以下微 信公众号
咨询获取。
口
张良均(大数据挖掘产品与服务)
#############################################
|
|