多种网盘链接检测插件 购买前,请先检测网盘链接是否有效
《揭秘深度强化学习》_彭伟_1
《揭秘深度强化学习》_彭伟_2
《揭秘深度强化学习》_彭伟_3
内容简介:
彭伟, AvatarWorks人工智能
实验室研究员,电子科技大学EE
学士,厦门大学计算机硕士,具有
良好的软硬件能力。目前主要从事
人工智能、机器学习算法的研究
主要的项目经历包括视觉目标跟
踪、行人检.测、目标检.测、3D动
画风格传输、虚拟机器人行为系统
等,具有丰富的实战经验。
扫码下载本书源文件
人工智能技术丛书
揭秘深度强化学习
彭伟编著
QD来利谋电版姓
内容筒介
度强化学习( Deep Reinforcement Leaming,DRL)是深度学习算法和强化学习算法的巧
妙结合,它是一种新兴的通用人工智能算法技术,也是机器学习的前沿技术,DRL算法潜力无限
phaGo是目前该算法最成功的使用案例,DRL算法以MA尔科夫决策过程为基础,是在深度学
习强大的非线性函数的拟合能力下构成的一种增强算法。深度强化学习算法主要包括基于动态
规划(DP)的算法以及基于策略优化的算法,本书的目的就是要把这两种主要的算法(及设计
技巧)讲解清楚,使算法研究人员能够熟练掌握
《揭秘深度强化学习》共10章,首先以 AlphaL在围棋大战的伟大事迹开始,引起对人
工智能发展和现状的介绍,进而介绍深度强化学习的基本知识。然后分别介绍了强化学习(重
点介绍蒙特卡洛算法和时序差分算法)和深度学习的基础知识、功能神经网络层、卷积神经网
络(CNN)、以及深度强化学习的理论基础和当前主流的算法框架。最后介绍了深度强化学习
在不同领域的几个应用实例。引例、基础知识和实例相结合,方便读者理解和学习
《揭秘深度强化学习》内容丰富,讲解全面、语言描述通俗易懂,是深度强化学习算法入
门的最佳选择。本书适合计算机专业本科相关学生、人工智能领域的研究人员以及所有对机器
学习和人工智能算法感兴趣的人员
书在版编目(cP)数据
揭秘深度强化学习/彭伟编著.一北京:中guo水利水电出版社,2018.
工智能技术丛书
ISBN978-7-51706238-7
1.①揭…Ⅱ.①彭…Ⅲ.①机器学习一研究ⅣV.①TP81
中guo版本图书馆CIP数据核字(2017)第327452号
丛书名人工智能技术丛书
秘深度强化学习 JIEMI SHENDU QIANGHUA XUEXI
出版发行中guo水利水电出版社
(北京市海淀区玉渊潭南路1号D座100038)
E-mail:zhiboshangshu@163.com
电话010)62572966-220522662201(营销中心)
经售北京科水图书销售中心(零售
电话010)88383994、63202643、68545874
全guo各地新华书店和相关出版物销售网点
排版北京智博尚书文化传媒有限公司
河市龙大印装有限公司
格170mm×30mm16开本2325印张357千字
版次2018年5月第1版2018年5月第1次印刷
印数000-5000
价89.80元
凡购买我社图书,加有缺頁、例頁、脱页的,本社营销中心负责调
版权所有·侵权必究
前言
深度强化学习( Deep Reinforcement Learning,DRL)是一种新兴的
通用人工智能算法技术,是人工智能迈向智能决策的重要一步。
关于深度强化学习的文章目前比较少,系统介绍深度强化学习的教
材几乎没有。本书系统地介绍深度强化学习算法的基础知识。学习该算
法的人员需要人工智能相关专业的背景,但是并不需要比较深的背景
本书以一种通俗易懂的、细致的方式对深度强化学习算法进行了讲解,
力求帮助读者较快入门。深度强化学习涉及的知识面比较广,但其算法
原理并不是想象得那么复杂。因此,本书会对其相关知识点进行简要的
介绍,保证没有相关经验的读者也能够很好地理解本书的内容。通过本
书的学习,希望读者能够掌握两大类别的深度强化学习算法:基于动态
规划的算法以及基于策略梯度的算法。深度强化学习具有较广泛的使用
场景,例如游戏决策、量化投资、动画仿真等,希望本书能够帮助读者
适应不同的使用场景
本书特点
沿的研究方向:本书介绍人工智能目前最前沿的研究方向,是
通用智能的基础。
完备的DRL入门书籍:囊括经典,紧跟前沿,包括DRL目前最
新研究成果
通俗易懂的讲解:用通俗易懂的语言,结合案例进行解析,适合
所有人工智能相关专业的初学者,能帮助他们快速入门
专业的经验:本书密切结合实际应用,是人工智能前沿研究及实
践的经验总结
‖揭秘深度强化学习
本书内容安排
第1章深度强化学习概览
本章从当前人工智能飞速发展并引起广泛关注的背景出发,概述了
深度强化学习的基本知识,强化学习和深度学习的发展历史、基本概念
和特点等,以及深度强化学习的两种算法
2章强化学习基础
传统的强化学习是深度强化学习的基础。本章从MA尔科夫模型出发
介绍了MA尔科夫决策过程,同时用比较通俗的语言介绍了强化学习中的
两种问题,有模型强化学习问题以及无模型强化学习问题。现实中无模
型强化学习问题是一种非常普遍的情况,因此重点介绍了其中的蒙特卡
洛算法以及时序差分算法。
第3章深度学习基础
强化学习引入深度学习之后,性能得到了极大的提高。本章重点介
深度学习的基础,主要从四个方面来介绍:深度学习简史、深度学习
的基础概念、数据预处理以及深度学习的硬件基础。本章的学习对于强
化学习甚至是机器学习都非常重要
第4章功能神经网络层
功能神经网络层是深度学习的核心部分。本章将介绍深度学习过程中
的激活函数、全连接层、参数开关 Dropout以及CNN和RNN等。本章最
也介绍了相关的网络设计技巧。
第5章卷积神经网络【CNN
本章用大量的篇幅介绍卷积神经网络,这是因为目前DRL都是基于
CNN实现的,是希望读者能够迅速掌握其相关知识,不要因为其难点而
影响算法的学习。本章主要介绍了CNN的网络结构、基于CNN的经典
模型,以及基于CNN的流行应用
第6章循环神经网络(RNN
循环神经网络虽然不是深度强化学习的重点,但是也是深度学习的
个重要的网络结构,不难预见,基于RNN的强化学习算法也会不断
出现。本章介绍了RNN的基础,同时介绍了RNN的两种常见的结构:
LSTM以及GRU
#############################################
|
|