策略前展、策略迭代与分布式强化学习 pdf pdb 阿里云 极速 mobi caj kindle 下载

策略前展、策略迭代与分布式强化学习电子书下载地址
寄语:
本书目的是从作者近出版的《强化学习与控制》教科书中更深入地发展一些方法。特别是,提出了有关涉及多个代理,分区架构和分布式异步计算的系统的新研究。本书还将详细讨论该方法在挑战离散/组合优化问题(例
内容简介:
本书目的是从作者近出版的《强化学习预控制》教科书中更深入地发展一些方法。特别是,提出了有关涉及多个代理,分区架构和分布式异步计算的系统的新研究。本书还将详细讨论该方法在挑战离散/组合优化问题(例如路由,调度,分配和混合整数编程)中的应用,包括在这些情况下使用神经网络近似。
本书可作为计算机科学与技术、控制科学与技术、电子科学与技术等相关领域研究生和高年级本科生的教学参考书,也可供信息、通信、控制、优化等领域的科研人员参考。
书籍目录:
暂无相关目录,正在全力查找中!
作者介绍:
Dimitri P. Bertsekas,德梅萃 P.博塞克斯(Dimitri P. Bertseka),美国MIT终身教授,美国国家工程院院士,清华大学复杂与网络化系统研究中心客座教授。电气工程与计算机科学领域国际知名作者,著有《非线性规划》《网络优化》《动态规划》《凸优化》《强化学习与控制》等十几本畅销教材和专著。
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
编辑推荐
读者通过本书可以了解强化学习中策略迭代,特别是Rollout方法在分布式和多智能体框架下的进展和应用。本书可用作人工智能或系统与控制科学等相关专业的高年级本科生或研究生作为一个学期的课程教材。也适用于开展相关研究工作的专业技术人员作为参考书阅读。
前言
本书作者德梅萃·P.博赛卡斯(Dimitri P.Bertsekas)是美国麻省理工学院教授和亚利桑那州立大学教授,也是美国工程院院士。本书是作者近年来相关研究成果的总结。
强化学习,也称为近似动态规划、神经元动态规划。本书的内容围绕强化学习中的策略迭代这一核心概念展开。策略迭代指从某个策略出发,不断产生改进策略的过程。如果仅仅生成一步改进策略,就称为策略前展(Rollout)。大量经验表明,策略前展是当前用得广、为可靠的强化学习方法之一。主要内容: 第1章为动态规划原理; 第2章为策略前展与策略改进; 第3章为专用策略前展算法; 第4章为值和策略的学习; 第5章为无限时间分布式和多智能体算法。
横空出世的围棋软件AlphaZero算法对本书有很大影响。本书内容同样基于策略迭代、值网络和策略网络的神经网络近似表示、并行与分布式计算和前瞻小化约简技术的核心框架构建,并对算法的适用范围做了拓展。本书的特色在于给出了分布式计算和多智能体系统框架下的强化学习策略改进计算的效率提升技术,建立了一步策略改进策略前展方法同控制系统中广泛使用的模型预测控制(MPC)设计方法之间的联系,并描述了策略前展方法在复杂离散和组合优化问题方面的应用。
通过阅读本书,读者可以了解强化学习中的策略迭代,特别是策略前展方法在分布式和多智能体框架下的进展和应用。本书可用作人工智能或系统与控制科学等相关专业的高年级本科生或研究生的教材,也适合开展相关研究工作的专业技术人员作为参考书。
赵千川
清华大学自动化系教授
清华大学智能与网络化系统研究中心主任
2021年10月
网站评分
书籍多样性:3分
书籍信息完全性:9分
网站更新速度:6分
使用便利性:9分
书籍清晰度:8分
书籍格式兼容性:4分
是否包含广告:8分
加载速度:9分
安全性:5分
稳定性:6分
搜索功能:7分
下载便捷性:3分
下载点评
- 愉快的找书体验(184+)
- epub(342+)
- 体验差(449+)
- 章节完整(381+)
- 购买多(354+)
- 一星好评(143+)
- 目录完整(429+)
- 图文清晰(338+)
- azw3(423+)
- 书籍完整(348+)
- 快捷(616+)
下载评价
- 网友 方***旋:
真的很好,里面很多小说都能搜到,但就是收费的太多了
- 网友 车***波:
很好,下载出来的内容没有乱码。
- 网友 晏***媛:
够人性化!
- 网友 师***怡:
说的好不如用的好,真心很好。越来越完美
- 网友 龚***湄:
差评,居然要收费!!!
- 网友 菱***兰:
特好。有好多书
- 网友 宫***玉:
我说完了。
- 网友 陈***秋:
不错,图文清晰,无错版,可以入手。
- 网友 薛***玉:
就是我想要的!!!
- 网友 隗***杉:
挺好的,还好看!支持!快下载吧!
- 网友 辛***玮:
页面不错 整体风格喜欢
- 网友 游***钰:
用了才知道好用,推荐!太好用了
喜欢"策略前展、策略迭代与分布式强化学习"的人也看了
草书诗卷-王铎书法类编 pdf pdb 阿里云 极速 mobi caj kindle 下载
论数据要素市场 pdf pdb 阿里云 极速 mobi caj kindle 下载
高考帮 语文 (2019版)--天星教育 pdf pdb 阿里云 极速 mobi caj kindle 下载
2015华图河南省公务员培训内部指定教材内部教案申论公务员考试用书2015省考 pdf pdb 阿里云 极速 mobi caj kindle 下载
全国计算机等级考试-二级Visual Basic语言程序设计历年真题与模拟试题详解 pdf pdb 阿里云 极速 mobi caj kindle 下载
步步娇 pdf pdb 阿里云 极速 mobi caj kindle 下载
2012最新版北京市公务员录用考试专用教材-行政职业能力倾向测验标准预测试卷 pdf pdb 阿里云 极速 mobi caj kindle 下载
Visual FoxPro 6.0程序设计 pdf pdb 阿里云 极速 mobi caj kindle 下载
逻辑考点精讲 2024(全2册) 西安交通大学出版社 pdf pdb 阿里云 极速 mobi caj kindle 下载
物流成本管理 pdf pdb 阿里云 极速 mobi caj kindle 下载
- 海外直订Unicorn Cupcake Coloring Book for Kids 4-8 Years: Fantasy Story with C 独角兽纸杯蛋糕4-8岁儿童彩绘书:男孩、女孩、幼儿 pdf pdb 阿里云 极速 mobi caj kindle 下载
- 9787313097767 pdf pdb 阿里云 极速 mobi caj kindle 下载
- 同学,咱们聊一聊青少年赌博 pdf pdb 阿里云 极速 mobi caj kindle 下载
- 高效能家庭+高效能人士七个习惯(30周年)经典套装 pdf pdb 阿里云 极速 mobi caj kindle 下载
- 中国政法大学图书馆资源与服务报告(2017) pdf pdb 阿里云 极速 mobi caj kindle 下载
- 建设工程法规及相关知识 pdf pdb 阿里云 极速 mobi caj kindle 下载
- 【预订】In Real Life pdf pdb 阿里云 极速 mobi caj kindle 下载
- 学画水果全套12册宝宝涂色书0-2-3-4-5-6岁宝宝学画画书涂色本宝宝涂鸦本简笔画 pdf pdb 阿里云 极速 mobi caj kindle 下载
- 地球飞船 pdf pdb 阿里云 极速 mobi caj kindle 下载
- 人一生要知道的中国 pdf pdb 阿里云 极速 mobi caj kindle 下载
书籍真实打分
故事情节:6分
人物塑造:5分
主题深度:7分
文字风格:4分
语言运用:4分
文笔流畅:4分
思想传递:9分
知识深度:6分
知识广度:9分
实用性:8分
章节划分:3分
结构布局:4分
新颖与独特:9分
情感共鸣:8分
引人入胜:4分
现实相关:5分
沉浸感:7分
事实准确性:3分
文化贡献:5分