现代人工智能(AI)系统通常需要在一个未知的、不确定的、可能敌对的环境中,通过积极地与环境交互来收集相关数据,从而做出连续的决策。强化学习(RL)是一个通用框架,可以捕获交互式学习设置,并已被用于设计智能代理,以实现超人水平的表现,在具有挑战性的任务,如围棋,电脑游戏,机器人操作。

这门研究生水平的课程着重于强化学习的理论和算法基础。本课程的四个主题为: (1)可证明有效的探索; (2)策略优化(特别是策略梯度); (3)控制; (4)模仿学习。

通过本课程,学生将能够理解经典的和最新的可证明正确的RL算法及其分析。学生将能够对与RL相关的课题进行研究。

成为VIP会员查看完整内容
70

相关内容

最新《深度强化学习中的迁移学习》综述论文
专知会员服务
157+阅读 · 2020年9月20日
专知会员服务
55+阅读 · 2020年9月7日
最新《统计机器学习》课程,26页ppt
专知会员服务
82+阅读 · 2020年8月30日
《强化学习》简介小册,24页pdf
专知会员服务
282+阅读 · 2020年4月19日
【斯坦福新课】CS234:强化学习,附课程PPT下载
专知会员服务
124+阅读 · 2020年1月15日
【强化学习】深度强化学习初学者指南
专知会员服务
184+阅读 · 2019年12月14日
强化学习精品书籍
平均机器
26+阅读 · 2019年1月2日
深度强化学习入门,这一篇就够了!
机器学习算法与Python学习
28+阅读 · 2018年8月17日
OpenAI强化学习实战
炼数成金订阅号
9+阅读 · 2018年5月14日
【强化学习】强化学习/增强学习/再励学习介绍
产业智能官
10+阅读 · 2018年2月23日
【强化学习】强化学习入门以及代码实现
产业智能官
18+阅读 · 2017年9月4日
Generalization and Regularization in DQN
Arxiv
6+阅读 · 2019年1月30日
A Multi-Objective Deep Reinforcement Learning Framework
VIP会员
相关主题
最新内容
扭曲还是编造?视频大语言模型幻觉研究综述
专知会员服务
0+阅读 · 9分钟前
《采用系统思维应对混合战争》125页
专知会员服务
0+阅读 · 今天12:47
战争机器学习:数据生态系统构建(155页)
专知会员服务
6+阅读 · 今天8:10
内省扩散语言模型
专知会员服务
5+阅读 · 4月14日
国外反无人机系统与技术动态
专知会员服务
3+阅读 · 4月14日
大规模作战行动中的战术作战评估(研究论文)
未来的海战无人自主系统
专知会员服务
3+阅读 · 4月14日
相关VIP内容
最新《深度强化学习中的迁移学习》综述论文
专知会员服务
157+阅读 · 2020年9月20日
专知会员服务
55+阅读 · 2020年9月7日
最新《统计机器学习》课程,26页ppt
专知会员服务
82+阅读 · 2020年8月30日
《强化学习》简介小册,24页pdf
专知会员服务
282+阅读 · 2020年4月19日
【斯坦福新课】CS234:强化学习,附课程PPT下载
专知会员服务
124+阅读 · 2020年1月15日
【强化学习】深度强化学习初学者指南
专知会员服务
184+阅读 · 2019年12月14日
相关资讯
强化学习精品书籍
平均机器
26+阅读 · 2019年1月2日
深度强化学习入门,这一篇就够了!
机器学习算法与Python学习
28+阅读 · 2018年8月17日
OpenAI强化学习实战
炼数成金订阅号
9+阅读 · 2018年5月14日
【强化学习】强化学习/增强学习/再励学习介绍
产业智能官
10+阅读 · 2018年2月23日
【强化学习】强化学习入门以及代码实现
产业智能官
18+阅读 · 2017年9月4日
微信扫码咨询专知VIP会员