RLChina 暑期课是由 UCL 汪军老师发起,所有参与教师共同分享给广大强化学习爱好者的免费网络直播课程。2020 年的课程吸引了超过 3 千名报名学员,获得了广泛的好评。今年,RLChina 暑期课全新升级,20 位来自全球顶级高校和企业的强化学习专家共同为大家讲解从入门到前沿的强化学习知识,此外还准备了习题课、智能体竞赛日、决策智能创业日帮助大家全方位地接触强化学习落地实践。

成为VIP会员查看完整内容
102

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
47+阅读 · 2021年5月13日
不可错过!CMU《深度学习导论》2020课程,附课件与视频
专知会员服务
80+阅读 · 2020年10月27日
从入门到精通-Tensorflow深度强化学习课程
深度学习与NLP
23+阅读 · 2019年3月7日
带学吴恩达机器学习课程和作业,带打Kaggle全球顶级大赛
OpenAI强化学习实战
炼数成金订阅号
9+阅读 · 2018年5月14日
【深度强化学习】深度强化学习揭秘
产业智能官
21+阅读 · 2017年11月13日
Reinforcement Learning for Systematic FX Trading
Arxiv
0+阅读 · 2021年10月15日
Arxiv
0+阅读 · 2021年10月14日
The Measure of Intelligence
Arxiv
9+阅读 · 2019年11月5日
Adversarial Transfer Learning
Arxiv
12+阅读 · 2018年12月6日
Arxiv
4+阅读 · 2018年12月3日
VIP会员
最新内容
最新“指挥控制”领域出版物合集(简介)
专知会员服务
1+阅读 · 今天15:19
面向军事作战需求开发的人工智能(RAIMOND)
专知会员服务
3+阅读 · 今天15:13
软件定义多域战术网络:基础与未来方向(综述)
水下战战术决策中的气象与海洋预报(50页报告)
远程空中优势:新一代超视距导弹的兴起
专知会员服务
1+阅读 · 今天14:45
大语言模型溯因推理的统一分类学与综述
专知会员服务
0+阅读 · 今天12:07
相关资讯
从入门到精通-Tensorflow深度强化学习课程
深度学习与NLP
23+阅读 · 2019年3月7日
带学吴恩达机器学习课程和作业,带打Kaggle全球顶级大赛
OpenAI强化学习实战
炼数成金订阅号
9+阅读 · 2018年5月14日
【深度强化学习】深度强化学习揭秘
产业智能官
21+阅读 · 2017年11月13日
微信扫码咨询专知VIP会员