通俗易懂！MIT《深度强化学习》课程，附Slides与视频 - 专知VIP

会员服务 ·

51

深度强化学习 · 麻省理工学院 (MIT) ·

2022 年 4 月 24 日

通俗易懂！MIT《深度强化学习》课程，附Slides与视频

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

MIT最新深度学习课程关于《深度强化学习课程》，附Slides与视频。

成为VIP会员查看完整内容

72

相关内容

深度强化学习

深度强化学习

深度强化学习 (DRL) 是一种使用深度学习技术扩展传统强化学习方法的一种机器学习方法。传统强化学习方法的主要任务是使得主体根据从环境中获得的奖赏能够学习到最大化奖赏的行为。然而，传统无模型强化学习方法需要使用函数逼近技术使得主体能够学习出值函数或者策略。在这种情况下，深度学习强大的函数逼近能力自然成为了替代人工指定特征的最好手段并为性能更好的端到端学习的实现提供了可能。

李宏毅《机器学习》国语课程(2022)来了！附Slides和视频！

李宏毅《机器学习》国语课程(2022)来了！附Slides和视频！

专知会员服务

103+阅读 · 2022年2月28日

斯坦福大学最新【强化学习】2022课程，含ppt

斯坦福大学最新【强化学习】2022课程，含ppt

专知会员服务

136+阅读 · 2022年2月27日

【伯克利-Pieter Abbeel】深度强化学习基础，附slides与视频

专知会员服务

29+阅读 · 2021年8月26日

《深度学习局限性与前沿》教程77页ppt，麻省理工2021深度学习导论课程MIT6.S191课程

《深度学习局限性与前沿》教程77页ppt，麻省理工2021深度学习导论课程MIT6.S191课程

专知会员服务

54+阅读 · 2021年3月15日

《深度强化学习》教程62页ppt，麻省理工2021深度学习导论课程MIT6.S191课程

《深度强化学习》教程62页ppt，麻省理工2021深度学习导论课程MIT6.S191课程

专知会员服务

47+阅读 · 2021年3月8日

《深度生成式建模》教程71页ppt，麻省理工2021深度学习导论课程MIT6.S191,课程

《深度生成式建模》教程71页ppt，麻省理工2021深度学习导论课程MIT6.S191,课程

专知会员服务

45+阅读 · 2021年3月2日

李宏毅《机器学习》国语课程(2021)来了！附Slides和视频！

李宏毅《机器学习》国语课程(2021)来了！附Slides和视频！

专知会员服务

95+阅读 · 2021年3月1日

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

专知会员服务

148+阅读 · 2019年12月25日

【课程】《终身学习、可解释ML、异常检测、对抗攻击》一览讲解，台大李宏毅老师2019机器学习课程讲义PPT

【课程】《终身学习、可解释ML、异常检测、对抗攻击》一览讲解，台大李宏毅老师2019机器学习课程讲义PPT

专知会员服务

84+阅读 · 2019年10月29日

MIT新书《强化学习与最优控制》

MIT新书《强化学习与最优控制》

专知会员服务

283+阅读 · 2019年10月9日

李宏毅《机器学习》国语课程(2022)来了！附Slides和视频！

李宏毅《机器学习》国语课程(2022)来了！附Slides和视频！

专知

5+阅读 · 2022年2月28日

中文课程！台大李宏毅机器学习公开课2019版上线

中文课程！台大李宏毅机器学习公开课2019版上线

全球人工智能

14+阅读 · 2019年3月18日

从入门到精通-Tensorflow深度强化学习课程

从入门到精通-Tensorflow深度强化学习课程

深度学习与NLP

23+阅读 · 2019年3月7日

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

专知

52+阅读 · 2019年1月3日

【伯克利《人工智能导论》(2018)课程视频+资料】

【伯克利《人工智能导论》(2018)课程视频+资料】

专知

18+阅读 · 2018年12月31日

资源 | 台大李宏毅教授最新课程，深度强化学习有国语版啦！

资源 | 台大李宏毅教授最新课程，深度强化学习有国语版啦！

大数据文摘

20+阅读 · 2018年6月13日

资源 | UC Berkeley CS 294深度强化学习课程（附视频、学习资料）

资源 | UC Berkeley CS 294深度强化学习课程（附视频、学习资料）

数据派THU

21+阅读 · 2018年4月7日

2018斯坦福CS 20深度学习Tensorflow实战课程（附PPT下载）

2018斯坦福CS 20深度学习Tensorflow实战课程（附PPT下载）

专知

28+阅读 · 2018年1月13日

【干货】台大李宏毅两个小时带你纵览自然语言处理和语音内容机器理解，附全程视频PPT下载

【干货】台大李宏毅两个小时带你纵览自然语言处理和语音内容机器理解，附全程视频PPT下载

专知

19+阅读 · 2017年11月27日

【教程】AlphaGo Zero 核心技术 - David Silver深度强化学习课程中文学习笔记

【教程】AlphaGo Zero 核心技术 - David Silver深度强化学习课程中文学习笔记

专知

126+阅读 · 2017年10月19日

量子算法理论专题讲习班

国家自然科学基金

16+阅读 · 2017年12月31日

数学天元基金统计学研究生暑期学校2015

国家自然科学基金

2+阅读 · 2015年5月31日

信息论学习中的正则化及相关高维数据分析方法的数学理论

国家自然科学基金

12+阅读 · 2014年12月31日

基于全氧富氢炼铁新工艺的焦炭劣化机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

MOOC数据模型及其对课程与学习评价的效用研究

国家自然科学基金

4+阅读 · 2014年12月31日

无爪图及其扩展图的因子的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于多尺度理论的混凝土多轴力学性能尺寸效应研究

国家自然科学基金

0+阅读 · 2013年12月31日

几类半群在图论和形式语言学中的应用

国家自然科学基金

0+阅读 · 2013年12月31日

面向量子消息的公钥密码学

国家自然科学基金

0+阅读 · 2011年12月31日

受火灾作用预应力型钢混凝土组合结构的力学性能

国家自然科学基金

0+阅读 · 2009年12月31日

Scalable Deep Gaussian Markov Random Fields for General Graphs

Arxiv

6+阅读 · 2022年6月10日

CGIBNet: Bandwidth-constrained Communication with Graph Information Bottleneck in Multi-Agent Reinforcement Learning

Arxiv

0+阅读 · 2022年6月10日

VideoINR: Learning Video Implicit Neural Representation for Continuous Space-Time Super-Resolution

Arxiv

0+阅读 · 2022年6月9日

Experience report of physics-informed neural networks in fluid simulations: pitfalls and frustration

Arxiv

0+阅读 · 2022年6月8日

Neural Bellman-Ford Networks: A General Graph Neural Network Framework for Link Prediction

Arxiv

21+阅读 · 2021年6月16日

Deep Graph Structure Learning for Robust Representations: A Survey

Arxiv

21+阅读 · 2021年3月4日

OntoZSL: Ontology-enhanced Zero-shot Learning

Arxiv

17+阅读 · 2021年2月15日

Efficiently Embedding Dynamic Knowledge Graphs

Efficiently Embedding Dynamic Knowledge Graphs

Arxiv

14+阅读 · 2019年10月15日

Graph Signal Processing -- Part II: Processing and Analyzing Signals on Graphs

Graph Signal Processing -- Part II: Processing and Analyzing Signals on Graphs

Arxiv

16+阅读 · 2019年9月23日

A Multi-Objective Deep Reinforcement Learning Framework

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

17+阅读 · 2018年6月27日

VIP会员

相关主题

深度强化学习

麻省理工学院 (MIT)

最新内容

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

专知会员服务

4+阅读 · 7月23日

《基于强化学习的自动化红队测试》

《基于强化学习的自动化红队测试》

专知会员服务

3+阅读 · 7月23日

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

专知会员服务

6+阅读 · 7月23日

“天降毒雾”：无人机如何使化学战重返乌克兰战场

“天降毒雾”：无人机如何使化学战重返乌克兰战场

专知会员服务

2+阅读 · 7月23日

伊朗不对称防空战略的演进

伊朗不对称防空战略的演进

专知会员服务

4+阅读 · 7月23日

对抗环境下超视距目标打击的情报支援

对抗环境下超视距目标打击的情报支援

专知会员服务

10+阅读 · 7月22日

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

专知会员服务

4+阅读 · 7月22日

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

专知会员服务

8+阅读 · 7月22日

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

专知会员服务

10+阅读 · 7月22日

《无人机对海面作战影响评估》

《无人机对海面作战影响评估》

专知会员服务

15+阅读 · 7月21日

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

专知会员服务

14+阅读 · 7月21日

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

专知会员服务

4+阅读 · 7月21日

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

专知会员服务

6+阅读 · 7月21日

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

9+阅读 · 7月21日

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

7+阅读 · 7月20日

相关VIP内容

李宏毅《机器学习》国语课程(2022)来了！附Slides和视频！

李宏毅《机器学习》国语课程(2022)来了！附Slides和视频！

专知会员服务

103+阅读 · 2022年2月28日

斯坦福大学最新【强化学习】2022课程，含ppt

斯坦福大学最新【强化学习】2022课程，含ppt

专知会员服务

136+阅读 · 2022年2月27日

【伯克利-Pieter Abbeel】深度强化学习基础，附slides与视频

专知会员服务

29+阅读 · 2021年8月26日

《深度学习局限性与前沿》教程77页ppt，麻省理工2021深度学习导论课程MIT6.S191课程

《深度学习局限性与前沿》教程77页ppt，麻省理工2021深度学习导论课程MIT6.S191课程

专知会员服务

54+阅读 · 2021年3月15日

《深度强化学习》教程62页ppt，麻省理工2021深度学习导论课程MIT6.S191课程

《深度强化学习》教程62页ppt，麻省理工2021深度学习导论课程MIT6.S191课程

专知会员服务

47+阅读 · 2021年3月8日

《深度生成式建模》教程71页ppt，麻省理工2021深度学习导论课程MIT6.S191,课程

《深度生成式建模》教程71页ppt，麻省理工2021深度学习导论课程MIT6.S191,课程

专知会员服务

45+阅读 · 2021年3月2日

李宏毅《机器学习》国语课程(2021)来了！附Slides和视频！

李宏毅《机器学习》国语课程(2021)来了！附Slides和视频！

专知会员服务

95+阅读 · 2021年3月1日

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

专知会员服务

148+阅读 · 2019年12月25日

【课程】《终身学习、可解释ML、异常检测、对抗攻击》一览讲解，台大李宏毅老师2019机器学习课程讲义PPT

【课程】《终身学习、可解释ML、异常检测、对抗攻击》一览讲解，台大李宏毅老师2019机器学习课程讲义PPT

专知会员服务

84+阅读 · 2019年10月29日

MIT新书《强化学习与最优控制》

MIT新书《强化学习与最优控制》

专知会员服务

283+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

《基于强化学习的自动化红队测试》

“天降毒雾”：无人机如何使化学战重返乌克兰战场

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

相关资讯

李宏毅《机器学习》国语课程(2022)来了！附Slides和视频！

李宏毅《机器学习》国语课程(2022)来了！附Slides和视频！

专知

5+阅读 · 2022年2月28日

中文课程！台大李宏毅机器学习公开课2019版上线

中文课程！台大李宏毅机器学习公开课2019版上线

全球人工智能

14+阅读 · 2019年3月18日

从入门到精通-Tensorflow深度强化学习课程

从入门到精通-Tensorflow深度强化学习课程

深度学习与NLP

23+阅读 · 2019年3月7日

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放（附下载）

专知

52+阅读 · 2019年1月3日

【伯克利《人工智能导论》(2018)课程视频+资料】

【伯克利《人工智能导论》(2018)课程视频+资料】

专知

18+阅读 · 2018年12月31日

资源 | 台大李宏毅教授最新课程，深度强化学习有国语版啦！

资源 | 台大李宏毅教授最新课程，深度强化学习有国语版啦！

大数据文摘

20+阅读 · 2018年6月13日

资源 | UC Berkeley CS 294深度强化学习课程（附视频、学习资料）

资源 | UC Berkeley CS 294深度强化学习课程（附视频、学习资料）

数据派THU

21+阅读 · 2018年4月7日

2018斯坦福CS 20深度学习Tensorflow实战课程（附PPT下载）

2018斯坦福CS 20深度学习Tensorflow实战课程（附PPT下载）

专知

28+阅读 · 2018年1月13日

【干货】台大李宏毅两个小时带你纵览自然语言处理和语音内容机器理解，附全程视频PPT下载

【干货】台大李宏毅两个小时带你纵览自然语言处理和语音内容机器理解，附全程视频PPT下载

专知

19+阅读 · 2017年11月27日

【教程】AlphaGo Zero 核心技术 - David Silver深度强化学习课程中文学习笔记

【教程】AlphaGo Zero 核心技术 - David Silver深度强化学习课程中文学习笔记

专知

126+阅读 · 2017年10月19日

相关基金

量子算法理论专题讲习班

国家自然科学基金

16+阅读 · 2017年12月31日

数学天元基金统计学研究生暑期学校2015

国家自然科学基金

2+阅读 · 2015年5月31日

信息论学习中的正则化及相关高维数据分析方法的数学理论

国家自然科学基金

12+阅读 · 2014年12月31日

基于全氧富氢炼铁新工艺的焦炭劣化机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

MOOC数据模型及其对课程与学习评价的效用研究

国家自然科学基金

4+阅读 · 2014年12月31日

无爪图及其扩展图的因子的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于多尺度理论的混凝土多轴力学性能尺寸效应研究

国家自然科学基金

0+阅读 · 2013年12月31日

几类半群在图论和形式语言学中的应用

国家自然科学基金

0+阅读 · 2013年12月31日

面向量子消息的公钥密码学

国家自然科学基金

0+阅读 · 2011年12月31日

受火灾作用预应力型钢混凝土组合结构的力学性能

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Scalable Deep Gaussian Markov Random Fields for General Graphs

Arxiv

6+阅读 · 2022年6月10日

CGIBNet: Bandwidth-constrained Communication with Graph Information Bottleneck in Multi-Agent Reinforcement Learning

Arxiv

0+阅读 · 2022年6月10日

VideoINR: Learning Video Implicit Neural Representation for Continuous Space-Time Super-Resolution

Arxiv

0+阅读 · 2022年6月9日

Experience report of physics-informed neural networks in fluid simulations: pitfalls and frustration

Arxiv

0+阅读 · 2022年6月8日

Neural Bellman-Ford Networks: A General Graph Neural Network Framework for Link Prediction

Arxiv

21+阅读 · 2021年6月16日

Deep Graph Structure Learning for Robust Representations: A Survey

Arxiv

21+阅读 · 2021年3月4日

OntoZSL: Ontology-enhanced Zero-shot Learning

Arxiv

17+阅读 · 2021年2月15日

Efficiently Embedding Dynamic Knowledge Graphs

Efficiently Embedding Dynamic Knowledge Graphs

Arxiv

14+阅读 · 2019年10月15日

Graph Signal Processing -- Part II: Processing and Analyzing Signals on Graphs

Graph Signal Processing -- Part II: Processing and Analyzing Signals on Graphs

Arxiv

16+阅读 · 2019年9月23日

A Multi-Objective Deep Reinforcement Learning Framework

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

17+阅读 · 2018年6月27日

微信扫码咨询专知VIP会员