成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
51
深度强化学习
·
麻省理工学院 (MIT)
·
2022 年 4 月 24 日
通俗易懂!MIT《深度强化学习》课程,附Slides与视频
专知AI搜索
专知会员服务
专知,提供专业可信的知识分发服务,让认知协作更快更好!
MIT最新深度学习课程关于《深度强化学习课程》,附Slides与视频。
成为VIP会员查看完整内容
http://introtodeeplearning.com/
【Slides】Deep Reinforcement Learning
【Video】MIT 6.S191: Reinforcement Learning
点赞并收藏
51
暂时没有读者
72
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:
[email protected]
),我们会尽快为您处理
相关内容
深度强化学习
关注
156
深度强化学习 (DRL) 是一种使用深度学习技术扩展传统强化学习方法的一种机器学习方法。 传统强化学习方法的主要任务是使得主体根据从环境中获得的奖赏能够学习到最大化奖赏的行为。然而,传统无模型强化学习方法需要使用函数逼近技术使得主体能够学习出值函数或者策略。在这种情况下,深度学习强大的函数逼近能力自然成为了替代人工指定特征的最好手段并为性能更好的端到端学习的实现提供了可能。
李宏毅《机器学习》国语课程(2022)来了!附Slides和视频!
专知会员服务
103+阅读 · 2022年2月28日
斯坦福大学最新【强化学习】2022课程,含ppt
专知会员服务
133+阅读 · 2022年2月27日
【伯克利-Pieter Abbeel】深度强化学习基础,附slides与视频
专知会员服务
29+阅读 · 2021年8月26日
《深度学习局限性与前沿》教程77页ppt,麻省理工2021深度学习导论课程MIT6.S191课程
专知会员服务
54+阅读 · 2021年3月15日
《深度强化学习》教程62页ppt,麻省理工2021深度学习导论课程MIT6.S191课程
专知会员服务
47+阅读 · 2021年3月8日
《深度生成式建模》教程71页ppt,麻省理工2021深度学习导论课程MIT6.S191,课程
专知会员服务
45+阅读 · 2021年3月2日
李宏毅《机器学习》国语课程(2021)来了!附Slides和视频!
专知会员服务
95+阅读 · 2021年3月1日
《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放(附下载)
专知会员服务
148+阅读 · 2019年12月25日
【课程】《终身学习、可解释ML、异常检测、对抗攻击》一览讲解,台大李宏毅老师2019机器学习课程讲义PPT
专知会员服务
84+阅读 · 2019年10月29日
MIT新书《强化学习与最优控制》
专知会员服务
282+阅读 · 2019年10月9日
李宏毅《机器学习》国语课程(2022)来了!附Slides和视频!
专知
5+阅读 · 2022年2月28日
中文课程!台大李宏毅机器学习公开课2019版上线
全球人工智能
14+阅读 · 2019年3月18日
从入门到精通-Tensorflow深度强化学习课程
深度学习与NLP
23+阅读 · 2019年3月7日
《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放(附下载)
专知
52+阅读 · 2019年1月3日
【伯克利《人工智能导论》(2018)课程 视频+资料】
专知
18+阅读 · 2018年12月31日
资源 | 台大李宏毅教授最新课程,深度强化学习有国语版啦!
大数据文摘
20+阅读 · 2018年6月13日
资源 | UC Berkeley CS 294深度强化学习课程(附视频、学习资料)
数据派THU
21+阅读 · 2018年4月7日
2018斯坦福CS 20深度学习Tensorflow实战课程(附PPT下载)
专知
28+阅读 · 2018年1月13日
【干货】台大李宏毅两个小时带你纵览自然语言处理和语音内容机器理解,附全程视频PPT下载
专知
19+阅读 · 2017年11月27日
【教程】AlphaGo Zero 核心技术 - David Silver深度强化学习课程中文学习笔记
专知
126+阅读 · 2017年10月19日
量子算法理论专题讲习班
国家自然科学基金
16+阅读 · 2017年12月31日
数学天元基金统计学研究生暑期学校2015
国家自然科学基金
2+阅读 · 2015年5月31日
信息论学习中的正则化及相关高维数据分析方法的数学理论
国家自然科学基金
12+阅读 · 2014年12月31日
基于全氧富氢炼铁新工艺的焦炭劣化机理研究
国家自然科学基金
0+阅读 · 2014年12月31日
MOOC数据模型及其对课程与学习评价的效用研究
国家自然科学基金
4+阅读 · 2014年12月31日
无爪图及其扩展图的因子的研究
国家自然科学基金
0+阅读 · 2014年12月31日
基于多尺度理论的混凝土多轴力学性能尺寸效应研究
国家自然科学基金
0+阅读 · 2013年12月31日
几类半群在图论和形式语言学中的应用
国家自然科学基金
0+阅读 · 2013年12月31日
面向量子消息的公钥密码学
国家自然科学基金
0+阅读 · 2011年12月31日
受火灾作用预应力型钢混凝土组合结构的力学性能
国家自然科学基金
0+阅读 · 2009年12月31日
Scalable Deep Gaussian Markov Random Fields for General Graphs
Arxiv
6+阅读 · 2022年6月10日
CGIBNet: Bandwidth-constrained Communication with Graph Information Bottleneck in Multi-Agent Reinforcement Learning
Arxiv
0+阅读 · 2022年6月10日
VideoINR: Learning Video Implicit Neural Representation for Continuous Space-Time Super-Resolution
Arxiv
0+阅读 · 2022年6月9日
Experience report of physics-informed neural networks in fluid simulations: pitfalls and frustration
Arxiv
0+阅读 · 2022年6月8日
Neural Bellman-Ford Networks: A General Graph Neural Network Framework for Link Prediction
Arxiv
21+阅读 · 2021年6月16日
Deep Graph Structure Learning for Robust Representations: A Survey
Arxiv
21+阅读 · 2021年3月4日
OntoZSL: Ontology-enhanced Zero-shot Learning
Arxiv
17+阅读 · 2021年2月15日
Efficiently Embedding Dynamic Knowledge Graphs
Arxiv
14+阅读 · 2019年10月15日
Graph Signal Processing -- Part II: Processing and Analyzing Signals on Graphs
Arxiv
16+阅读 · 2019年9月23日
A Multi-Objective Deep Reinforcement Learning Framework
Arxiv
17+阅读 · 2018年6月27日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
深度强化学习
麻省理工学院 (MIT)
最新内容
《利用大语言模型增强多域作战兵棋推演》(报告)
专知会员服务
10+阅读 · 4月18日
《增强准备状态与战备水平:态势感知与数据驱动决策》报告
专知会员服务
9+阅读 · 4月18日
中文版《可靠定位、导航与授时 (APNT):美军相关研发项目》报告
专知会员服务
8+阅读 · 4月18日
《自主武器系统人类-AI指挥控制中的动态管理》(2026最新450页)
专知会员服务
14+阅读 · 4月18日
美智库《实现空军战斗出动架次生成能力:对目标、差距、障碍与解决方案的审视》(报告)
专知会员服务
7+阅读 · 4月18日
《大规模作战行动中争夺情报优势:情报与电子战营-下一代角色探析》(报告)
专知会员服务
9+阅读 · 4月18日
人工智能在战场行动中的演进及伊朗案例
专知会员服务
7+阅读 · 4月18日
美AI公司Anthropic推出网络安全模型“Mythos”
专知会员服务
4+阅读 · 4月18日
【博士论文】面向城市环境的可解释计算机视觉
专知会员服务
5+阅读 · 4月18日
【CVPR2026】SEATrack:一种简明、高效且具备自适应能力的多模态跟踪器
专知会员服务
4+阅读 · 4月18日
大语言模型的自改进机制:技术综述与未来展望
专知会员服务
7+阅读 · 4月18日
《面向战术决策的广义智能:大语言模型驱动的动态武器-目标分配》
专知会员服务
11+阅读 · 4月18日
《分布式军事人工智能理论:部分可观测与通信条件下的协调约束多智能体强化学习》
专知会员服务
11+阅读 · 4月18日
《第四代军事特种作战部队选拔与评估》
专知会员服务
3+阅读 · 4月18日
《迈向可解释强化学习及面向战略决策的定制化学习基准》(70页)
专知会员服务
6+阅读 · 4月18日
相关VIP内容
李宏毅《机器学习》国语课程(2022)来了!附Slides和视频!
专知会员服务
103+阅读 · 2022年2月28日
斯坦福大学最新【强化学习】2022课程,含ppt
专知会员服务
133+阅读 · 2022年2月27日
【伯克利-Pieter Abbeel】深度强化学习基础,附slides与视频
专知会员服务
29+阅读 · 2021年8月26日
《深度学习局限性与前沿》教程77页ppt,麻省理工2021深度学习导论课程MIT6.S191课程
专知会员服务
54+阅读 · 2021年3月15日
《深度强化学习》教程62页ppt,麻省理工2021深度学习导论课程MIT6.S191课程
专知会员服务
47+阅读 · 2021年3月8日
《深度生成式建模》教程71页ppt,麻省理工2021深度学习导论课程MIT6.S191,课程
专知会员服务
45+阅读 · 2021年3月2日
李宏毅《机器学习》国语课程(2021)来了!附Slides和视频!
专知会员服务
95+阅读 · 2021年3月1日
《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放(附下载)
专知会员服务
148+阅读 · 2019年12月25日
【课程】《终身学习、可解释ML、异常检测、对抗攻击》一览讲解,台大李宏毅老师2019机器学习课程讲义PPT
专知会员服务
84+阅读 · 2019年10月29日
MIT新书《强化学习与最优控制》
专知会员服务
282+阅读 · 2019年10月9日
热门VIP内容
开通专知VIP会员 享更多权益服务
《增强准备状态与战备水平:态势感知与数据驱动决策》报告
《自主武器系统人类-AI指挥控制中的动态管理》(2026最新450页)
《利用大语言模型增强多域作战兵棋推演》(报告)
中文版《可靠定位、导航与授时 (APNT):美军相关研发项目》报告
相关资讯
李宏毅《机器学习》国语课程(2022)来了!附Slides和视频!
专知
5+阅读 · 2022年2月28日
中文课程!台大李宏毅机器学习公开课2019版上线
全球人工智能
14+阅读 · 2019年3月18日
从入门到精通-Tensorflow深度强化学习课程
深度学习与NLP
23+阅读 · 2019年3月7日
《DeepMind深度学习与强化学习进阶》850页ppt课件与视频开放(附下载)
专知
52+阅读 · 2019年1月3日
【伯克利《人工智能导论》(2018)课程 视频+资料】
专知
18+阅读 · 2018年12月31日
资源 | 台大李宏毅教授最新课程,深度强化学习有国语版啦!
大数据文摘
20+阅读 · 2018年6月13日
资源 | UC Berkeley CS 294深度强化学习课程(附视频、学习资料)
数据派THU
21+阅读 · 2018年4月7日
2018斯坦福CS 20深度学习Tensorflow实战课程(附PPT下载)
专知
28+阅读 · 2018年1月13日
【干货】台大李宏毅两个小时带你纵览自然语言处理和语音内容机器理解,附全程视频PPT下载
专知
19+阅读 · 2017年11月27日
【教程】AlphaGo Zero 核心技术 - David Silver深度强化学习课程中文学习笔记
专知
126+阅读 · 2017年10月19日
相关基金
量子算法理论专题讲习班
国家自然科学基金
16+阅读 · 2017年12月31日
数学天元基金统计学研究生暑期学校2015
国家自然科学基金
2+阅读 · 2015年5月31日
信息论学习中的正则化及相关高维数据分析方法的数学理论
国家自然科学基金
12+阅读 · 2014年12月31日
基于全氧富氢炼铁新工艺的焦炭劣化机理研究
国家自然科学基金
0+阅读 · 2014年12月31日
MOOC数据模型及其对课程与学习评价的效用研究
国家自然科学基金
4+阅读 · 2014年12月31日
无爪图及其扩展图的因子的研究
国家自然科学基金
0+阅读 · 2014年12月31日
基于多尺度理论的混凝土多轴力学性能尺寸效应研究
国家自然科学基金
0+阅读 · 2013年12月31日
几类半群在图论和形式语言学中的应用
国家自然科学基金
0+阅读 · 2013年12月31日
面向量子消息的公钥密码学
国家自然科学基金
0+阅读 · 2011年12月31日
受火灾作用预应力型钢混凝土组合结构的力学性能
国家自然科学基金
0+阅读 · 2009年12月31日
相关论文
Scalable Deep Gaussian Markov Random Fields for General Graphs
Arxiv
6+阅读 · 2022年6月10日
CGIBNet: Bandwidth-constrained Communication with Graph Information Bottleneck in Multi-Agent Reinforcement Learning
Arxiv
0+阅读 · 2022年6月10日
VideoINR: Learning Video Implicit Neural Representation for Continuous Space-Time Super-Resolution
Arxiv
0+阅读 · 2022年6月9日
Experience report of physics-informed neural networks in fluid simulations: pitfalls and frustration
Arxiv
0+阅读 · 2022年6月8日
Neural Bellman-Ford Networks: A General Graph Neural Network Framework for Link Prediction
Arxiv
21+阅读 · 2021年6月16日
Deep Graph Structure Learning for Robust Representations: A Survey
Arxiv
21+阅读 · 2021年3月4日
OntoZSL: Ontology-enhanced Zero-shot Learning
Arxiv
17+阅读 · 2021年2月15日
Efficiently Embedding Dynamic Knowledge Graphs
Arxiv
14+阅读 · 2019年10月15日
Graph Signal Processing -- Part II: Processing and Analyzing Signals on Graphs
Arxiv
16+阅读 · 2019年9月23日
A Multi-Objective Deep Reinforcement Learning Framework
Arxiv
17+阅读 · 2018年6月27日
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top