在 Hugging Face,我们正在为深度强化学习的研究人员和爱好者的生态系统做出贡献。最近,我们集成了Deep RL框架,比如Stable-Baselines3。

今天,我们很高兴地宣布,我们将Decision Transformer(一种离线强化学习方法)集成到🤗Transformer库和拥抱面部中心中。我们有一些令人兴奋的计划来提高Deep RL领域的可访问性,我们期待着在未来的几周和几个月与您分享。

什么是离线强化学习? 引入 决策 Transformers 使用🤗Transformer中的Decision Transformer 结论 接下来是什么? 参考文献

成为VIP会员查看完整内容
68

相关内容

最新《Transformers模型》教程,64页ppt
专知会员服务
326+阅读 · 2020年11月26日
数据科学导论,54页ppt,Introduction to Data Science
专知会员服务
42+阅读 · 2020年7月27日
中科大《数据科学导论》课程
专知
7+阅读 · 2021年10月17日
为你推荐一份深度学习书单,来学习吧~
THU数据派
12+阅读 · 2018年3月13日
国家自然科学基金
1+阅读 · 2018年9月23日
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
5+阅读 · 2015年7月12日
国家自然科学基金
2+阅读 · 2015年5月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Risk and optimal policies in bandit experiments
Arxiv
0+阅读 · 2022年4月18日
Arxiv
19+阅读 · 2020年12月23日
VIP会员
最新内容
大规模作战行动中的战术作战评估(研究论文)
专知会员服务
0+阅读 · 22分钟前
未来的海战无人自主系统
专知会员服务
0+阅读 · 38分钟前
美军多域作战现状分析:战略、概念还是幻想?
专知会员服务
0+阅读 · 51分钟前
无人机与反无人机系统(书籍)
专知会员服务
13+阅读 · 今天6:45
美陆军2026条令:安全与机动支援
专知会员服务
3+阅读 · 今天5:49
技术、多域威慑与海上战争(报告)
专知会员服务
8+阅读 · 4月13日
“在云端防御”:提升北约数据韧性(报告)
专知会员服务
5+阅读 · 4月13日
相关VIP内容
相关基金
国家自然科学基金
1+阅读 · 2018年9月23日
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
5+阅读 · 2015年7月12日
国家自然科学基金
2+阅读 · 2015年5月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员