在 Hugging Face,我们正在为深度强化学习的研究人员和爱好者的生态系统做出贡献。最近,我们集成了Deep RL框架,比如Stable-Baselines3。

今天,我们很高兴地宣布,我们将Decision Transformer(一种离线强化学习方法)集成到🤗Transformer库和拥抱面部中心中。我们有一些令人兴奋的计划来提高Deep RL领域的可访问性,我们期待着在未来的几周和几个月与您分享。

什么是离线强化学习? 引入 决策 Transformers 使用🤗Transformer中的Decision Transformer 结论 接下来是什么? 参考文献

成为VIP会员查看完整内容
68

相关内容

最新《Transformers模型》教程,64页ppt
专知会员服务
326+阅读 · 2020年11月26日
数据科学导论,54页ppt,Introduction to Data Science
专知会员服务
43+阅读 · 2020年7月27日
中科大《数据科学导论》课程
专知
7+阅读 · 2021年10月17日
为你推荐一份深度学习书单,来学习吧~
THU数据派
12+阅读 · 2018年3月13日
国家自然科学基金
1+阅读 · 2018年9月23日
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
5+阅读 · 2015年7月12日
国家自然科学基金
2+阅读 · 2015年5月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Risk and optimal policies in bandit experiments
Arxiv
0+阅读 · 2022年4月18日
Arxiv
19+阅读 · 2020年12月23日
VIP会员
最新内容
《通往人工通用智能之路上的均衡策略》
专知会员服务
1+阅读 · 今天14:22
《人工智能与军事整合:现状与未来风险》报告
专知会员服务
1+阅读 · 今天14:12
《Palantir的科技生态系统》
专知会员服务
14+阅读 · 6月2日
《反无人机系统传感器融合》90页报告
专知会员服务
16+阅读 · 6月2日
运用人工智能与卫星通信驱散“战争迷雾”
专知会员服务
7+阅读 · 6月2日
综述 | OPSD:大语言模型的在线策略自蒸馏
专知会员服务
7+阅读 · 6月1日
相关VIP内容
相关基金
国家自然科学基金
1+阅读 · 2018年9月23日
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
5+阅读 · 2015年7月12日
国家自然科学基金
2+阅读 · 2015年5月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员