嘉宾:Pieter Abbeel ,加州大学伯克利分校机器人学习实验室主任,人工智能实验室联合主任、covariant.ai 和 Gradescope 联合创始人

在这次演讲中,我将分享我对如何为机器人实现大型预训练神经网络的想法,就像GPT-x/BERT等预训练模型在NLP中被标准使用的方式一样。我列出了我们如何在无监督表征学习、无监督(无奖励)强化学习(RL)预训练、人在循环中的RL和少样本模仿学习等方面取得实质性的研究进展。

成为VIP会员查看完整内容
29

相关内容

机器人(英语:Robot)包括一切模拟人类行为或思想与模拟其他生物的机械(如机器狗,机器猫等)。狭义上对机器人的定义还有很多分类法及争议,有些电脑程序甚至也被称为机器人。在当代工业中,机器人指能自动运行任务的人造机器设备,用以取代或协助人类工作,一般会是机电设备,由计算机程序或是电子电路控制。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【DeepMind】多模态预训练模型概述,37页ppt
专知会员服务
95+阅读 · 2021年7月2日
UC伯克利Pieter Abbeel谈论强化学习-视频
专知
7+阅读 · 2018年12月17日
Arxiv
8+阅读 · 2021年5月20日
Arxiv
3+阅读 · 2018年1月31日
Arxiv
3+阅读 · 2017年7月6日
VIP会员
最新内容
战略前沿人工智能的再思考(中文)
专知会员服务
3+阅读 · 5月29日
《量化地基防空系统间接效应的博弈论方法》
专知会员服务
3+阅读 · 5月29日
“史诗怒火行动”中美军损失的作战飞机
专知会员服务
2+阅读 · 5月29日
ICML 2026 | 理解上下文持续学习中的泛化与遗忘
专知会员服务
5+阅读 · 5月28日
Agent Harness综述:大模型智能体执行器工程全景
专知会员服务
13+阅读 · 5月28日
《基于理论的威慑效能评估》
专知会员服务
8+阅读 · 5月28日
相关VIP内容
【DeepMind】多模态预训练模型概述,37页ppt
专知会员服务
95+阅读 · 2021年7月2日
微信扫码咨询专知VIP会员