世界模型正在迅速重塑人工智能,从被动感知世界的系统演变为能够在其内部进行模拟、推理和规划的引擎。本教程将探讨生成建模、自监督学习及多模态架构的最新进展如何使机器超越识别与预测,迈向心理模拟、反事实推理和决策制定。我们将剖析世界模型的基础原理,从视觉与多模态数据中学习动态的方法,以及规划与推理的整合机制。教程重点阐述视频生成、扩散模型、离散表示和具身智能之间的关联,同时讨论基础构建、因果性、物理一致性及评估等关键挑战。本教程面向研究人员、从业者和学生,旨在为构建对环境进行推理而非仅仅解释环境的人工智能系统提供概念性洞见与实践视角。我们的线下教程吸引了超过300名参与者。 14:00 - 14:10

开幕致辞:动机与概述 蔡宇钧 (Yujun Cai) 14:10 - 14:40

特邀报告:从思维链到状态链——为何有能力的模型必须反向预测世界 丹·孔德拉图克 (Dan Kondratyuk) 14:40 - 15:10

特邀报告:Genie 3 —— 生成交互式逼真世界 齐航 (Hang Qi) 15:10 - 15:50

特邀报告:面向物理一致的高效视觉世界模型 蔡剑飞 (Jianfei Cai) 15:50 - 16:20

特邀报告:VideoPhy —— 视频生成中的物理常识评估 张凯崴 (Kai-Wei Chang) 16:20 - 16:50

特邀报告:Cosmos 3 —— 面向物理AI的全能世界基础模型 刘明宇 (Ming-Yu Liu) 16:50 - 17:25

特邀报告:走向世界模型 —— 几何、视图合成与视觉推理 杨明轩 (Ming-Hsuan Yang)

成为VIP会员查看完整内容
7

相关内容

CVPR 2026教程:统一多模态模型走向收敛之路
专知会员服务
10+阅读 · 6月8日
从二维到三维认知:通用世界模型简要综述
专知会员服务
30+阅读 · 2025年6月26日
感知、推理、思考与规划:大型多模态推理模型综述
专知会员服务
40+阅读 · 2025年5月10日
【CVPR2022】以人为中心感知的多模态预训练
专知会员服务
30+阅读 · 2022年3月28日
多模态深度学习综述,18页pdf
专知
51+阅读 · 2020年3月29日
专访俞栋:多模态是迈向通用人工智能的重要方向
AI科技评论
27+阅读 · 2019年9月9日
【CVPR2019教程】视频理解中的图表示学习
专知
43+阅读 · 2019年6月20日
这可能是「多模态机器学习」最通俗易懂的介绍
计算机视觉life
113+阅读 · 2018年12月20日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
Arxiv
0+阅读 · 4月25日
VIP会员
最新内容
《多域战场上反制小型无人机系统》150页
专知会员服务
14+阅读 · 今天7:47
战场人工智能:增强陆地作战能力的发现与要求
专知会员服务
3+阅读 · 今天7:37
以人工智能为中心的指挥控制
专知会员服务
3+阅读 · 今天7:14
《基于深度强化学习的反无人机技术研究》178页
专知会员服务
13+阅读 · 6月10日
“史诗怒火”行动与“AI中心战”模式的浮现
专知会员服务
14+阅读 · 6月10日
【CVPR2026教程】扩散模型的解析理解
专知会员服务
6+阅读 · 6月10日
相关基金
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员