Human Cognition in Machines: A Unified Perspective of World Models - 专知论文

会员服务 ·

0

世界模型 · 近似 · 第一性原理 · 识别 · 内在动机 ·

Human Cognition in Machines: A Unified Perspective of World Models

翻译：机器中的人类认知：世界模型的统一视角

Timothy Rupprecht,Pu Zhao,Amir Taherin,Arash Akbari,Arman Akbari,Yumei He,Tooba Imtiaz,Sean Duffy,Juyi Lin,Yixiao Chen,Rahul Chowdhury,Enfu Nan,Yixin Shen,Yifan Cao,Haochen Zeng,Weiwei Chen,Geng Yuan,Jennifer Dy,Sarah Ostadabbas,Xuan Zhang,David Kaeli,Edmund Yeh,Yanzhi Wang

This report of world models distinguishes prior works by the cognitive functions they innovate. Many works claim an almost human-like cognitive capability in their world models. To evaluate these claims requires a proper grounding in first principles from human and machine cognition theory. In moving towards human-like world models we present a conceptual unified framework for world models that fully incorporates all the cognitive functions (i.e., memory, perception, language, reasoning, imagining, motivation, and metacognition) and identify gaps in existing research as a guide for future states of the art. In particular, we find that motivation (especially intrinsic motivation) and metacognition remain drastically under-researched, and we propose concrete directions to address these gaps informed by active inference and global workspace theory. We also introduce epistemic world models, a new category encompassing agent frameworks for scientific discovery that operate over structured knowledge. Our taxonomy, applied to video, embodied, and epistemic world models, suggests research directions where prior taxonomies have not.

翻译：本报告从认知功能创新的角度区分了现有世界模型研究工作。许多研究声称其世界模型具备近似人类水平的认知能力。要评估这些主张，需要从人类和机器认知理论的第一性原理出发建立适当基础。在迈向类人世界模型的过程中，我们提出了一个概念性统一框架，该框架完整整合了所有认知功能（包括记忆、感知、语言、推理、想象、动机和元认知），并识别出现有研究的空白领域，以指导未来前沿发展。我们发现动机（特别是内在动机）和元认知领域仍存在显著研究不足，并基于主动推理和全局工作空间理论提出了填补这些空白的具体方向。我们还引入了认知世界模型这一新类别，涵盖作用于结构化知识、用于科学发现的智能体框架。本文将提出的分类法应用于视频世界模型、具身世界模型和认知世界模型，指出了现有分类法尚未覆盖的研究方向。

0

相关内容

世界模型

综述 | 机器人操作世界模型：预测、行动接口与学习生命周期

综述 | 机器人操作世界模型：预测、行动接口与学习生命周期

专知会员服务

11+阅读 · 6月3日

从看见到认知世界：视觉世界模型综述

从看见到认知世界：视觉世界模型综述

专知会员服务

17+阅读 · 5月17日

从二维到三维认知：通用世界模型简要综述

从二维到三维认知：通用世界模型简要综述

专知会员服务

31+阅读 · 2025年6月26日

《人机编队：如何在人类与人工智能之间建立协同效应》140页书籍

《人机编队：如何在人类与人工智能之间建立协同效应》140页书籍

专知会员服务

48+阅读 · 2025年6月19日

认知机器的模型与结构研究进展

认知机器的模型与结构研究进展

专知会员服务

19+阅读 · 2025年5月5日

人机编队协作的共同认知改变了战争方式

人机编队协作的共同认知改变了战争方式

专知会员服务

27+阅读 · 2025年2月5日

《认知战模型：技术、人类、社会和环境的相互作用》

《认知战模型：技术、人类、社会和环境的相互作用》

专知会员服务

60+阅读 · 2024年12月13日

理解世界还是预测未来？世界模型的综合综述

理解世界还是预测未来？世界模型的综合综述

专知会员服务

78+阅读 · 2024年11月26日

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

专知会员服务

47+阅读 · 2024年8月11日

《人工智能之人机交互》报告重磅发布，展示AI+人机交互的酷炫现状与未来

《人工智能之人机交互》报告重磅发布，展示AI+人机交互的酷炫现状与未来

专知会员服务

54+阅读 · 2022年4月30日

【干货书】基于深度学习的机器人感知与认知，638页pdf

【干货书】基于深度学习的机器人感知与认知，638页pdf

专知

19+阅读 · 2022年7月30日

数据驱动的态势认知技术及发展思考

数据驱动的态势认知技术及发展思考

专知

20+阅读 · 2022年7月12日

《人工智能之认知图谱》重磅发布（附报告全文下载）

《人工智能之认知图谱》重磅发布（附报告全文下载）

学术头条

42+阅读 · 2020年8月28日

【人机融合智能】人机融合智能的现状与展望

【人机融合智能】人机融合智能的现状与展望

产业智能官

12+阅读 · 2020年3月18日

有关军事人机混合智能的再再思考

有关军事人机混合智能的再再思考

人工智能学家

22+阅读 · 2019年6月23日

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

专知

10+阅读 · 2019年1月18日

这可能是「多模态机器学习」最通俗易懂的介绍

这可能是「多模态机器学习」最通俗易懂的介绍

计算机视觉life

113+阅读 · 2018年12月20日

【混合智能】人机混合智能的哲学思考

【混合智能】人机混合智能的哲学思考

产业智能官

12+阅读 · 2018年10月28日

报名 | 让机器读懂你的意图——人体姿态估计入门

报名 | 让机器读懂你的意图——人体姿态估计入门

人工智能头条

10+阅读 · 2017年9月19日

一图了解人工智能知识体系大全-专知主题知识树人工智能可视化

一图了解人工智能知识体系大全-专知主题知识树人工智能可视化

专知

97+阅读 · 2017年9月18日

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

人类步行机理认知下的双足机器人步态与智能协同进化理论基础

国家自然科学基金

0+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

人类视空间分类的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

面向社群智能的认知网络中机会数据通信机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

定位系统细胞启发的机器人情景认知地图构建与行为规划研究

国家自然科学基金

3+阅读 · 2015年12月31日

融合认知机理的概率图模型表情识别方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

51+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

Critique of World Model: A Generative Latent Prediction Architecture for World Modeling

Arxiv

0+阅读 · 6月16日

Proprioceptive-visual correspondence enables self-other distinction in humanoid robots

Arxiv

0+阅读 · 6月11日

A Tutorial on World Models and Physical AI

Arxiv

0+阅读 · 6月11日

Human-AI Teaming Through the Lens of Calibration

Arxiv

0+阅读 · 6月9日

MIND-V: Hierarchical World Model for Long-Horizon Robotic Manipulation with RL-based Physical Alignment

Arxiv

0+阅读 · 6月9日

Unifying Object-Centric World Models and Diffusion Policy: A Hierarchical Framework for Multi-Stage Robotic Tasks

Arxiv

0+阅读 · 6月7日

Audio-Visual World Models: Grounding Multisensory Imagination for Embodied Agents

Arxiv

0+阅读 · 6月5日

A formal definition and meta-model for a machine theory of mind

Arxiv

0+阅读 · 6月2日

Towards Shared Embodied Intelligence in Humanoid Robots through Optimization Development and Testing of the Human Aware ergoCub Robot

Arxiv

0+阅读 · 5月26日

Human-AI Co-Evolution and Epistemic Collapse: A Dynamical Systems Perspective

Arxiv

0+阅读 · 5月7日

VIP会员

文章信息

相关主题

第一性原理

最新内容

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 今天4:35

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

3+阅读 · 今天4:24

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

3+阅读 · 今天4:18

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 今天4:15

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 今天4:08

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

7+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

7+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

“史诗怒火”行动：现代多域作战的重要节点

“史诗怒火”行动：现代多域作战的重要节点

专知会员服务

8+阅读 · 7月30日

《下一代无线网络中的多无人机通信资源管理》

《下一代无线网络中的多无人机通信资源管理》

专知会员服务

8+阅读 · 7月30日

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

专知会员服务

9+阅读 · 7月30日

《人机协同在安全关键型操作决策中的应用》120页

《人机协同在安全关键型操作决策中的应用》120页

专知会员服务

8+阅读 · 7月30日

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

专知会员服务

6+阅读 · 7月30日

相关VIP内容

综述 | 机器人操作世界模型：预测、行动接口与学习生命周期

综述 | 机器人操作世界模型：预测、行动接口与学习生命周期

专知会员服务

11+阅读 · 6月3日

从看见到认知世界：视觉世界模型综述

从看见到认知世界：视觉世界模型综述

专知会员服务

17+阅读 · 5月17日

从二维到三维认知：通用世界模型简要综述

从二维到三维认知：通用世界模型简要综述

专知会员服务

31+阅读 · 2025年6月26日

《人机编队：如何在人类与人工智能之间建立协同效应》140页书籍

《人机编队：如何在人类与人工智能之间建立协同效应》140页书籍

专知会员服务

48+阅读 · 2025年6月19日

认知机器的模型与结构研究进展

认知机器的模型与结构研究进展

专知会员服务

19+阅读 · 2025年5月5日

人机编队协作的共同认知改变了战争方式

人机编队协作的共同认知改变了战争方式

专知会员服务

27+阅读 · 2025年2月5日

《认知战模型：技术、人类、社会和环境的相互作用》

《认知战模型：技术、人类、社会和环境的相互作用》

专知会员服务

60+阅读 · 2024年12月13日

理解世界还是预测未来？世界模型的综合综述

理解世界还是预测未来？世界模型的综合综述

专知会员服务

78+阅读 · 2024年11月26日

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

专知会员服务

47+阅读 · 2024年8月11日

《人工智能之人机交互》报告重磅发布，展示AI+人机交互的酷炫现状与未来

《人工智能之人机交互》报告重磅发布，展示AI+人机交互的酷炫现状与未来

专知会员服务

54+阅读 · 2022年4月30日

热门VIP内容

开通专知VIP会员享更多权益服务

隐身技术前沿综述：物理机理、工程实践与战略展望

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

相关资讯

【干货书】基于深度学习的机器人感知与认知，638页pdf

【干货书】基于深度学习的机器人感知与认知，638页pdf

专知

19+阅读 · 2022年7月30日

数据驱动的态势认知技术及发展思考

数据驱动的态势认知技术及发展思考

专知

20+阅读 · 2022年7月12日

《人工智能之认知图谱》重磅发布（附报告全文下载）

《人工智能之认知图谱》重磅发布（附报告全文下载）

学术头条

42+阅读 · 2020年8月28日

【人机融合智能】人机融合智能的现状与展望

【人机融合智能】人机融合智能的现状与展望

产业智能官

12+阅读 · 2020年3月18日

有关军事人机混合智能的再再思考

有关军事人机混合智能的再再思考

人工智能学家

22+阅读 · 2019年6月23日

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

专知

10+阅读 · 2019年1月18日

这可能是「多模态机器学习」最通俗易懂的介绍

这可能是「多模态机器学习」最通俗易懂的介绍

计算机视觉life

113+阅读 · 2018年12月20日

【混合智能】人机混合智能的哲学思考

【混合智能】人机混合智能的哲学思考

产业智能官

12+阅读 · 2018年10月28日

报名 | 让机器读懂你的意图——人体姿态估计入门

报名 | 让机器读懂你的意图——人体姿态估计入门

人工智能头条

10+阅读 · 2017年9月19日

一图了解人工智能知识体系大全-专知主题知识树人工智能可视化

一图了解人工智能知识体系大全-专知主题知识树人工智能可视化

专知

97+阅读 · 2017年9月18日

相关论文

Critique of World Model: A Generative Latent Prediction Architecture for World Modeling

Arxiv

0+阅读 · 6月16日

Proprioceptive-visual correspondence enables self-other distinction in humanoid robots

Arxiv

0+阅读 · 6月11日

A Tutorial on World Models and Physical AI

Arxiv

0+阅读 · 6月11日

Human-AI Teaming Through the Lens of Calibration

Arxiv

0+阅读 · 6月9日

MIND-V: Hierarchical World Model for Long-Horizon Robotic Manipulation with RL-based Physical Alignment

Arxiv

0+阅读 · 6月9日

Unifying Object-Centric World Models and Diffusion Policy: A Hierarchical Framework for Multi-Stage Robotic Tasks

Arxiv

0+阅读 · 6月7日

Audio-Visual World Models: Grounding Multisensory Imagination for Embodied Agents

Arxiv

0+阅读 · 6月5日

A formal definition and meta-model for a machine theory of mind

Arxiv

0+阅读 · 6月2日

Towards Shared Embodied Intelligence in Humanoid Robots through Optimization Development and Testing of the Human Aware ergoCub Robot

Arxiv

0+阅读 · 5月26日

Human-AI Co-Evolution and Epistemic Collapse: A Dynamical Systems Perspective

Arxiv

0+阅读 · 5月7日

相关基金

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

人类步行机理认知下的双足机器人步态与智能协同进化理论基础

国家自然科学基金

0+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

人类视空间分类的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

面向社群智能的认知网络中机会数据通信机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

定位系统细胞启发的机器人情景认知地图构建与行为规划研究

国家自然科学基金

3+阅读 · 2015年12月31日

融合认知机理的概率图模型表情识别方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

CGF战场空间认知行为建模研究

国家自然科学基金

51+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员