When Researchers Say Mental Model/Theory of Mind of AI, What Are They Really Talking About? - 专知论文

会员服务 ·

0

心智理论 · 交互 · 系统 · AI · 心理模型 ·

When Researchers Say Mental Model/Theory of Mind of AI, What Are They Really Talking About?

翻译：当研究者谈论人工智能的心理模型/心智理论时，他们究竟在讨论什么？

Xiaoyun Yin,Elmira Zahmat Doost,Shiwen Zhou,Garima Arya Yadav,Jamie C. Gorman

from arxiv, This work have been accepted in CogInterp @ NeurIPS 2025

When researchers claim AI systems possess ToM or mental models, they are fundamentally discussing behavioral predictions and bias corrections rather than genuine mental states. This position paper argues that the current discourse conflates sophisticated pattern matching with authentic cognition, missing a crucial distinction between simulation and experience. While recent studies show LLMs achieving human-level performance on ToM laboratory tasks, these results are based only on behavioral mimicry. More importantly, the entire testing paradigm may be flawed in applying individual human cognitive tests to AI systems, but assessing human cognition directly in the moment of human-AI interaction. I suggest shifting focus toward mutual ToM frameworks that acknowledge the simultaneous contributions of human cognition and AI algorithms, emphasizing the interaction dynamics, instead of testing AI in isolation.

翻译：当研究者声称人工智能系统具备心智理论或心理模型时，他们实质上是在讨论行为预测与偏差校正，而非真正的心理状态。本立场论文认为，当前的话语体系将复杂的模式匹配与真实的认知活动混为一谈，忽视了模拟过程与经验体验之间的根本区别。虽然最新研究表明大语言模型在心智理论实验室任务中已达到人类水平的表现，但这些结果完全基于行为模仿。更为关键的是，将个体人类认知测试直接应用于人工智能系统的整个测试范式可能存在根本缺陷——既未能触及人类认知与AI交互时即时发生的认知过程。本文建议将研究焦点转向交互式心智理论框架，该框架承认人类认知与AI算法在交互过程中的共同贡献机制，强调动态交互过程本身，而非孤立地测试AI系统。

0

相关内容

心智理论

具身智能中的心理世界建模：深度综述

具身智能中的心理世界建模：深度综述

专知会员服务

39+阅读 · 1月10日

可解释人工智能中的大语言模型：全面综述

可解释人工智能中的大语言模型：全面综述

专知会员服务

54+阅读 · 2025年4月2日

《你所需要知道的理论：人工智能、人类认知与决策》牛津大学最新53页报告

《你所需要知道的理论：人工智能、人类认知与决策》牛津大学最新53页报告

专知会员服务

91+阅读 · 2024年11月15日

《对话式AI智能体：研究人工智能在人机交互中诱发拟人化和信任的特定特征》208页

《对话式AI智能体：研究人工智能在人机交互中诱发拟人化和信任的特定特征》208页

专知会员服务

32+阅读 · 2024年7月27日

通用人工智能：是什么？如何测试？如何实现？

通用人工智能：是什么？如何测试？如何实现？

专知会员服务

27+阅读 · 2024年6月19日

【COLING2024】从多模态大型语言模型到人类水平的人工智能：模态、指令、推理、效率及超越

【COLING2024】从多模态大型语言模型到人类水平的人工智能：模态、指令、推理、效率及超越

专知会员服务

32+阅读 · 2024年5月26日

【阿姆斯特丹博士论文】语言使用的神经模型：语境中语言理解和产出的研究

【阿姆斯特丹博士论文】语言使用的神经模型：语境中语言理解和产出的研究

专知会员服务

30+阅读 · 2023年12月12日

2023 中国人工智能系列白皮书--心智计算：构建脑与心智启发的人工智能，70页pdf

2023 中国人工智能系列白皮书--心智计算：构建脑与心智启发的人工智能，70页pdf

专知会员服务

98+阅读 · 2023年10月25日

推荐！《综述：人工智能的心智理论和元推理》美国陆军研究实验室2022最新21页报告

推荐！《综述：人工智能的心智理论和元推理》美国陆军研究实验室2022最新21页报告

专知会员服务

66+阅读 · 2022年9月26日

最新综述论文《人类与人工智能交互中的信任：确定模型、措施和方法》东京工业大学

最新综述论文《人类与人工智能交互中的信任：确定模型、措施和方法》东京工业大学

专知会员服务

30+阅读 · 2022年6月16日

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

专知

23+阅读 · 2023年4月8日

推荐！《用于兵棋推演和建模的人工智能》兰德、耶鲁大学2022最新16页论文

推荐！《用于兵棋推演和建模的人工智能》兰德、耶鲁大学2022最新16页论文

专知

53+阅读 · 2022年11月14日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

专访俞栋：多模态是迈向通用人工智能的重要方向

专访俞栋：多模态是迈向通用人工智能的重要方向

AI科技评论

27+阅读 · 2019年9月9日

这可能是「多模态机器学习」最通俗易懂的介绍

这可能是「多模态机器学习」最通俗易懂的介绍

计算机视觉life

113+阅读 · 2018年12月20日

【混合智能】人机混合智能的哲学思考

【混合智能】人机混合智能的哲学思考

产业智能官

12+阅读 · 2018年10月28日

干货|85页最新《人机对话系统》神经方法综述论文，微软与谷歌研究员联合出品：

干货|85页最新《人机对话系统》神经方法综述论文，微软与谷歌研究员联合出品：

专知

35+阅读 · 2018年10月7日

【干货】一文读懂智能对话系统，当前研究综述和未来趋势

【干货】一文读懂智能对话系统，当前研究综述和未来趋势

新智元

13+阅读 · 2018年1月23日

人工神经网络是否模拟了人类大脑？

人工神经网络是否模拟了人类大脑？

数说工作室

10+阅读 · 2017年7月19日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

人体行为识别的时空耦合随机图模型及其高效推理算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

面向聋儿言语康复的多模态人机交互模型及技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

融合认知机理的概率图模型表情识别方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

新型统计模型在精神疾病的基因、脑影像和行为数据整合中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

数据和模型混合驱动的虚拟人群行为仿真技术研究及其在军事中的应用

国家自然科学基金

10+阅读 · 2011年12月31日

A Causal Model of Theory of Mind in Conflict for Artificial Intelligence

Arxiv

0+阅读 · 6月15日

Interaction-Centered Intelligence: Toward an Interaction-Based Theory of Human-AI Co-Creation

Arxiv

0+阅读 · 6月11日

A Motivational Architecture for Conversational AGI

Arxiv

0+阅读 · 6月3日

Chuck, Wilson and the emergence of artificial minds in human-AI conversations

Arxiv

0+阅读 · 6月3日

A formal definition and meta-model for a machine theory of mind

Arxiv

0+阅读 · 6月2日

Evaluation of AI Ethics Tools in Language Models: A Developers' Perspective Case Study

Arxiv

0+阅读 · 5月27日

Explanations as Dialogues: Toward Human-Centered Conversational Explainable AI

Arxiv

0+阅读 · 5月26日

The AI Cognitive Trojan Horse: How Large Language Models May Bypass Human Epistemic Vigilance

Arxiv

0+阅读 · 5月26日

When to Ask a Question: Understanding Communication Strategies in Generative AI Tools

Arxiv

0+阅读 · 5月11日

Agent AI: Surveying the Horizons of Multimodal Interaction

Arxiv

61+阅读 · 2024年1月7日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

3+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

4+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

9+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

8+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

4+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

7+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

6+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

9+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

7+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

6+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

5+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

相关VIP内容

具身智能中的心理世界建模：深度综述

具身智能中的心理世界建模：深度综述

专知会员服务

39+阅读 · 1月10日

可解释人工智能中的大语言模型：全面综述

可解释人工智能中的大语言模型：全面综述

专知会员服务

54+阅读 · 2025年4月2日

《你所需要知道的理论：人工智能、人类认知与决策》牛津大学最新53页报告

《你所需要知道的理论：人工智能、人类认知与决策》牛津大学最新53页报告

专知会员服务

91+阅读 · 2024年11月15日

《对话式AI智能体：研究人工智能在人机交互中诱发拟人化和信任的特定特征》208页

《对话式AI智能体：研究人工智能在人机交互中诱发拟人化和信任的特定特征》208页

专知会员服务

32+阅读 · 2024年7月27日

通用人工智能：是什么？如何测试？如何实现？

通用人工智能：是什么？如何测试？如何实现？

专知会员服务

27+阅读 · 2024年6月19日

【COLING2024】从多模态大型语言模型到人类水平的人工智能：模态、指令、推理、效率及超越

【COLING2024】从多模态大型语言模型到人类水平的人工智能：模态、指令、推理、效率及超越

专知会员服务

32+阅读 · 2024年5月26日

【阿姆斯特丹博士论文】语言使用的神经模型：语境中语言理解和产出的研究

【阿姆斯特丹博士论文】语言使用的神经模型：语境中语言理解和产出的研究

专知会员服务

30+阅读 · 2023年12月12日

2023 中国人工智能系列白皮书--心智计算：构建脑与心智启发的人工智能，70页pdf

2023 中国人工智能系列白皮书--心智计算：构建脑与心智启发的人工智能，70页pdf

专知会员服务

98+阅读 · 2023年10月25日

推荐！《综述：人工智能的心智理论和元推理》美国陆军研究实验室2022最新21页报告

推荐！《综述：人工智能的心智理论和元推理》美国陆军研究实验室2022最新21页报告

专知会员服务

66+阅读 · 2022年9月26日

最新综述论文《人类与人工智能交互中的信任：确定模型、措施和方法》东京工业大学

最新综述论文《人类与人工智能交互中的信任：确定模型、措施和方法》东京工业大学

专知会员服务

30+阅读 · 2022年6月16日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

专知

23+阅读 · 2023年4月8日

推荐！《用于兵棋推演和建模的人工智能》兰德、耶鲁大学2022最新16页论文

推荐！《用于兵棋推演和建模的人工智能》兰德、耶鲁大学2022最新16页论文

专知

53+阅读 · 2022年11月14日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

专访俞栋：多模态是迈向通用人工智能的重要方向

专访俞栋：多模态是迈向通用人工智能的重要方向

AI科技评论

27+阅读 · 2019年9月9日

这可能是「多模态机器学习」最通俗易懂的介绍

这可能是「多模态机器学习」最通俗易懂的介绍

计算机视觉life

113+阅读 · 2018年12月20日

【混合智能】人机混合智能的哲学思考

【混合智能】人机混合智能的哲学思考

产业智能官

12+阅读 · 2018年10月28日

干货|85页最新《人机对话系统》神经方法综述论文，微软与谷歌研究员联合出品：

干货|85页最新《人机对话系统》神经方法综述论文，微软与谷歌研究员联合出品：

专知

35+阅读 · 2018年10月7日

【干货】一文读懂智能对话系统，当前研究综述和未来趋势

【干货】一文读懂智能对话系统，当前研究综述和未来趋势

新智元

13+阅读 · 2018年1月23日

人工神经网络是否模拟了人类大脑？

人工神经网络是否模拟了人类大脑？

数说工作室

10+阅读 · 2017年7月19日

相关论文

A Causal Model of Theory of Mind in Conflict for Artificial Intelligence

Arxiv

0+阅读 · 6月15日

Interaction-Centered Intelligence: Toward an Interaction-Based Theory of Human-AI Co-Creation

Arxiv

0+阅读 · 6月11日

A Motivational Architecture for Conversational AGI

Arxiv

0+阅读 · 6月3日

Chuck, Wilson and the emergence of artificial minds in human-AI conversations

Arxiv

0+阅读 · 6月3日

A formal definition and meta-model for a machine theory of mind

Arxiv

0+阅读 · 6月2日

Evaluation of AI Ethics Tools in Language Models: A Developers' Perspective Case Study

Arxiv

0+阅读 · 5月27日

Explanations as Dialogues: Toward Human-Centered Conversational Explainable AI

Arxiv

0+阅读 · 5月26日

The AI Cognitive Trojan Horse: How Large Language Models May Bypass Human Epistemic Vigilance

Arxiv

0+阅读 · 5月26日

When to Ask a Question: Understanding Communication Strategies in Generative AI Tools

Arxiv

0+阅读 · 5月11日

Agent AI: Surveying the Horizons of Multimodal Interaction

Arxiv

61+阅读 · 2024年1月7日

相关基金

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

人体行为识别的时空耦合随机图模型及其高效推理算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

面向聋儿言语康复的多模态人机交互模型及技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

融合认知机理的概率图模型表情识别方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

新型统计模型在精神疾病的基因、脑影像和行为数据整合中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

数据和模型混合驱动的虚拟人群行为仿真技术研究及其在军事中的应用

国家自然科学基金

10+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员