Establishing common ground, a shared set of beliefs and mutually recognized facts, is fundamental to collaboration, yet remains a challenge for current AI systems, especially in multimodal, multiparty settings, where the collaborators bring different information to the table. We introduce the Distributed Partial Information Puzzle (DPIP), a collaborative construction task that elicits rich multimodal communication under epistemic asymmetry. We present a multimodal dataset of these interactions, annotated and temporally aligned across speech, gesture, and action modalities to support reasoning over propositional content and belief dynamics. We then evaluate two paradigms for modeling common ground (CG): (1) state-of-the-art large language models (LLMs), prompted to infer shared beliefs from multimodal updates, and (2) an axiomatic pipeline grounded in Dynamic Epistemic Logic (DEL) that incrementally performs the same task. Results on the annotated DPIP data indicate that it poses a challenge to modern LLMs' abilities to track both task progression and belief state.


翻译:建立共同基础——即一套共享的信念与相互认可的事实——是协作的根本,但对当前人工智能系统而言仍是一项挑战,尤其是在多模态、多方参与的协作场景中,参与者各自掌握不同的信息。我们提出了分布式部分信息谜题(DPIP),这是一种在认知不对称条件下引发丰富多模态交流的协作构建任务。我们构建了一个记录此类交互的多模态数据集,该数据集经过标注,并在语音、手势与动作模态间进行了时间对齐,以支持对命题内容与信念动态的推理。随后,我们评估了两种建模共同基础(CG)的范式:(1)采用最先进的大语言模型(LLMs),通过提示使其从多模态更新中推断共享信念;(2)基于动态认知逻辑(DEL)构建的公理化流程,以增量方式执行相同任务。在已标注的DPIP数据上的实验结果表明,该任务对现代LLMs同时追踪任务进展与信念状态的能力构成了挑战。

0
下载
关闭预览

相关内容

《不确定通信条件下的分布式多智能体决策》122页
专知会员服务
57+阅读 · 2025年2月26日
专知会员服务
41+阅读 · 2020年12月1日
异质信息网络分析与应用综述,软件学报-北京邮电大学
基于知识图谱的问答系统
PaperWeekly
21+阅读 · 2021年2月8日
分布式核心技术知识图谱,带走不谢
架构师之路
12+阅读 · 2019年9月23日
【知识图谱】知识图谱+人工智能=新型网络信息体系
产业智能官
14+阅读 · 2018年11月18日
不对称多代理博弈中的博弈理论解读
AI前线
14+阅读 · 2018年3月8日
知识图谱 vs. 对话系统专题讨论 - PaperWeekly 社区
PaperWeekly
10+阅读 · 2017年10月18日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
Arxiv
0+阅读 · 3月16日
VIP会员
最新内容
最新“指挥控制”领域出版物合集(简介)
专知会员服务
1+阅读 · 今天15:19
面向军事作战需求开发的人工智能(RAIMOND)
专知会员服务
3+阅读 · 今天15:13
软件定义多域战术网络:基础与未来方向(综述)
水下战战术决策中的气象与海洋预报(50页报告)
远程空中优势:新一代超视距导弹的兴起
专知会员服务
1+阅读 · 今天14:45
大语言模型溯因推理的统一分类学与综述
专知会员服务
0+阅读 · 今天12:07
相关VIP内容
《不确定通信条件下的分布式多智能体决策》122页
专知会员服务
57+阅读 · 2025年2月26日
专知会员服务
41+阅读 · 2020年12月1日
异质信息网络分析与应用综述,软件学报-北京邮电大学
相关基金
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员