Analyzing Persona Effects in Generated Explanations from Multimodal LLM Agents in Urban Perception - 专知论文

会员服务 ·

0

分析 · 多模 · 模态 · 城市感知 · 多模态 ·

Analyzing Persona Effects in Generated Explanations from Multimodal LLM Agents in Urban Perception

翻译：分析多模态LLM代理在城市感知中生成解释的角色效应

Neemias da Silva,Myriam Delgado,Rodrigo Minetto,Daniel Silver,Thiago H Silva

from arxiv, 10 pages, 6 figures

We study how persona prompting shapes language generated by multimodal large language models in an urban perception setting. Using 59,808 annotations from 1,200 persona-conditioned agents and two no-persona settings, we analyze captions, justifications, and perception tags across personas. Results indicate strong convergence in captions for different personas, whereas justifications display systematic variation associated with socioeconomic and political attributes, while perception tags show no statistically significant persona-related differences, though effect trends are observed. Topic analysis further reveals that personas emphasize different evaluative themes when interpreting the same scenes.

翻译：我们研究了角色提示如何塑造多模态大型语言模型在城市感知场景中生成的语言。通过分析来自1,200个角色条件化代理和两种无角色设置的59,808条注释，我们跨角色比较了标题、理由和感知标签。结果表明，不同角色的标题表现出高度趋同，而理由则显示出与社会经济和政治属性相关的系统性差异；尽管观察到了效果趋势，但感知标签未出现统计学显著的角色相关差异。主题分析进一步揭示，角色在解释相同场景时强调了不同的评价性主题。

0

相关内容

从感知到推理：深度思考赋能多模态大语言模型

从感知到推理：深度思考赋能多模态大语言模型

专知会员服务

25+阅读 · 2025年11月19日

《缓解大语言模型（LLMs）幻觉：面向应用的检索增强生成（RAG）、推理与智能体系统综述》

《缓解大语言模型（LLMs）幻觉：面向应用的检索增强生成（RAG）、推理与智能体系统综述》

专知会员服务

24+阅读 · 2025年10月29日

从感知到认知：多模态大语言模型中视觉-语言交互推理综述

从感知到认知：多模态大语言模型中视觉-语言交互推理综述

专知会员服务

32+阅读 · 2025年10月1日

以人为中心的基础模型：感知、生成与代理建模

以人为中心的基础模型：感知、生成与代理建模

专知会员服务

24+阅读 · 2025年2月13日

浅谈多模态大模型幻觉缓解方法

浅谈多模态大模型幻觉缓解方法

专知会员服务

24+阅读 · 2024年12月17日

《LLM 时代小模型的作用》综述

《LLM 时代小模型的作用》综述

专知会员服务

49+阅读 · 2024年9月12日

《LLMs遇见多模态生成与编辑》综述

《LLMs遇见多模态生成与编辑》综述

专知会员服务

41+阅读 · 2024年6月3日

LLM in Medical Domain: 大语言模型在医学领域的应用

LLM in Medical Domain: 大语言模型在医学领域的应用

专知会员服务

103+阅读 · 2023年6月17日

多模态认知计算

多模态认知计算

专知会员服务

182+阅读 · 2022年9月16日

【CCL 2019】多模态--基于视觉的跨模态文本生成，复旦大学副教授魏忠钰

【CCL 2019】多模态--基于视觉的跨模态文本生成，复旦大学副教授魏忠钰

专知会员服务

74+阅读 · 2019年11月12日

多模态情绪识别研究综述

多模态情绪识别研究综述

专知

25+阅读 · 2020年12月21日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

【深度语义匹配模型】原理篇二：交互篇

【深度语义匹配模型】原理篇二：交互篇

AINLP

16+阅读 · 2020年5月18日

IJCAI 2019 | 为推荐系统生成高质量的文本解释：基于互注意力机制的多任务学习模型

IJCAI 2019 | 为推荐系统生成高质量的文本解释：基于互注意力机制的多任务学习模型

微软研究院AI头条

18+阅读 · 2019年8月13日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

多模态多任务学习新论文

多模态多任务学习新论文

专知

46+阅读 · 2019年2月9日

论文浅尝 | 嵌入常识知识的注意力 LSTM 模型用于特定目标的基于侧面的情感分析

论文浅尝 | 嵌入常识知识的注意力 LSTM 模型用于特定目标的基于侧面的情感分析

开放知识图谱

28+阅读 · 2018年6月11日

【论文推荐】最新八篇视频描述生成相关论文—在线视频理解、联合定位和描述事件、生成视频、跨模态注意力机制、联合事件检测和描述

【论文推荐】最新八篇视频描述生成相关论文—在线视频理解、联合定位和描述事件、生成视频、跨模态注意力机制、联合事件检测和描述

专知

11+阅读 · 2018年6月4日

【论文笔记】用图卷积网络( GCN)来做语义角色标注

【论文笔记】用图卷积网络( GCN)来做语义角色标注

专知

61+阅读 · 2018年5月26日

基于位置注意力机制模型和带标签数据来提升槽填充（EMNLP outstanding paper）

基于位置注意力机制模型和带标签数据来提升槽填充（EMNLP outstanding paper）

科技创新与创业

17+阅读 · 2017年11月17日

城市“建成环境——空间行为”的多尺度影响关系与机理研究

国家自然科学基金

13+阅读 · 2017年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

交通网络、城市聚集对城市群经济增长的作用机制研究与模型化解释：以长三角城市群为例

国家自然科学基金

1+阅读 · 2014年12月31日

考虑内生信息的城市交通合作演化机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

社会性预期优势效应的神经机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

移动社交网络中政府形象传播机理及治理研究

国家自然科学基金

0+阅读 · 2014年12月31日

策略性城市网络：形成、演化与城市经济增长

国家自然科学基金

1+阅读 · 2014年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

From Agent Traces to Trust: A Survey of Evidence Tracing and Execution Provenance in LLM Agents

Arxiv

0+阅读 · 6月16日

Disentangling Perception and Reasoning in Multimodal LLMs via Reward Design

Arxiv

0+阅读 · 6月15日

Communication Policy Evolution for Proactive LLM Agents

Arxiv

0+阅读 · 6月12日

Evaluating Pluralism in LLMs through Latent Perspectives

Arxiv

0+阅读 · 6月11日

MAR:Multi-Agent Reflexion Improves Reasoning Abilities in LLMs

Arxiv

0+阅读 · 6月7日

Generating the Modal Worker: A Cross-Model Audit of Race and Gender in LLM-Generated Personas Across 41 Occupations

Arxiv

0+阅读 · 6月1日

How Generation Architecture Shapes Code Complexity in Multi-Agent LLM Systems: A Paired Study on HumanEval

Arxiv

0+阅读 · 5月29日

Symbolic Reasoning Frameworks Modulate LLM Risk Aversion in Multi-Agent Strategic Settings

Arxiv

0+阅读 · 5月22日

Stable Personas: Dual-Assessment of Temporal Stability in LLM-Based Human Simulation

Arxiv

0+阅读 · 5月20日

LLM-Agent-based Social Simulation for Attitude Diffusion

Arxiv

0+阅读 · 4月4日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

专知会员服务

0+阅读 · 今天15:55

GNN跨域综述：从消息传递到图基础模型

GNN跨域综述：从消息传递到图基础模型

专知会员服务

0+阅读 · 今天15:53

无人机自主控制与人工智能：系统性综述

无人机自主控制与人工智能：系统性综述

专知会员服务

11+阅读 · 今天7:25

巡飞弹与反无人机系统——现代战场的两大支柱

巡飞弹与反无人机系统——现代战场的两大支柱

专知会员服务

3+阅读 · 今天6:54

《打造“黄金舰队”》57页报告

《打造“黄金舰队”》57页报告

专知会员服务

3+阅读 · 今天6:52

《北约数字教官网络发展路径》128页报告

《北约数字教官网络发展路径》128页报告

专知会员服务

2+阅读 · 今天6:33

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

7+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

6+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

10+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

8+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

8+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

10+阅读 · 6月25日

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

9+阅读 · 6月25日

《国防领域敏感性分析白皮书》

《国防领域敏感性分析白皮书》

专知会员服务

9+阅读 · 6月25日

相关VIP内容

从感知到推理：深度思考赋能多模态大语言模型

从感知到推理：深度思考赋能多模态大语言模型

专知会员服务

25+阅读 · 2025年11月19日

《缓解大语言模型（LLMs）幻觉：面向应用的检索增强生成（RAG）、推理与智能体系统综述》

《缓解大语言模型（LLMs）幻觉：面向应用的检索增强生成（RAG）、推理与智能体系统综述》

专知会员服务

24+阅读 · 2025年10月29日

从感知到认知：多模态大语言模型中视觉-语言交互推理综述

从感知到认知：多模态大语言模型中视觉-语言交互推理综述

专知会员服务

32+阅读 · 2025年10月1日

以人为中心的基础模型：感知、生成与代理建模

以人为中心的基础模型：感知、生成与代理建模

专知会员服务

24+阅读 · 2025年2月13日

浅谈多模态大模型幻觉缓解方法

浅谈多模态大模型幻觉缓解方法

专知会员服务

24+阅读 · 2024年12月17日

《LLM 时代小模型的作用》综述

《LLM 时代小模型的作用》综述

专知会员服务

49+阅读 · 2024年9月12日

《LLMs遇见多模态生成与编辑》综述

《LLMs遇见多模态生成与编辑》综述

专知会员服务

41+阅读 · 2024年6月3日

LLM in Medical Domain: 大语言模型在医学领域的应用

LLM in Medical Domain: 大语言模型在医学领域的应用

专知会员服务

103+阅读 · 2023年6月17日

多模态认知计算

多模态认知计算

专知会员服务

182+阅读 · 2022年9月16日

【CCL 2019】多模态--基于视觉的跨模态文本生成，复旦大学副教授魏忠钰

【CCL 2019】多模态--基于视觉的跨模态文本生成，复旦大学副教授魏忠钰

专知会员服务

74+阅读 · 2019年11月12日

热门VIP内容

开通专知VIP会员享更多权益服务

GNN跨域综述：从消息传递到图基础模型

巡飞弹与反无人机系统——现代战场的两大支柱

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

无人机自主控制与人工智能：系统性综述

相关资讯

多模态情绪识别研究综述

多模态情绪识别研究综述

专知

25+阅读 · 2020年12月21日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

【深度语义匹配模型】原理篇二：交互篇

【深度语义匹配模型】原理篇二：交互篇

AINLP

16+阅读 · 2020年5月18日

IJCAI 2019 | 为推荐系统生成高质量的文本解释：基于互注意力机制的多任务学习模型

IJCAI 2019 | 为推荐系统生成高质量的文本解释：基于互注意力机制的多任务学习模型

微软研究院AI头条

18+阅读 · 2019年8月13日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

多模态多任务学习新论文

多模态多任务学习新论文

专知

46+阅读 · 2019年2月9日

论文浅尝 | 嵌入常识知识的注意力 LSTM 模型用于特定目标的基于侧面的情感分析

论文浅尝 | 嵌入常识知识的注意力 LSTM 模型用于特定目标的基于侧面的情感分析

开放知识图谱

28+阅读 · 2018年6月11日

【论文推荐】最新八篇视频描述生成相关论文—在线视频理解、联合定位和描述事件、生成视频、跨模态注意力机制、联合事件检测和描述

【论文推荐】最新八篇视频描述生成相关论文—在线视频理解、联合定位和描述事件、生成视频、跨模态注意力机制、联合事件检测和描述

专知

11+阅读 · 2018年6月4日

【论文笔记】用图卷积网络( GCN)来做语义角色标注

【论文笔记】用图卷积网络( GCN)来做语义角色标注

专知

61+阅读 · 2018年5月26日

基于位置注意力机制模型和带标签数据来提升槽填充（EMNLP outstanding paper）

基于位置注意力机制模型和带标签数据来提升槽填充（EMNLP outstanding paper）

科技创新与创业

17+阅读 · 2017年11月17日

相关论文

From Agent Traces to Trust: A Survey of Evidence Tracing and Execution Provenance in LLM Agents

Arxiv

0+阅读 · 6月16日

Disentangling Perception and Reasoning in Multimodal LLMs via Reward Design

Arxiv

0+阅读 · 6月15日

Communication Policy Evolution for Proactive LLM Agents

Arxiv

0+阅读 · 6月12日

Evaluating Pluralism in LLMs through Latent Perspectives

Arxiv

0+阅读 · 6月11日

MAR:Multi-Agent Reflexion Improves Reasoning Abilities in LLMs

Arxiv

0+阅读 · 6月7日

Generating the Modal Worker: A Cross-Model Audit of Race and Gender in LLM-Generated Personas Across 41 Occupations

Arxiv

0+阅读 · 6月1日

How Generation Architecture Shapes Code Complexity in Multi-Agent LLM Systems: A Paired Study on HumanEval

Arxiv

0+阅读 · 5月29日

Symbolic Reasoning Frameworks Modulate LLM Risk Aversion in Multi-Agent Strategic Settings

Arxiv

0+阅读 · 5月22日

Stable Personas: Dual-Assessment of Temporal Stability in LLM-Based Human Simulation

Arxiv

0+阅读 · 5月20日

LLM-Agent-based Social Simulation for Attitude Diffusion

Arxiv

0+阅读 · 4月4日

相关基金

城市“建成环境——空间行为”的多尺度影响关系与机理研究

国家自然科学基金

13+阅读 · 2017年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

交通网络、城市聚集对城市群经济增长的作用机制研究与模型化解释：以长三角城市群为例

国家自然科学基金

1+阅读 · 2014年12月31日

考虑内生信息的城市交通合作演化机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

社会性预期优势效应的神经机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

移动社交网络中政府形象传播机理及治理研究

国家自然科学基金

0+阅读 · 2014年12月31日

策略性城市网络：形成、演化与城市经济增长

国家自然科学基金

1+阅读 · 2014年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员