Behind the Prompt: The Agent-User Problem in Information Retrieval - 专知论文

会员服务 ·

0

智能体 · 信息检索 · 操作 · 系统 · 用户意图 ·

Behind the Prompt: The Agent-User Problem in Information Retrieval

翻译：幕后操控：信息检索中的智能体-用户问题

Saber Zerhoudi,Michael Granitzer,Dang Hai Dang,Jelena Mitrovic,Florian Lemmerich,Annette Hautli-Janisz,Stefan Katzenbeisser,Kanishka Ghosh Dastidar

User models in information retrieval rest on a foundational assumption that observed behavior reveals intent. This assumption collapses when the user is an AI agent privately configured by a human operator. For any action an agent takes, a hidden instruction could have produced identical output - making intent non-identifiable at the individual level. This is not a detection problem awaiting better tools; it is a structural property of any system where humans configure agents behind closed doors. We investigate the agent-user problem through a large-scale corpus from an agent-native social platform: 370K posts from 47K agents across 4K communities. Our findings are threefold: (1) individual agent actions cannot be classified as autonomous or operator-directed from observables; (2) population-level platform signals still separate agents into meaningful quality tiers, but a click model trained on agent interactions degrades steadily (-8.5% AUC) as lower-quality agents enter training data; (3) cross-community capability references spread endemically ($R_0$ 1.26-3.53) and resist suppression even under aggressive modeled intervention. For retrieval systems, the question is no longer whether agent users will arrive, but whether models built on human-intent assumptions will survive their presence.

翻译：信息检索中的用户模型基于一个基本假设：观察到的行为揭示了用户意图。当用户是由人类操作者私下配置的AI智能体时，这一假设便不再成立。对于智能体采取的任何行动，都可能存在一条能产生相同输出的隐藏指令——这使得意图在个体层面无法被识别。这并非一个等待更优工具解决的检测问题，而是任何允许人类在幕后配置智能体的系统所固有的结构特性。我们通过一个原生智能体社交平台的大规模语料库（涵盖4000个社区的47000个智能体发布的37万条帖子）研究了智能体-用户问题。研究发现有三点：(1) 无法根据可观测数据将个体智能体行为分类为自主行为或操作者指令行为；(2) 群体层面的平台信号仍能将智能体划分为有意义的品质层级，但基于智能体交互训练的点击模型会随着低品质智能体进入训练数据而持续退化（AUC下降8.5%）；(3) 跨社区能力引用呈现地方性传播趋势（基本再生数$R_0$为1.26-3.53），即使在激进建模干预下仍难以抑制。对于检索系统而言，问题已不再是智能体用户是否会出现，而是基于人类意图假设构建的模型能否在其存在下继续有效。

0

相关内容

智能体

智能体，顾名思义，就是具有智能的实体，英文名是Agent。

《面向社交媒体信息操纵干扰调查的智能体实现》

《面向社交媒体信息操纵干扰调查的智能体实现》

专知会员服务

20+阅读 · 2月5日

智能体工程（Agent Engineering）

智能体工程（Agent Engineering）

专知会员服务

35+阅读 · 2025年12月31日

人工智能专题报告：Operator和Manus打开AI Agent时代

人工智能专题报告：Operator和Manus打开AI Agent时代

专知会员服务

63+阅读 · 2025年3月12日

谷歌《智能体Agent》白皮书，42页pdf

谷歌《智能体Agent》白皮书，42页pdf

专知会员服务

108+阅读 · 2025年1月5日

AI智能体面临的威胁：关键安全挑战与未来路径综述

AI智能体面临的威胁：关键安全挑战与未来路径综述

专知会员服务

53+阅读 · 2024年6月7日

AI Agent：基于大模型的自主智能体

AI Agent：基于大模型的自主智能体

专知会员服务

249+阅读 · 2023年9月9日

最新综述论文《人类与人工智能交互中的信任：确定模型、措施和方法》东京工业大学

最新综述论文《人类与人工智能交互中的信任：确定模型、措施和方法》东京工业大学

专知会员服务

30+阅读 · 2022年6月16日

基于Transformer嵌入模型的个性化产品搜索，A Transformer-based Embedding Model for Personalized Product Search

基于Transformer嵌入模型的个性化产品搜索，A Transformer-based Embedding Model for Personalized Product Search

专知会员服务

31+阅读 · 2020年5月20日

机器学习隐私综述论文，An Overview of Privacy in Machine Learning

机器学习隐私综述论文，An Overview of Privacy in Machine Learning

专知会员服务

81+阅读 · 2020年5月20日

【报告推荐】《人工智能之信息检索与推荐》报告，附72页PDF下载

【报告推荐】《人工智能之信息检索与推荐》报告，附72页PDF下载

专知会员服务

86+阅读 · 2019年9月7日

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

专知

36+阅读 · 2022年7月31日

用户画像基础

用户画像基础

DataFunTalk

12+阅读 · 2020年8月1日

数据中台：基于标签体系的360°用户画像

数据中台：基于标签体系的360°用户画像

THU数据派

13+阅读 · 2020年7月25日

用户画像技术及方法论

用户画像技术及方法论

DataFunTalk

13+阅读 · 2020年5月27日

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

专知

23+阅读 · 2019年9月6日

用户研究：如何做用户画像分析

用户研究：如何做用户画像分析

产品100干货速递

46+阅读 · 2019年5月9日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

【知识图谱】基于知识图谱的用户画像技术

【知识图谱】基于知识图谱的用户画像技术

产业智能官

103+阅读 · 2019年1月9日

【大数据】如何用大数据构建精准用户画像？

【大数据】如何用大数据构建精准用户画像？

产业智能官

12+阅读 · 2017年9月21日

看完后，别再说自己不懂用户画像了

看完后，别再说自己不懂用户画像了

R语言中文社区

15+阅读 · 2017年8月28日

移动互联网的用户隐私保护研究

国家自然科学基金

2+阅读 · 2017年12月31日

基于移动平台的视频信息隐藏关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向应用商店的移动智能终端恶意软件检测关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于主题网络的用户内在兴趣发现及演进研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于日常移动平台的用户状态感知与软件协同技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于WEB信息的信息错误自动检测与修复技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

社交网络中信息主体的行为模式分析及应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

网络用户隐私担忧与主动性泄露隐私信息之间的悖论：理论探索和基于社交网络的实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

OPeRA: A Dataset of Observation, Persona, Rationale, and Action for Evaluating LLMs on Human Online Shopping Behavior Simulation

Arxiv

0+阅读 · 4月27日

The Privacy Guardian Agent: Towards Trustworthy AI Privacy Agents

Arxiv

0+阅读 · 4月23日

Behavioral Transfer in AI Agents: Evidence and Privacy Implications

Arxiv

0+阅读 · 4月21日

An AI Agent Execution Environment to Safeguard User Data

Arxiv

0+阅读 · 4月21日

User Simulation in the Era of Generative AI: User Modeling, Synthetic Data Generation, and System Evaluation

Arxiv

0+阅读 · 4月21日

OPeRA: A Dataset of Observation, Persona, Rationale, and Action for Evaluating LLMs on Human Online Shopping Behavior Simulation

Arxiv

0+阅读 · 4月18日

AgentIR: Reasoning-Aware Retrieval for Deep Research Agents

Arxiv

0+阅读 · 3月9日

AgentSCOPE: Evaluating Contextual Privacy Across Agentic Workflows

Arxiv

0+阅读 · 3月5日

AgentIR: Reasoning-Aware Retrival for Deep Research Agents

Arxiv

0+阅读 · 3月4日

AudAgent: Automated Auditing of Privacy Policy Compliance in AI Agents

Arxiv

0+阅读 · 2月28日

VIP会员

文章信息

相关主题

最新内容

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

3+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

3+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

4+阅读 · 5月30日

美以伊战争：首次人工智能战争——军事自主性困境

美以伊战争：首次人工智能战争——军事自主性困境

专知会员服务

5+阅读 · 5月30日

《Palantir任务保障性软件安全标准（MA-S2）》

《Palantir任务保障性软件安全标准（MA-S2）》

专知会员服务

14+阅读 · 5月30日

《美海军利用扩展现实增强知识流动研究》300页报告

《美海军利用扩展现实增强知识流动研究》300页报告

专知会员服务

7+阅读 · 5月30日

基于声学的无人机检测技术综述

基于声学的无人机检测技术综述

专知会员服务

8+阅读 · 5月30日

《当代混合战争分析框架：俄乌战争经验教训》

《当代混合战争分析框架：俄乌战争经验教训》

专知会员服务

8+阅读 · 5月30日

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

11+阅读 · 5月29日

AutoScientists：自组织智能体团队驱动长期科学实验

AutoScientists：自组织智能体团队驱动长期科学实验

专知会员服务

6+阅读 · 5月29日

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

专知会员服务

6+阅读 · 5月29日

战略前沿人工智能的再思考（中文）

战略前沿人工智能的再思考（中文）

专知会员服务

8+阅读 · 5月29日

《量化地基防空系统间接效应的博弈论方法》

《量化地基防空系统间接效应的博弈论方法》

专知会员服务

6+阅读 · 5月29日

传感器网络：美国如何探测来自伊朗的导弹与无人机

传感器网络：美国如何探测来自伊朗的导弹与无人机

专知会员服务

6+阅读 · 5月29日

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

专知会员服务

10+阅读 · 5月29日

相关VIP内容

《面向社交媒体信息操纵干扰调查的智能体实现》

《面向社交媒体信息操纵干扰调查的智能体实现》

专知会员服务

20+阅读 · 2月5日

智能体工程（Agent Engineering）

智能体工程（Agent Engineering）

专知会员服务

35+阅读 · 2025年12月31日

人工智能专题报告：Operator和Manus打开AI Agent时代

人工智能专题报告：Operator和Manus打开AI Agent时代

专知会员服务

63+阅读 · 2025年3月12日

谷歌《智能体Agent》白皮书，42页pdf

谷歌《智能体Agent》白皮书，42页pdf

专知会员服务

108+阅读 · 2025年1月5日

AI智能体面临的威胁：关键安全挑战与未来路径综述

AI智能体面临的威胁：关键安全挑战与未来路径综述

专知会员服务

53+阅读 · 2024年6月7日

AI Agent：基于大模型的自主智能体

AI Agent：基于大模型的自主智能体

专知会员服务

249+阅读 · 2023年9月9日

最新综述论文《人类与人工智能交互中的信任：确定模型、措施和方法》东京工业大学

最新综述论文《人类与人工智能交互中的信任：确定模型、措施和方法》东京工业大学

专知会员服务

30+阅读 · 2022年6月16日

基于Transformer嵌入模型的个性化产品搜索，A Transformer-based Embedding Model for Personalized Product Search

基于Transformer嵌入模型的个性化产品搜索，A Transformer-based Embedding Model for Personalized Product Search

专知会员服务

31+阅读 · 2020年5月20日

机器学习隐私综述论文，An Overview of Privacy in Machine Learning

机器学习隐私综述论文，An Overview of Privacy in Machine Learning

专知会员服务

81+阅读 · 2020年5月20日

【报告推荐】《人工智能之信息检索与推荐》报告，附72页PDF下载

【报告推荐】《人工智能之信息检索与推荐》报告，附72页PDF下载

专知会员服务

86+阅读 · 2019年9月7日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

美以伊战争：首次人工智能战争——军事自主性困境

BES：让语言模型通过双向进化搜索自我改进

以色列-美国-伊朗战争中的无人机：关键要点

相关资讯

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

专知

36+阅读 · 2022年7月31日

用户画像基础

用户画像基础

DataFunTalk

12+阅读 · 2020年8月1日

数据中台：基于标签体系的360°用户画像

数据中台：基于标签体系的360°用户画像

THU数据派

13+阅读 · 2020年7月25日

用户画像技术及方法论

用户画像技术及方法论

DataFunTalk

13+阅读 · 2020年5月27日

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

专知

23+阅读 · 2019年9月6日

用户研究：如何做用户画像分析

用户研究：如何做用户画像分析

产品100干货速递

46+阅读 · 2019年5月9日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

【知识图谱】基于知识图谱的用户画像技术

【知识图谱】基于知识图谱的用户画像技术

产业智能官

103+阅读 · 2019年1月9日

【大数据】如何用大数据构建精准用户画像？

【大数据】如何用大数据构建精准用户画像？

产业智能官

12+阅读 · 2017年9月21日

看完后，别再说自己不懂用户画像了

看完后，别再说自己不懂用户画像了

R语言中文社区

15+阅读 · 2017年8月28日

相关论文

OPeRA: A Dataset of Observation, Persona, Rationale, and Action for Evaluating LLMs on Human Online Shopping Behavior Simulation

Arxiv

0+阅读 · 4月27日

The Privacy Guardian Agent: Towards Trustworthy AI Privacy Agents

Arxiv

0+阅读 · 4月23日

Behavioral Transfer in AI Agents: Evidence and Privacy Implications

Arxiv

0+阅读 · 4月21日

An AI Agent Execution Environment to Safeguard User Data

Arxiv

0+阅读 · 4月21日

User Simulation in the Era of Generative AI: User Modeling, Synthetic Data Generation, and System Evaluation

Arxiv

0+阅读 · 4月21日

OPeRA: A Dataset of Observation, Persona, Rationale, and Action for Evaluating LLMs on Human Online Shopping Behavior Simulation

Arxiv

0+阅读 · 4月18日

AgentIR: Reasoning-Aware Retrieval for Deep Research Agents

Arxiv

0+阅读 · 3月9日

AgentSCOPE: Evaluating Contextual Privacy Across Agentic Workflows

Arxiv

0+阅读 · 3月5日

AgentIR: Reasoning-Aware Retrival for Deep Research Agents

Arxiv

0+阅读 · 3月4日

AudAgent: Automated Auditing of Privacy Policy Compliance in AI Agents

Arxiv

0+阅读 · 2月28日

相关基金

移动互联网的用户隐私保护研究

国家自然科学基金

2+阅读 · 2017年12月31日

基于移动平台的视频信息隐藏关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向应用商店的移动智能终端恶意软件检测关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于主题网络的用户内在兴趣发现及演进研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于日常移动平台的用户状态感知与软件协同技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于WEB信息的信息错误自动检测与修复技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

社交网络中信息主体的行为模式分析及应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

网络用户隐私担忧与主动性泄露隐私信息之间的悖论：理论探索和基于社交网络的实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员