建模网络智能体中的差异化人机交互 (Modeling Distinct Human Interaction in Web Agents) - 专知论文

会员服务 ·

0

交互 · 智能体 · 网络智能 · 协作 · 网络导航 ·

Modeling Distinct Human Interaction in Web Agents

翻译：建模网络智能体中的差异化人机交互

Faria Huq,Zora Zhiruo Wang,Zhanqiu Guo,Venu Arvind Arangarajan,Tianyue Ou,Frank Xu,Shuyan Zhou,Graham Neubig,Jeffrey P. Bigham

from arxiv, Preprint

Despite rapid progress in autonomous web agents, human involvement remains essential for shaping preferences and correcting agent behavior as tasks unfold. However, current agentic systems lack a principled understanding of when and why humans intervene, often proceeding autonomously past critical decision points or requesting unnecessary confirmation. In this work, we introduce the task of modeling human intervention to support collaborative web task execution. We collect CowCorpus, a dataset of 400 real-user web navigation trajectories containing over 4,200 interleaved human and agent actions. We identify four distinct patterns of user interaction with agents -- hands-off supervision, hands-on oversight, collaborative task-solving, and full user takeover. Leveraging these insights, we train language models (LMs) to anticipate when users are likely to intervene based on their interaction styles, yielding a 61.4-63.4% improvement in intervention prediction accuracy over base LMs. Finally, we deploy these intervention-aware models in live web navigation agents and evaluate them in a user study, finding a 26.5% increase in user-rated agent usefulness. Together, our results show structured modeling of human intervention leads to more adaptive, collaborative agents.

翻译：尽管自主网络智能体发展迅速，但在任务执行过程中，人类参与对于塑造偏好和纠正智能体行为仍然至关重要。然而，当前的智能体系统缺乏对"人类何时以及为何介入"的原则性理解，常常在越过关键决策点时仍自主运行，或请求不必要的确认。本工作中，我们引入了"人类介入建模"这一任务，以支持协作式网络任务执行。我们收集了CowCorpus数据集，包含400条真实用户的网络导航轨迹，涵盖超过4,200项交错进行的人类与智能体操作。我们识别出用户与智能体交互的四种差异化模式——放手式监督、动手式监察、协作式任务解决以及完全用户接管。基于这些洞察，我们训练语言模型（LMs）以根据用户的交互风格预测其可能的介入时机，相比基础语言模型，介入预测准确率提升了61.4-63.4%。最后，我们将这些具备介入感知能力的模型部署于实时网络导航智能体中，并通过用户研究进行评估，发现用户评价的智能体实用性提升了26.5%。综合来看，我们的结果表明：对人类介入进行结构化建模，能够催生更具适应性与协作性的智能体。

0

相关内容

《多域人机交互研究》95页

《多域人机交互研究》95页

专知会员服务

35+阅读 · 2025年6月2日

Agent AI：多模态交互的新地平线

Agent AI：多模态交互的新地平线

专知会员服务

21+阅读 · 2025年5月26日

【斯坦福博士论文】构建类人化具身智能体：从人类行为中学习

【斯坦福博士论文】构建类人化具身智能体：从人类行为中学习

专知会员服务

25+阅读 · 2025年3月20日

《人类-人工智能握手框架：人与人工智能合作的双向方法》

《人类-人工智能握手框架：人与人工智能合作的双向方法》

专知会员服务

39+阅读 · 2025年2月5日

《对话式AI智能体：研究人工智能在人机交互中诱发拟人化和信任的特定特征》208页

《对话式AI智能体：研究人工智能在人机交互中诱发拟人化和信任的特定特征》208页

专知会员服务

31+阅读 · 2024年7月27日

多模态智能体AI开启新浪潮！李飞飞等14位斯坦福微软大牛等撰写 80页《AGENT AI: 综述多模态交互的前沿展望》

多模态智能体AI开启新浪潮！李飞飞等14位斯坦福微软大牛等撰写 80页《AGENT AI: 综述多模态交互的前沿展望》

专知会员服务

202+阅读 · 2024年1月9日

大模型和智能体如何结何？人大最新《基于大型语言模型的自主智能体》综述

大模型和智能体如何结何？人大最新《基于大型语言模型的自主智能体》综述

专知会员服务

160+阅读 · 2023年8月23日

最新综述论文《人类与人工智能交互中的信任：确定模型、措施和方法》东京工业大学

最新综述论文《人类与人工智能交互中的信任：确定模型、措施和方法》东京工业大学

专知会员服务

30+阅读 · 2022年6月16日

【AI+军事】paper速读：《群体智能中的异常检测和可解释AI（XAI）概念》，北约研讨会

【AI+军事】paper速读：《群体智能中的异常检测和可解释AI（XAI）概念》，北约研讨会

专知会员服务

131+阅读 · 2022年4月1日

深度神经网络模型的个体差异，Individual differences among deep neural network models

深度神经网络模型的个体差异，Individual differences among deep neural network models

专知会员服务

10+阅读 · 2020年1月11日

3D Human相关研究总结：人体、姿态估计、人体重建等

3D Human相关研究总结：人体、姿态估计、人体重建等

PaperWeekly

27+阅读 · 2021年3月1日

【人机融合智能】人机融合智能的现状与展望

【人机融合智能】人机融合智能的现状与展望

产业智能官

11+阅读 · 2020年3月18日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

面向人工智能的计算机体系结构

面向人工智能的计算机体系结构

计算机研究与发展

14+阅读 · 2019年6月6日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

【知识图谱】知识图谱+人工智能=新型网络信息体系

【知识图谱】知识图谱+人工智能=新型网络信息体系

产业智能官

14+阅读 · 2018年11月18日

最新人机对话系统简略综述

最新人机对话系统简略综述

专知

26+阅读 · 2018年3月10日

CCCF专栏文章：人机共融智能

CCCF专栏文章：人机共融智能

中国计算机学会

15+阅读 · 2017年12月21日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

机器人圈

35+阅读 · 2017年7月18日

动态社会网络中异质交互观点演化动力学建模及分析研究

国家自然科学基金

1+阅读 · 2016年12月31日

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

人体行为识别的时空耦合随机图模型及其高效推理算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于无线传感网的工业人机交互网络移动接入与动态路由机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向社群智能的认知网络中机会数据通信机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

仿人轻型机械臂人机协作模式关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于社会媒体异质关系挖掘的用户兴趣建模方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

Toward Human-Centered Human-AI Interaction: Advances in Theoretical Frameworks and Practice

Arxiv

0+阅读 · 2月18日

Modeling AI-Human Collaboration as a Multi-Agent Adaptation

Arxiv

0+阅读 · 2月15日

Agentic AI for Cybersecurity: A Meta-Cognitive Architecture for Governable Autonomy

Arxiv

0+阅读 · 2月12日

Exploring the Interplay Between Voice, Personality, and Gender in Human-Agent Interactions

Arxiv

0+阅读 · 2月11日

Agentifying Agentic AI

Arxiv

0+阅读 · 2月10日

Proactive Agents, Long-term User Context, VLM Annotation, Privacy Protection, Human-Computer Interaction

Arxiv

0+阅读 · 2月4日

Avenir-Web: Human-Experience-Imitating Multimodal Web Agents with Mixture of Grounding Experts

Arxiv

0+阅读 · 2月2日

Normative Equivalence in Human-AI Cooperation: Behaviour, Not Identity, Drives Cooperation in Mixed-Agent Groups

Arxiv

0+阅读 · 1月29日

Normative Equivalence in human-AI Cooperation: Behaviour, Not Identity, Drives Cooperation in Mixed-Agent Groups

Arxiv

0+阅读 · 1月28日

Agentic Artificial Intelligence (AI): Architectures, Taxonomies, and Evaluation of Large Language Model Agents

Arxiv

0+阅读 · 1月18日

VIP会员

文章信息

相关主题

相关VIP内容

《多域人机交互研究》95页

《多域人机交互研究》95页

专知会员服务

35+阅读 · 2025年6月2日

Agent AI：多模态交互的新地平线

Agent AI：多模态交互的新地平线

专知会员服务

21+阅读 · 2025年5月26日

【斯坦福博士论文】构建类人化具身智能体：从人类行为中学习

【斯坦福博士论文】构建类人化具身智能体：从人类行为中学习

专知会员服务

25+阅读 · 2025年3月20日

《人类-人工智能握手框架：人与人工智能合作的双向方法》

《人类-人工智能握手框架：人与人工智能合作的双向方法》

专知会员服务

39+阅读 · 2025年2月5日

《对话式AI智能体：研究人工智能在人机交互中诱发拟人化和信任的特定特征》208页

《对话式AI智能体：研究人工智能在人机交互中诱发拟人化和信任的特定特征》208页

专知会员服务

31+阅读 · 2024年7月27日

多模态智能体AI开启新浪潮！李飞飞等14位斯坦福微软大牛等撰写 80页《AGENT AI: 综述多模态交互的前沿展望》

多模态智能体AI开启新浪潮！李飞飞等14位斯坦福微软大牛等撰写 80页《AGENT AI: 综述多模态交互的前沿展望》

专知会员服务

202+阅读 · 2024年1月9日

大模型和智能体如何结何？人大最新《基于大型语言模型的自主智能体》综述

大模型和智能体如何结何？人大最新《基于大型语言模型的自主智能体》综述

专知会员服务

160+阅读 · 2023年8月23日

最新综述论文《人类与人工智能交互中的信任：确定模型、措施和方法》东京工业大学

最新综述论文《人类与人工智能交互中的信任：确定模型、措施和方法》东京工业大学

专知会员服务

30+阅读 · 2022年6月16日

【AI+军事】paper速读：《群体智能中的异常检测和可解释AI（XAI）概念》，北约研讨会

【AI+军事】paper速读：《群体智能中的异常检测和可解释AI（XAI）概念》，北约研讨会

专知会员服务

131+阅读 · 2022年4月1日

深度神经网络模型的个体差异，Individual differences among deep neural network models

深度神经网络模型的个体差异，Individual differences among deep neural network models

专知会员服务

10+阅读 · 2020年1月11日

热门VIP内容

开通专知VIP会员享更多权益服务

《可信人工智能赋能系统的支柱》

《从经典神经网络到不确定性下的拓扑神经网络：军事应用》2026最新40页报告

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

《人工智能：对战略与力量的影响》slides

相关资讯

3D Human相关研究总结：人体、姿态估计、人体重建等

3D Human相关研究总结：人体、姿态估计、人体重建等

PaperWeekly

27+阅读 · 2021年3月1日

【人机融合智能】人机融合智能的现状与展望

【人机融合智能】人机融合智能的现状与展望

产业智能官

11+阅读 · 2020年3月18日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

面向人工智能的计算机体系结构

面向人工智能的计算机体系结构

计算机研究与发展

14+阅读 · 2019年6月6日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

【知识图谱】知识图谱+人工智能=新型网络信息体系

【知识图谱】知识图谱+人工智能=新型网络信息体系

产业智能官

14+阅读 · 2018年11月18日

最新人机对话系统简略综述

最新人机对话系统简略综述

专知

26+阅读 · 2018年3月10日

CCCF专栏文章：人机共融智能

CCCF专栏文章：人机共融智能

中国计算机学会

15+阅读 · 2017年12月21日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

机器人圈

35+阅读 · 2017年7月18日

相关论文

Toward Human-Centered Human-AI Interaction: Advances in Theoretical Frameworks and Practice

Arxiv

0+阅读 · 2月18日

Modeling AI-Human Collaboration as a Multi-Agent Adaptation

Arxiv

0+阅读 · 2月15日

Agentic AI for Cybersecurity: A Meta-Cognitive Architecture for Governable Autonomy

Arxiv

0+阅读 · 2月12日

Exploring the Interplay Between Voice, Personality, and Gender in Human-Agent Interactions

Arxiv

0+阅读 · 2月11日

Agentifying Agentic AI

Arxiv

0+阅读 · 2月10日

Proactive Agents, Long-term User Context, VLM Annotation, Privacy Protection, Human-Computer Interaction

Arxiv

0+阅读 · 2月4日

Avenir-Web: Human-Experience-Imitating Multimodal Web Agents with Mixture of Grounding Experts

Arxiv

0+阅读 · 2月2日

Normative Equivalence in Human-AI Cooperation: Behaviour, Not Identity, Drives Cooperation in Mixed-Agent Groups

Arxiv

0+阅读 · 1月29日

Normative Equivalence in human-AI Cooperation: Behaviour, Not Identity, Drives Cooperation in Mixed-Agent Groups

Arxiv

0+阅读 · 1月28日

Agentic Artificial Intelligence (AI): Architectures, Taxonomies, and Evaluation of Large Language Model Agents

Arxiv

0+阅读 · 1月18日

相关基金

动态社会网络中异质交互观点演化动力学建模及分析研究

国家自然科学基金

1+阅读 · 2016年12月31日

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

人体行为识别的时空耦合随机图模型及其高效推理算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于无线传感网的工业人机交互网络移动接入与动态路由机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向社群智能的认知网络中机会数据通信机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

仿人轻型机械臂人机协作模式关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于社会媒体异质关系挖掘的用户兴趣建模方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员