WebTrap Park: An Automated Platform for Systematic Security Evaluation of Web Agents - 专知论文

会员服务 ·

0

WEB · 安全评估 · 系统 · 自动化平台 · 智能体 ·

WebTrap Park: An Automated Platform for Systematic Security Evaluation of Web Agents

翻译：WebTrap Park：面向Web智能体的系统性安全评估自动化平台

Xinyi Wu,Jiagui Chen,Geng Hong,Jiayi Dong,Xudong Pan,Jiarun Dai,Min Yang

Web Agents are increasingly deployed to perform complex tasks in real web environments, yet their security evaluation remains fragmented and difficult to standardize. We present WebTrap Park, an automated platform for systematic security evaluation of Web Agents through direct observation of their concrete interactions with live web pages. WebTrap Park instantiates three major sources of security risk into 1,226 executable evaluation tasks and enables action based assessment without requiring agent modification. Our results reveal clear security differences across agent frameworks, highlighting the importance of agent architecture beyond the underlying model. WebTrap Park is publicly accessible at https://security.fudan.edu.cn/webagent and provides a scalable foundation for reproducible Web Agent security evaluation.

翻译：Web智能体正越来越多地被部署于真实网络环境中执行复杂任务，但其安全评估工作仍处于碎片化状态，难以标准化。本文提出WebTrap Park，这是一个通过直接观察Web智能体与真实网页具体交互行为，从而对其进行系统性安全评估的自动化平台。WebTrap Park将三类主要安全风险来源实例化为1,226个可执行评估任务，并支持无需修改智能体本身的行为式评估。我们的实验结果揭示了不同智能体框架间显著的安全性能差异，凸显了除底层模型外智能体架构本身的重要性。WebTrap Park已在 https://security.fudan.edu.cn/webagent 公开访问，为可复现的Web智能体安全评估提供了一个可扩展的基础平台。

0

相关内容

WEB

通用智能体评估的逻辑架构

通用智能体评估的逻辑架构

专知会员服务

22+阅读 · 2月28日

OpenEarthAgent：一种面向工具增强型地理空间智能体的统一框架

OpenEarthAgent：一种面向工具增强型地理空间智能体的统一框架

专知会员服务

16+阅读 · 2月20日

保护网络物理系统中的 AI 智能体：关于环境交互、深度伪造威胁及其防御技术的综述

保护网络物理系统中的 AI 智能体：关于环境交互、深度伪造威胁及其防御技术的综述

专知会员服务

10+阅读 · 2月15日

智能体化 AI 与网络安全综述：挑战、机遇与用例原型

智能体化 AI 与网络安全综述：挑战、机遇与用例原型

专知会员服务

30+阅读 · 1月13日

AI 智能体系统：体系架构、应用场景及评估范式

AI 智能体系统：体系架构、应用场景及评估范式

专知会员服务

70+阅读 · 1月6日

智能体安全综述：应用、威胁与防御

智能体安全综述：应用、威胁与防御

专知会员服务

45+阅读 · 2025年10月12日

AI智能体基础设施

AI智能体基础设施

专知会员服务

44+阅读 · 2025年7月12日

智慧安全产业发展白皮书

智慧安全产业发展白皮书

专知会员服务

71+阅读 · 2022年8月26日

最新报告64页《军事中的人工智能和自主性：北约成员国的战略和部署概述》北约卓越合作网络防御中心，Artificial Intelligence and Autonomy in the Military: An Overview of NATO Member States’ Strategies and Deployment

最新报告64页《军事中的人工智能和自主性：北约成员国的战略和部署概述》北约卓越合作网络防御中心，Artificial Intelligence and Autonomy in the Military: An Overview of NATO Member States’ Strategies and Deployment

专知会员服务

32+阅读 · 2022年4月7日

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

专知会员服务

22+阅读 · 2022年3月29日

《人工智能安全测评白皮书》，99页pdf

《人工智能安全测评白皮书》，99页pdf

专知

36+阅读 · 2022年2月26日

MediaPipe：Google Research 开源的跨平台多媒体机器学习模型应用框架

MediaPipe：Google Research 开源的跨平台多媒体机器学习模型应用框架

AI100

17+阅读 · 2019年9月14日

微信小程序支持webP的WebAssembly方案

微信小程序支持webP的WebAssembly方案

前端之巅

19+阅读 · 2019年8月14日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

【知识图谱】知识图谱+人工智能=新型网络信息体系

【知识图谱】知识图谱+人工智能=新型网络信息体系

产业智能官

14+阅读 · 2018年11月18日

探秘各种主流周界安防技术产品

探秘各种主流周界安防技术产品

未来产业促进会

12+阅读 · 2018年11月16日

网络安全态势感知

网络安全态势感知

计算机与网络安全

26+阅读 · 2018年10月14日

智慧公路建设方案

智慧公路建设方案

智能交通技术

30+阅读 · 2018年2月28日

网络安全态势感知浅析

网络安全态势感知浅析

计算机与网络安全

18+阅读 · 2017年10月13日

基于机器学习的KPI自动化异常检测系统

基于机器学习的KPI自动化异常检测系统

运维帮

13+阅读 · 2017年8月16日

面向网络系统的一致性安全隐私分析与防护机制设计

国家自然科学基金

2+阅读 · 2017年12月31日

面向隐私保护的地理社交网络个性化推荐方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

移动社会网络中众包系统的可信机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向车联网的交通网络涌现行为建模

国家自然科学基金

8+阅读 · 2015年12月31日

网络空间安全关键技术研究

国家自然科学基金

20+阅读 · 2015年12月31日

移动社会网络中情境感知的多维个性化信任评价研究

国家自然科学基金

2+阅读 · 2015年12月31日

网络化控制系统安全理论与关键技术

国家自然科学基金

1+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于智能信息处理的Web服务可信性预测与评估技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

Persona2Web: Benchmarking Personalized Web Agents for Contextual Reasoning with User History

Arxiv

0+阅读 · 2月19日

Agentic AI for Cybersecurity: A Meta-Cognitive Architecture for Governable Autonomy

Arxiv

1+阅读 · 2月16日

EmbeWebAgent: Embedding Web Agents into Any Customized UI

Arxiv

0+阅读 · 2月16日

WebWorld: A Large-Scale World Model for Web Agent Training

Arxiv

0+阅读 · 2月16日

AutoWebWorld: Synthesizing Infinite Verifiable Web Environments via Finite State Machines

Arxiv

0+阅读 · 2月15日

NAAMSE: Framework for Evolutionary Security Evaluation of Agents

Arxiv

0+阅读 · 2月7日

Avenir-Web: Human-Experience-Imitating Multimodal Web Agents with Mixture of Grounding Experts

Arxiv

0+阅读 · 2月2日

AgentDoG: A Diagnostic Guardrail Framework for AI Agent Safety and Security

Arxiv

0+阅读 · 1月26日

SafePro: Evaluating the Safety of Professional-Level AI Agents

Arxiv

0+阅读 · 1月13日

Sola-Visibility-ISPM: Benchmarking Agentic AI for Identity Security Posture Management Visibility

Arxiv

0+阅读 · 1月11日

VIP会员

文章信息

相关主题

自动化平台

最新内容

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

1+阅读 · 今天2:42

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

1+阅读 · 今天2:37

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

2+阅读 · 今天2:23

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

5+阅读 · 今天2:21

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

2+阅读 · 今天1:46

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

4+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

3+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

8+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

7+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

相关VIP内容

通用智能体评估的逻辑架构

通用智能体评估的逻辑架构

专知会员服务

22+阅读 · 2月28日

OpenEarthAgent：一种面向工具增强型地理空间智能体的统一框架

OpenEarthAgent：一种面向工具增强型地理空间智能体的统一框架

专知会员服务

16+阅读 · 2月20日

保护网络物理系统中的 AI 智能体：关于环境交互、深度伪造威胁及其防御技术的综述

保护网络物理系统中的 AI 智能体：关于环境交互、深度伪造威胁及其防御技术的综述

专知会员服务

10+阅读 · 2月15日

智能体化 AI 与网络安全综述：挑战、机遇与用例原型

智能体化 AI 与网络安全综述：挑战、机遇与用例原型

专知会员服务

30+阅读 · 1月13日

AI 智能体系统：体系架构、应用场景及评估范式

AI 智能体系统：体系架构、应用场景及评估范式

专知会员服务

70+阅读 · 1月6日

智能体安全综述：应用、威胁与防御

智能体安全综述：应用、威胁与防御

专知会员服务

45+阅读 · 2025年10月12日

AI智能体基础设施

AI智能体基础设施

专知会员服务

44+阅读 · 2025年7月12日

智慧安全产业发展白皮书

智慧安全产业发展白皮书

专知会员服务

71+阅读 · 2022年8月26日

最新报告64页《军事中的人工智能和自主性：北约成员国的战略和部署概述》北约卓越合作网络防御中心，Artificial Intelligence and Autonomy in the Military: An Overview of NATO Member States’ Strategies and Deployment

最新报告64页《军事中的人工智能和自主性：北约成员国的战略和部署概述》北约卓越合作网络防御中心，Artificial Intelligence and Autonomy in the Military: An Overview of NATO Member States’ Strategies and Deployment

专知会员服务

32+阅读 · 2022年4月7日

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

专知会员服务

22+阅读 · 2022年3月29日

热门VIP内容

开通专知VIP会员享更多权益服务

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

从采集到决策：美军视角下的战术情报范式重构

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

相关资讯

《人工智能安全测评白皮书》，99页pdf

《人工智能安全测评白皮书》，99页pdf

专知

36+阅读 · 2022年2月26日

MediaPipe：Google Research 开源的跨平台多媒体机器学习模型应用框架

MediaPipe：Google Research 开源的跨平台多媒体机器学习模型应用框架

AI100

17+阅读 · 2019年9月14日

微信小程序支持webP的WebAssembly方案

微信小程序支持webP的WebAssembly方案

前端之巅

19+阅读 · 2019年8月14日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

【知识图谱】知识图谱+人工智能=新型网络信息体系

【知识图谱】知识图谱+人工智能=新型网络信息体系

产业智能官

14+阅读 · 2018年11月18日

探秘各种主流周界安防技术产品

探秘各种主流周界安防技术产品

未来产业促进会

12+阅读 · 2018年11月16日

网络安全态势感知

网络安全态势感知

计算机与网络安全

26+阅读 · 2018年10月14日

智慧公路建设方案

智慧公路建设方案

智能交通技术

30+阅读 · 2018年2月28日

网络安全态势感知浅析

网络安全态势感知浅析

计算机与网络安全

18+阅读 · 2017年10月13日

基于机器学习的KPI自动化异常检测系统

基于机器学习的KPI自动化异常检测系统

运维帮

13+阅读 · 2017年8月16日

相关论文

Persona2Web: Benchmarking Personalized Web Agents for Contextual Reasoning with User History

Arxiv

0+阅读 · 2月19日

Agentic AI for Cybersecurity: A Meta-Cognitive Architecture for Governable Autonomy

Arxiv

1+阅读 · 2月16日

EmbeWebAgent: Embedding Web Agents into Any Customized UI

Arxiv

0+阅读 · 2月16日

WebWorld: A Large-Scale World Model for Web Agent Training

Arxiv

0+阅读 · 2月16日

AutoWebWorld: Synthesizing Infinite Verifiable Web Environments via Finite State Machines

Arxiv

0+阅读 · 2月15日

NAAMSE: Framework for Evolutionary Security Evaluation of Agents

Arxiv

0+阅读 · 2月7日

Avenir-Web: Human-Experience-Imitating Multimodal Web Agents with Mixture of Grounding Experts

Arxiv

0+阅读 · 2月2日

AgentDoG: A Diagnostic Guardrail Framework for AI Agent Safety and Security

Arxiv

0+阅读 · 1月26日

SafePro: Evaluating the Safety of Professional-Level AI Agents

Arxiv

0+阅读 · 1月13日

Sola-Visibility-ISPM: Benchmarking Agentic AI for Identity Security Posture Management Visibility

Arxiv

0+阅读 · 1月11日

相关基金

面向网络系统的一致性安全隐私分析与防护机制设计

国家自然科学基金

2+阅读 · 2017年12月31日

面向隐私保护的地理社交网络个性化推荐方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

移动社会网络中众包系统的可信机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向车联网的交通网络涌现行为建模

国家自然科学基金

8+阅读 · 2015年12月31日

网络空间安全关键技术研究

国家自然科学基金

20+阅读 · 2015年12月31日

移动社会网络中情境感知的多维个性化信任评价研究

国家自然科学基金

2+阅读 · 2015年12月31日

网络化控制系统安全理论与关键技术

国家自然科学基金

1+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于智能信息处理的Web服务可信性预测与评估技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员