Data Agents Under Attack: Vulnerabilities in LLM-Driven Analytical Systems - 专知论文

会员服务 ·

0

攻击 · 分析 · 系统 · 数据库 · 脆弱性 ·

Data Agents Under Attack: Vulnerabilities in LLM-Driven Analytical Systems

翻译：警惕数据代理攻击：LLM驱动分析系统的脆弱性研究

Kuncan Wang,Ziting Wang,Peizhuo Lv,Haoyang Li,Guoliang Li,Gao Cong,Wei Dong

Data agents integrate LLM-driven reasoning with relational data access, executable analytical tools, and multi-step workflow orchestration, making them increasingly central to enterprise analytics. This integration introduces new security vulnerabilities across data resources, database execution, and agent reasoning, recombining concerns from database security and general-purpose LLM-agent security into failure modes that neither line of work captures on its own. To address this gap, we present a systematic security study of data agents. Our contributions are threefold. First, we develop a layered vulnerability framework that identifies eight data agent-specific risks across interpretation, execution, and policy layers. Second, we introduce an attack taxonomy organized by adversary goal, tactic, and technique, covering three goals, seven tactics, and fourteen techniques, and pair it with an LLM-driven payload generation pipeline grounded in real database schemas. Third, we evaluate these attacks on six systems, including four open-source data agents and two production cloud analytics services. Our experiments reveal substantial security vulnerabilities across current systems and yield four key takeaways.

翻译：数据代理将LLM驱动的推理与关系数据访问、可执行分析工具及多步骤工作流编排相结合，在企业分析中日益占据核心地位。这种整合引入了数据资源、数据库执行与代理推理层面的新型安全漏洞，将数据库安全与通用LLM代理安全领域的问题重组为现有研究均无法单独涵盖的失效模式。为填补这一空白，我们开展了数据代理的系统性安全研究。本文贡献有三：其一，构建分层脆弱性框架，识别出解释层、执行层与策略层八种数据代理特有风险；其二，提出以攻击者目标、战术与技术为核心的组织化攻击分类体系，涵盖三种目标、七种战术与十四种技术，并配套基于真实数据库模式的LLM驱动载荷生成流水线；其三，在六套系统（包括四款开源数据代理与两款生产级云分析服务）上开展攻击评估。实验揭示了当前系统的重大安全漏洞，并得出四项关键发现。

0

相关内容

《基于模型与数据驱动方法的网络物理系统隐蔽与重放攻击检测及辨识》179页

《基于模型与数据驱动方法的网络物理系统隐蔽与重放攻击检测及辨识》179页

专知会员服务

10+阅读 · 7月10日

当AI代理处理机密：面向代理式AI的机密计算综述

当AI代理处理机密：面向代理式AI的机密计算综述

专知会员服务

11+阅读 · 5月9日

大语言模型智能体（LLM Agents）工具调用的演进：从单工具调用到多工具协同编排

大语言模型智能体（LLM Agents）工具调用的演进：从单工具调用到多工具协同编排

专知会员服务

29+阅读 · 4月6日

LLM/智能体作为数据分析师：综述

LLM/智能体作为数据分析师：综述

专知会员服务

38+阅读 · 2025年9月30日

大型语言模型代理的安全与隐私综述

大型语言模型代理的安全与隐私综述

专知会员服务

30+阅读 · 2024年8月5日

揭秘NVIDIA大模型推理框架：TensorRT-LLM

揭秘NVIDIA大模型推理框架：TensorRT-LLM

专知会员服务

56+阅读 · 2024年2月1日

AI Agent下一个热点？复旦最新86页《大型语言模型智能体的崛起与潜力》综述，详述LLM Agent: 大脑、感知和行动

AI Agent下一个热点？复旦最新86页《大型语言模型智能体的崛起与潜力》综述，详述LLM Agent: 大脑、感知和行动

专知会员服务

170+阅读 · 2023年9月15日

《数据安全治理自动化技术框架》白皮书发布，47页pdf

《数据安全治理自动化技术框架》白皮书发布，47页pdf

专知会员服务

61+阅读 · 2022年9月9日

数据安全治理白皮书, 35页pdf

专知会员服务

132+阅读 · 2021年6月18日

网络攻击模型研究综述

专知会员服务

57+阅读 · 2020年12月28日

如何做数据治理？

如何做数据治理？

智能交通技术

19+阅读 · 2019年4月20日

微软重磅开源Recommenders：企业级可扩展推荐系统实践指南

微软重磅开源Recommenders：企业级可扩展推荐系统实践指南

AI前线

46+阅读 · 2019年2月25日

清华178页深度报告：一文看懂AI数据挖掘

清华178页深度报告：一文看懂AI数据挖掘

人工智能学家

10+阅读 · 2019年2月18日

【大数据】海量数据分析能力形成和大数据关键技术

【大数据】海量数据分析能力形成和大数据关键技术

产业智能官

17+阅读 · 2018年10月29日

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

产业智能官

12+阅读 · 2018年10月22日

NetworkMiner - 网络取证分析工具

NetworkMiner - 网络取证分析工具

黑白之道

16+阅读 · 2018年6月29日

【入门】数据分析六部曲

【入门】数据分析六部曲

36大数据

18+阅读 · 2017年12月6日

阿里流行音乐趋势预测-深度学习LSTM网络实现代码分享

阿里流行音乐趋势预测-深度学习LSTM网络实现代码分享

机器学习研究会

11+阅读 · 2017年12月5日

网络安全态势感知浅析

网络安全态势感知浅析

计算机与网络安全

18+阅读 · 2017年10月13日

知识提取的一种应用，从上市公司年报中抽取因果关系

知识提取的一种应用，从上市公司年报中抽取因果关系

文因互联

10+阅读 · 2017年7月7日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络空间安全关键技术研究

国家自然科学基金

20+阅读 · 2015年12月31日

分布式中继网络中的物理层攻击检测技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于网络活动分析的窃密木马检测技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

集群环境下内存空间数据库管理与查询技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于agent与众包数据获取服务的企业决策支持关键方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

面向大数据的粒计算理论与方法

国家自然科学基金

4+阅读 · 2014年12月31日

Trustworthy Self-Composable Big-Data-as-a-Service: An LLM-Orchestrated Multi-Agent Framework for Automated Data Engineering, AutoML, MLOps Deployment, and Drift-Aware Lifecycle Optimization

Arxiv

0+阅读 · 6月16日

Breaking the Code: Security Assessment of AI Code Agents Through Systematic Jailbreaking Attacks

Arxiv

0+阅读 · 6月15日

Toward Secure LLM Agents: Threat Surfaces, Attacks, Defenses, and Evaluation

Arxiv

0+阅读 · 6月9日

From Untrusted Input to Trusted Memory: A Systematic Study of Memory Poisoning Attacks in LLM Agents

Arxiv

0+阅读 · 6月3日

LLM Anonymization Against Agentic Re-Identification

Arxiv

0+阅读 · 6月1日

AgentRedBench: Dynamic Redteaming and Integration-Aware Defense for LLM Agents over SaaS Integrations

Arxiv

0+阅读 · 6月1日

Needles at Scale: LLM-Assisted Target Selection for Windows Vulnerability Research

Arxiv

0+阅读 · 5月31日

What Breaks When LLMs Code? Characterizing Operational Safety Failures of Agentic Code Assistants

Arxiv

0+阅读 · 5月29日

SafeSearch: Automated Red-Teaming of LLM-Based Search Agents

Arxiv

0+阅读 · 5月28日

Searching for Privacy Risks in LLM Agents via Simulation

Arxiv

0+阅读 · 5月8日

VIP会员

文章信息

相关主题

最新内容

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 今天4:35

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

4+阅读 · 今天4:24

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

3+阅读 · 今天4:18

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 今天4:15

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 今天4:08

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

7+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

7+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

“史诗怒火”行动：现代多域作战的重要节点

“史诗怒火”行动：现代多域作战的重要节点

专知会员服务

8+阅读 · 7月30日

《下一代无线网络中的多无人机通信资源管理》

《下一代无线网络中的多无人机通信资源管理》

专知会员服务

8+阅读 · 7月30日

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

专知会员服务

9+阅读 · 7月30日

《人机协同在安全关键型操作决策中的应用》120页

《人机协同在安全关键型操作决策中的应用》120页

专知会员服务

8+阅读 · 7月30日

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

专知会员服务

6+阅读 · 7月30日

相关VIP内容

《基于模型与数据驱动方法的网络物理系统隐蔽与重放攻击检测及辨识》179页

《基于模型与数据驱动方法的网络物理系统隐蔽与重放攻击检测及辨识》179页

专知会员服务

10+阅读 · 7月10日

当AI代理处理机密：面向代理式AI的机密计算综述

当AI代理处理机密：面向代理式AI的机密计算综述

专知会员服务

11+阅读 · 5月9日

大语言模型智能体（LLM Agents）工具调用的演进：从单工具调用到多工具协同编排

大语言模型智能体（LLM Agents）工具调用的演进：从单工具调用到多工具协同编排

专知会员服务

29+阅读 · 4月6日

LLM/智能体作为数据分析师：综述

LLM/智能体作为数据分析师：综述

专知会员服务

38+阅读 · 2025年9月30日

大型语言模型代理的安全与隐私综述

大型语言模型代理的安全与隐私综述

专知会员服务

30+阅读 · 2024年8月5日

揭秘NVIDIA大模型推理框架：TensorRT-LLM

揭秘NVIDIA大模型推理框架：TensorRT-LLM

专知会员服务

56+阅读 · 2024年2月1日

AI Agent下一个热点？复旦最新86页《大型语言模型智能体的崛起与潜力》综述，详述LLM Agent: 大脑、感知和行动

AI Agent下一个热点？复旦最新86页《大型语言模型智能体的崛起与潜力》综述，详述LLM Agent: 大脑、感知和行动

专知会员服务

170+阅读 · 2023年9月15日

《数据安全治理自动化技术框架》白皮书发布，47页pdf

《数据安全治理自动化技术框架》白皮书发布，47页pdf

专知会员服务

61+阅读 · 2022年9月9日

数据安全治理白皮书, 35页pdf

专知会员服务

132+阅读 · 2021年6月18日

网络攻击模型研究综述

专知会员服务

57+阅读 · 2020年12月28日

热门VIP内容

开通专知VIP会员享更多权益服务

隐身技术前沿综述：物理机理、工程实践与战略展望

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

相关资讯

如何做数据治理？

如何做数据治理？

智能交通技术

19+阅读 · 2019年4月20日

微软重磅开源Recommenders：企业级可扩展推荐系统实践指南

微软重磅开源Recommenders：企业级可扩展推荐系统实践指南

AI前线

46+阅读 · 2019年2月25日

清华178页深度报告：一文看懂AI数据挖掘

清华178页深度报告：一文看懂AI数据挖掘

人工智能学家

10+阅读 · 2019年2月18日

【大数据】海量数据分析能力形成和大数据关键技术

【大数据】海量数据分析能力形成和大数据关键技术

产业智能官

17+阅读 · 2018年10月29日

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

产业智能官

12+阅读 · 2018年10月22日

NetworkMiner - 网络取证分析工具

NetworkMiner - 网络取证分析工具

黑白之道

16+阅读 · 2018年6月29日

【入门】数据分析六部曲

【入门】数据分析六部曲

36大数据

18+阅读 · 2017年12月6日

阿里流行音乐趋势预测-深度学习LSTM网络实现代码分享

阿里流行音乐趋势预测-深度学习LSTM网络实现代码分享

机器学习研究会

11+阅读 · 2017年12月5日

网络安全态势感知浅析

网络安全态势感知浅析

计算机与网络安全

18+阅读 · 2017年10月13日

知识提取的一种应用，从上市公司年报中抽取因果关系

知识提取的一种应用，从上市公司年报中抽取因果关系

文因互联

10+阅读 · 2017年7月7日

相关论文

Trustworthy Self-Composable Big-Data-as-a-Service: An LLM-Orchestrated Multi-Agent Framework for Automated Data Engineering, AutoML, MLOps Deployment, and Drift-Aware Lifecycle Optimization

Arxiv

0+阅读 · 6月16日

Breaking the Code: Security Assessment of AI Code Agents Through Systematic Jailbreaking Attacks

Arxiv

0+阅读 · 6月15日

Toward Secure LLM Agents: Threat Surfaces, Attacks, Defenses, and Evaluation

Arxiv

0+阅读 · 6月9日

From Untrusted Input to Trusted Memory: A Systematic Study of Memory Poisoning Attacks in LLM Agents

Arxiv

0+阅读 · 6月3日

LLM Anonymization Against Agentic Re-Identification

Arxiv

0+阅读 · 6月1日

AgentRedBench: Dynamic Redteaming and Integration-Aware Defense for LLM Agents over SaaS Integrations

Arxiv

0+阅读 · 6月1日

Needles at Scale: LLM-Assisted Target Selection for Windows Vulnerability Research

Arxiv

0+阅读 · 5月31日

What Breaks When LLMs Code? Characterizing Operational Safety Failures of Agentic Code Assistants

Arxiv

0+阅读 · 5月29日

SafeSearch: Automated Red-Teaming of LLM-Based Search Agents

Arxiv

0+阅读 · 5月28日

Searching for Privacy Risks in LLM Agents via Simulation

Arxiv

0+阅读 · 5月8日

相关基金

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络空间安全关键技术研究

国家自然科学基金

20+阅读 · 2015年12月31日

分布式中继网络中的物理层攻击检测技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于网络活动分析的窃密木马检测技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

集群环境下内存空间数据库管理与查询技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于agent与众包数据获取服务的企业决策支持关键方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

面向大数据的粒计算理论与方法

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员