AI Security Research Should Better Incentivize Defense Research - 专知论文

会员服务 ·

0

AI · 攻击 · 不平衡 · 论文 · 智能安全 ·

AI Security Research Should Better Incentivize Defense Research

翻译：AI安全研究应更有效地激励防御研究

from arxiv, 14 pages,3 figures,3 tables

This work examines an imbalance in artificial intelligence (AI) security research: the field tends to produce more work on attacking AI systems than on defending them. Drawing on related academic papers, we find biased attack-to-defense ratios across subfields, including federated learning, speech recognition, membership inference, large language models, etc. The imbalance possibly means far beyond a simple count: attack papers are routinely evaluated under favorable conditions that make threats look more severe than they are in practice, while defenses are held to a stricter standard that few can meet. The result is a literature rich in demonstrated vulnerabilities and thin on usable and deployed protections. We thus argue that AI security research should better incentivize defense research.

翻译：本研究探讨了人工智能安全研究中存在的不平衡现象：该领域倾向于产出更多关于攻击AI系统的研究，而非防御研究。通过梳理相关学术论文，我们发现联邦学习、语音识别、成员推断、大语言模型等子领域均存在偏向攻击的研究与防御研究的比例失调。这种不平衡的影响可能远超简单的数量统计：攻击类论文通常基于有利条件进行评估，使得威胁看起来比实际更严重，而防御类研究则面临更严格的标准，鲜有能达标者。这导致相关文献虽充斥着已论证的漏洞，但在可用且已部署的保护措施方面却十分薄弱。因此，我们认为AI安全研究应更有效地激励防御类研究。

0

相关内容

人工智能杂志AI(Artificial Intelligence)是目前公认的发表该领域最新研究成果的主要国际论坛。该期刊欢迎有关AI广泛方面的论文，这些论文构成了整个领域的进步，也欢迎介绍人工智能应用的论文，但重点应该放在新的和新颖的人工智能方法如何提高应用领域的性能，而不是介绍传统人工智能方法的另一个应用。关于应用的论文应该描述一个原则性的解决方案，强调其新颖性，并对正在开发的人工智能技术进行深入的评估。官网地址：http://dblp.uni-trier.de/db/journals/ai/

《人工智能在网络防御中的机遇》

《人工智能在网络防御中的机遇》

专知会员服务

8+阅读 · 6月8日

《作战研究是实现战场人工智能潜力的关键》

《作战研究是实现战场人工智能潜力的关键》

专知会员服务

38+阅读 · 4月8日

确保国防任务中的人工智能安全：多层次方法

确保国防任务中的人工智能安全：多层次方法

专知会员服务

16+阅读 · 1月21日

《面向未来：军事应用中基于人工智能融合的场景分析及其对全球安全的影响》

《面向未来：军事应用中基于人工智能融合的场景分析及其对全球安全的影响》

专知会员服务

21+阅读 · 2025年7月13日

推荐！《人工智能在武器系统中的应用》美智库-国防系统信息分析中心(DSIAC)2022最新92页报告

推荐！《人工智能在武器系统中的应用》美智库-国防系统信息分析中心(DSIAC)2022最新92页报告

专知会员服务

256+阅读 · 2022年10月16日

华为《AI安全白皮书》对抗性人工智能：AI攻击、AI防御典型方式

华为《AI安全白皮书》对抗性人工智能：AI攻击、AI防御典型方式

专知会员服务

89+阅读 · 2022年4月29日

【AI+军事】附论文《敏感还是不敏感？如何攻击和捍卫文件安全分类模型》

【AI+军事】附论文《敏感还是不敏感？如何攻击和捍卫文件安全分类模型》

专知会员服务

19+阅读 · 2022年4月26日

【AI+ 军事】美政府问责局（GAO）最新《人工智能：国防部应改进策略和流程并加强协作指导》报告，97页pdf

【AI+ 军事】美政府问责局（GAO）最新《人工智能：国防部应改进策略和流程并加强协作指导》报告，97页pdf

专知会员服务

87+阅读 · 2022年4月11日

人工智能模型数据泄露的攻击与防御研究综述

人工智能模型数据泄露的攻击与防御研究综述

专知会员服务

77+阅读 · 2021年3月31日

深度学习的对抗攻击与防御方法综述

专知会员服务

99+阅读 · 2020年12月8日

【美海军·系统顶点项目报告】《用于防空和导弹防御的自动作战管理辅助工具（AI）的安全风险评估》162页PDF

【美海军·系统顶点项目报告】《用于防空和导弹防御的自动作战管理辅助工具（AI）的安全风险评估》162页PDF

专知

40+阅读 · 2022年10月19日

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

专知

102+阅读 · 2022年10月17日

推荐！【中文版】《人工智能在军事应用中的可能性和挑战》瑞典国防研究局16页报告

推荐！【中文版】《人工智能在军事应用中的可能性和挑战》瑞典国防研究局16页报告

专知

87+阅读 · 2022年7月29日

推荐！【中美俄AI军用方向】中文版《为国家安全和国防开发人工智能》，美军重大AI应用案例及未来发展布局

推荐！【中美俄AI军用方向】中文版《为国家安全和国防开发人工智能》，美军重大AI应用案例及未来发展布局

专知

74+阅读 · 2022年6月30日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

92+阅读 · 2022年4月17日

【AI+ 军事】美政府问责局（GAO）最新《人工智能：国防部应改进策略和流程并加强协作指导》报告，97页pdf

【AI+ 军事】美政府问责局（GAO）最新《人工智能：国防部应改进策略和流程并加强协作指导》报告，97页pdf

专知

57+阅读 · 2022年4月11日

《机器学习技术及其在国防和安全中的应用》加拿大国防部发布（海上探测和监视、对抗ML），76页pdf

《机器学习技术及其在国防和安全中的应用》加拿大国防部发布（海上探测和监视、对抗ML），76页pdf

专知

26+阅读 · 2022年4月1日

面对无处不在的黑客威胁，如何保护智能设备免受攻击？

面对无处不在的黑客威胁，如何保护智能设备免受攻击？

AI前线

21+阅读 · 2019年10月28日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

综述 | 一文看尽三种针对人工智能系统的攻击技术及防御策略

综述 | 一文看尽三种针对人工智能系统的攻击技术及防御策略

机器之心

16+阅读 · 2018年7月9日

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于信号理论和众包的社交媒体平台安全性和可信度群体评估方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

6+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

智慧城市数字信息资源安全保障研究

国家自然科学基金

18+阅读 · 2014年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

基于博弈论的信息安全理论与方法研究

国家自然科学基金

10+阅读 · 2012年12月31日

Computational Safety for Generative AI: A Hypothesis Testing Perspective

Arxiv

0+阅读 · 6月14日

A Survey on Agentic Security: Applications, Threats and Defenses

Arxiv

0+阅读 · 6月12日

AI Researchers Must Help Lead Arms Control to Mitigate Military AI Risks

Arxiv

0+阅读 · 6月10日

Legal Alignment for Safe and Ethical AI

Arxiv

0+阅读 · 6月1日

Beyond Killer Robots: General AI Attitudes and Public Support for Military AI in Nine Countries

Arxiv

0+阅读 · 5月24日

The coordination gap in frontier AI safety policies

Arxiv

0+阅读 · 5月20日

Mapping Human Anti-collusion Mechanisms to Multi-agent AI Systems

Arxiv

0+阅读 · 5月18日

STRIDE-AI: A Threat Modeling Framework for Generative AI Security Assessment

Arxiv

0+阅读 · 5月16日

Useful for Exploration, Risky for Precision: Evaluating AI Tools in Academic Research

Arxiv

0+阅读 · 5月12日

Useful for Exploration, Risky for Precision: Evaluating AI Tools in Academic Research

Arxiv

0+阅读 · 5月11日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

3+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

5+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

7+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

10+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

11+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

7+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

15+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

8+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

10+阅读 · 6月17日

相关VIP内容

《人工智能在网络防御中的机遇》

《人工智能在网络防御中的机遇》

专知会员服务

8+阅读 · 6月8日

《作战研究是实现战场人工智能潜力的关键》

《作战研究是实现战场人工智能潜力的关键》

专知会员服务

38+阅读 · 4月8日

确保国防任务中的人工智能安全：多层次方法

确保国防任务中的人工智能安全：多层次方法

专知会员服务

16+阅读 · 1月21日

《面向未来：军事应用中基于人工智能融合的场景分析及其对全球安全的影响》

《面向未来：军事应用中基于人工智能融合的场景分析及其对全球安全的影响》

专知会员服务

21+阅读 · 2025年7月13日

推荐！《人工智能在武器系统中的应用》美智库-国防系统信息分析中心(DSIAC)2022最新92页报告

推荐！《人工智能在武器系统中的应用》美智库-国防系统信息分析中心(DSIAC)2022最新92页报告

专知会员服务

256+阅读 · 2022年10月16日

华为《AI安全白皮书》对抗性人工智能：AI攻击、AI防御典型方式

华为《AI安全白皮书》对抗性人工智能：AI攻击、AI防御典型方式

专知会员服务

89+阅读 · 2022年4月29日

【AI+军事】附论文《敏感还是不敏感？如何攻击和捍卫文件安全分类模型》

【AI+军事】附论文《敏感还是不敏感？如何攻击和捍卫文件安全分类模型》

专知会员服务

19+阅读 · 2022年4月26日

【AI+ 军事】美政府问责局（GAO）最新《人工智能：国防部应改进策略和流程并加强协作指导》报告，97页pdf

【AI+ 军事】美政府问责局（GAO）最新《人工智能：国防部应改进策略和流程并加强协作指导》报告，97页pdf

专知会员服务

87+阅读 · 2022年4月11日

人工智能模型数据泄露的攻击与防御研究综述

人工智能模型数据泄露的攻击与防御研究综述

专知会员服务

77+阅读 · 2021年3月31日

深度学习的对抗攻击与防御方法综述

专知会员服务

99+阅读 · 2020年12月8日

热门VIP内容

开通专知VIP会员享更多权益服务

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

相关资讯

【美海军·系统顶点项目报告】《用于防空和导弹防御的自动作战管理辅助工具（AI）的安全风险评估》162页PDF

【美海军·系统顶点项目报告】《用于防空和导弹防御的自动作战管理辅助工具（AI）的安全风险评估》162页PDF

专知

40+阅读 · 2022年10月19日

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

专知

102+阅读 · 2022年10月17日

推荐！【中文版】《人工智能在军事应用中的可能性和挑战》瑞典国防研究局16页报告

推荐！【中文版】《人工智能在军事应用中的可能性和挑战》瑞典国防研究局16页报告

专知

87+阅读 · 2022年7月29日

推荐！【中美俄AI军用方向】中文版《为国家安全和国防开发人工智能》，美军重大AI应用案例及未来发展布局

推荐！【中美俄AI军用方向】中文版《为国家安全和国防开发人工智能》，美军重大AI应用案例及未来发展布局

专知

74+阅读 · 2022年6月30日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

92+阅读 · 2022年4月17日

【AI+ 军事】美政府问责局（GAO）最新《人工智能：国防部应改进策略和流程并加强协作指导》报告，97页pdf

【AI+ 军事】美政府问责局（GAO）最新《人工智能：国防部应改进策略和流程并加强协作指导》报告，97页pdf

专知

57+阅读 · 2022年4月11日

《机器学习技术及其在国防和安全中的应用》加拿大国防部发布（海上探测和监视、对抗ML），76页pdf

《机器学习技术及其在国防和安全中的应用》加拿大国防部发布（海上探测和监视、对抗ML），76页pdf

专知

26+阅读 · 2022年4月1日

面对无处不在的黑客威胁，如何保护智能设备免受攻击？

面对无处不在的黑客威胁，如何保护智能设备免受攻击？

AI前线

21+阅读 · 2019年10月28日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

综述 | 一文看尽三种针对人工智能系统的攻击技术及防御策略

综述 | 一文看尽三种针对人工智能系统的攻击技术及防御策略

机器之心

16+阅读 · 2018年7月9日

相关论文

Computational Safety for Generative AI: A Hypothesis Testing Perspective

Arxiv

0+阅读 · 6月14日

A Survey on Agentic Security: Applications, Threats and Defenses

Arxiv

0+阅读 · 6月12日

AI Researchers Must Help Lead Arms Control to Mitigate Military AI Risks

Arxiv

0+阅读 · 6月10日

Legal Alignment for Safe and Ethical AI

Arxiv

0+阅读 · 6月1日

Beyond Killer Robots: General AI Attitudes and Public Support for Military AI in Nine Countries

Arxiv

0+阅读 · 5月24日

The coordination gap in frontier AI safety policies

Arxiv

0+阅读 · 5月20日

Mapping Human Anti-collusion Mechanisms to Multi-agent AI Systems

Arxiv

0+阅读 · 5月18日

STRIDE-AI: A Threat Modeling Framework for Generative AI Security Assessment

Arxiv

0+阅读 · 5月16日

Useful for Exploration, Risky for Precision: Evaluating AI Tools in Academic Research

Arxiv

0+阅读 · 5月12日

Useful for Exploration, Risky for Precision: Evaluating AI Tools in Academic Research

Arxiv

0+阅读 · 5月11日

相关基金

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于信号理论和众包的社交媒体平台安全性和可信度群体评估方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

6+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

智慧城市数字信息资源安全保障研究

国家自然科学基金

18+阅读 · 2014年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

基于博弈论的信息安全理论与方法研究

国家自然科学基金

10+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员