dataRLsec：基于鲁棒离线强化学习的DPA安全、防护与可靠性保障 (dataRLsec: Safety, Security, and Reliability With Robust Offline Reinforcement Learning for DPAs) - 专知论文

会员服务 ·

0

攻击 · 算法 · 投毒攻击 · 数据投毒 · 离线强化学习 ·

dataRLsec: Safety, Security, and Reliability With Robust Offline Reinforcement Learning for DPAs

翻译：dataRLsec：基于鲁棒离线强化学习的DPA安全、防护与可靠性保障

Shriram KS Pandian,Naresh Kshetri

from arxiv, 10 pages, 3 figures

Data poisoning attacks (DPAs) are becoming popular as artificial intelligence (AI) algorithms, machine learning (ML) algorithms, and deep learning (DL) algorithms in this artificial intelligence (AI) era. Hackers and penetration testers are excessively injecting malicious contents in the training data (and in testing data too) that leads to false results that are very hard to inspect and predict. We have analyzed several recent technologies used (from deep reinforcement learning to federated learning) for the DPAs and their safety, security, & countermeasures. The problem setup along with the problem estimation is shown in the MuJoCo environment with performance of HalfCheetah before the dataset is poisoned and after the dataset is poisoned. We have analyzed several risks associated with the DPAs and falsification in medical data from popular poisoning data attacks to some popular data defenses. We have proposed robust offline reinforcement learning (Offline RL) for the safety and reliability with weighted hash verification along with density-ratio weighted behavioral cloning (DWBC) algorithm. The four stages of the proposed algorithm (as the Stage 0, the Stage 1, the Stage 2, and the Stage 3) are described with respect to offline RL, safety, and security for DPAs. The conclusion and future scope are provided with the intent to combine DWBC with other data defense strategies to counter and protect future contamination cyberattacks.

翻译：在当今人工智能时代，随着人工智能算法、机器学习算法及深度学习算法的广泛应用，数据投毒攻击正日益盛行。黑客与渗透测试者通过在训练数据（及测试数据）中大量注入恶意内容，导致产生难以检测和预测的错误结果。本文系统分析了从深度强化学习到联邦学习等多种近期用于应对数据投毒攻击的技术及其安全性、防护机制与应对策略。我们在MuJoCo环境中展示了问题构建与评估过程，通过HalfCheetah智能体在数据集被投毒前后的性能对比进行说明。研究深入探讨了数据投毒攻击涉及的各类风险，以及从常见投毒攻击到主流数据防御方案中医疗数据伪造问题。针对安全性与可靠性需求，我们提出采用加权哈希验证与密度比加权行为克隆算法相结合的鲁棒离线强化学习方法。所提算法的四个阶段（阶段0至阶段3）围绕离线强化学习在数据投毒攻击中的安全防护机制展开阐述。最后，本文给出结论与未来研究方向，旨在将密度比加权行为克隆算法与其他数据防御策略相结合，以应对并防范未来的数据污染型网络攻击。

0

相关内容

《网络安全中的机器学习算法：网络防护与攻击检测》最新报告

《网络安全中的机器学习算法：网络防护与攻击检测》最新报告

专知会员服务

19+阅读 · 2025年6月24日

深度学习中的数据投毒：综述

深度学习中的数据投毒：综述

专知会员服务

29+阅读 · 2025年4月1日

【MIT博士论文】鲁棒高效的深度学习在虚假信息预防中的应用

【MIT博士论文】鲁棒高效的深度学习在虚假信息预防中的应用

专知会员服务

26+阅读 · 2022年7月13日

【AI+军事】美国海军研究实验室最新论文《“示范学习”(LfD)——从对抗性专家演示中鲁棒地学习》

【AI+军事】美国海军研究实验室最新论文《“示范学习”(LfD)——从对抗性专家演示中鲁棒地学习》

专知会员服务

84+阅读 · 2022年4月9日

深度学习模型鲁棒性研究综述

深度学习模型鲁棒性研究综述

专知会员服务

97+阅读 · 2022年1月23日

对抗机器学习在网络入侵检测领域的应用

对抗机器学习在网络入侵检测领域的应用

专知会员服务

35+阅读 · 2022年1月4日

鲁棒和隐私保护的协同学习

鲁棒和隐私保护的协同学习

专知会员服务

38+阅读 · 2021年12月22日

京东等学者发布《可信赖人工智能》综述论文，62页pdf449篇文献全面阐述可信赖AI的理论与方法

京东等学者发布《可信赖人工智能》综述论文，62页pdf449篇文献全面阐述可信赖AI的理论与方法

专知会员服务

107+阅读 · 2021年10月6日

人工智能模型数据泄露的攻击与防御研究综述

人工智能模型数据泄露的攻击与防御研究综述

专知会员服务

77+阅读 · 2021年3月31日

机器学习的安全问题及隐私保护

专知会员服务

40+阅读 · 2020年12月20日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

90+阅读 · 2022年4月17日

Distributional Soft Actor-Critic (DSAC)强化学习算法的设计与验证

Distributional Soft Actor-Critic (DSAC)强化学习算法的设计与验证

深度强化学习实验室

19+阅读 · 2020年8月11日

联邦学习安全与隐私保护研究综述

联邦学习安全与隐私保护研究综述

专知

12+阅读 · 2020年8月7日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

专知

14+阅读 · 2019年10月31日

完备的 AI 学习路线，最详细的资源整理！

完备的 AI 学习路线，最详细的资源整理！

新智元

17+阅读 · 2019年5月4日

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

专知

26+阅读 · 2019年2月19日

【强化学习】强化学习到深度强化学习、强化学习商业用例

【强化学习】强化学习到深度强化学习、强化学习商业用例

产业智能官

30+阅读 · 2019年2月9日

Databricks 开源 MLflow 平台，解决机器学习开发四大难点

Databricks 开源 MLflow 平台，解决机器学习开发四大难点

AI研习社

13+阅读 · 2018年6月8日

最全数据科学学习资源：Python、线性代数、机器学习...

最全数据科学学习资源：Python、线性代数、机器学习...

人工智能头条

12+阅读 · 2018年5月14日

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

6+阅读 · 2017年12月31日

面向移动云环境的委托式数据安全共享关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

网络空间安全关键技术研究

国家自然科学基金

20+阅读 · 2015年12月31日

基于网络活动分析的窃密木马检测技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

31+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

面向大规模数据流的集成学习模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

Safety-Efficacy Trade Off: Robustness against Data-Poisoning

Arxiv

0+阅读 · 1月31日

Robust Federated Learning for Malicious Clients using Loss Trend Deviation Detection

Arxiv

0+阅读 · 1月28日

Benchmarking Machine Learning Models for IoT Malware Detection under Data Scarcity and Drift

Arxiv

0+阅读 · 1月26日

AI-in-the-Loop: Privacy Preserving Real-Time Scam Detection and Conversational Scambaiting by Leveraging LLMs and Federated Learning

Arxiv

0+阅读 · 1月20日

SecureCAI: Injection-Resilient LLM Assistants for Cybersecurity Operations

Arxiv

0+阅读 · 1月12日

SecureDyn-FL: A Robust Privacy-Preserving Federated Learning Framework for Intrusion Detection in IoT Networks

Arxiv

0+阅读 · 1月10日

Chaining the Evidence: Robust Reinforcement Learning for Deep Search Agents with Citation-Aware Rubric Rewards

Arxiv

0+阅读 · 1月9日

AI-Powered Algorithms for the Prevention and Detection of Computer Malware Infections

Arxiv

0+阅读 · 1月9日

Cyber Threat Detection and Vulnerability Assessment System using Generative AI and Large Language Model

Arxiv

0+阅读 · 1月8日

Byzantine-Robust Federated Learning Framework with Post-Quantum Secure Aggregation for Real-Time Threat Intelligence Sharing in Critical IoT Infrastructure

Arxiv

0+阅读 · 1月3日

VIP会员

文章信息

相关主题

离线强化学习

相关VIP内容

《网络安全中的机器学习算法：网络防护与攻击检测》最新报告

《网络安全中的机器学习算法：网络防护与攻击检测》最新报告

专知会员服务

19+阅读 · 2025年6月24日

深度学习中的数据投毒：综述

深度学习中的数据投毒：综述

专知会员服务

29+阅读 · 2025年4月1日

【MIT博士论文】鲁棒高效的深度学习在虚假信息预防中的应用

【MIT博士论文】鲁棒高效的深度学习在虚假信息预防中的应用

专知会员服务

26+阅读 · 2022年7月13日

【AI+军事】美国海军研究实验室最新论文《“示范学习”(LfD)——从对抗性专家演示中鲁棒地学习》

【AI+军事】美国海军研究实验室最新论文《“示范学习”(LfD)——从对抗性专家演示中鲁棒地学习》

专知会员服务

84+阅读 · 2022年4月9日

深度学习模型鲁棒性研究综述

深度学习模型鲁棒性研究综述

专知会员服务

97+阅读 · 2022年1月23日

对抗机器学习在网络入侵检测领域的应用

对抗机器学习在网络入侵检测领域的应用

专知会员服务

35+阅读 · 2022年1月4日

鲁棒和隐私保护的协同学习

鲁棒和隐私保护的协同学习

专知会员服务

38+阅读 · 2021年12月22日

京东等学者发布《可信赖人工智能》综述论文，62页pdf449篇文献全面阐述可信赖AI的理论与方法

京东等学者发布《可信赖人工智能》综述论文，62页pdf449篇文献全面阐述可信赖AI的理论与方法

专知会员服务

107+阅读 · 2021年10月6日

人工智能模型数据泄露的攻击与防御研究综述

人工智能模型数据泄露的攻击与防御研究综述

专知会员服务

77+阅读 · 2021年3月31日

机器学习的安全问题及隐私保护

专知会员服务

40+阅读 · 2020年12月20日

热门VIP内容

开通专知VIP会员享更多权益服务

论学习、公平性与复杂度

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

2025中国人工智能学会系列白皮书⸺棋盘上的人工智能|附下载

通用智能体评估的逻辑架构

相关资讯

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

90+阅读 · 2022年4月17日

Distributional Soft Actor-Critic (DSAC)强化学习算法的设计与验证

Distributional Soft Actor-Critic (DSAC)强化学习算法的设计与验证

深度强化学习实验室

19+阅读 · 2020年8月11日

联邦学习安全与隐私保护研究综述

联邦学习安全与隐私保护研究综述

专知

12+阅读 · 2020年8月7日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

专知

14+阅读 · 2019年10月31日

完备的 AI 学习路线，最详细的资源整理！

完备的 AI 学习路线，最详细的资源整理！

新智元

17+阅读 · 2019年5月4日

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

专知

26+阅读 · 2019年2月19日

【强化学习】强化学习到深度强化学习、强化学习商业用例

【强化学习】强化学习到深度强化学习、强化学习商业用例

产业智能官

30+阅读 · 2019年2月9日

Databricks 开源 MLflow 平台，解决机器学习开发四大难点

Databricks 开源 MLflow 平台，解决机器学习开发四大难点

AI研习社

13+阅读 · 2018年6月8日

最全数据科学学习资源：Python、线性代数、机器学习...

最全数据科学学习资源：Python、线性代数、机器学习...

人工智能头条

12+阅读 · 2018年5月14日

相关论文

Safety-Efficacy Trade Off: Robustness against Data-Poisoning

Arxiv

0+阅读 · 1月31日

Robust Federated Learning for Malicious Clients using Loss Trend Deviation Detection

Arxiv

0+阅读 · 1月28日

Benchmarking Machine Learning Models for IoT Malware Detection under Data Scarcity and Drift

Arxiv

0+阅读 · 1月26日

AI-in-the-Loop: Privacy Preserving Real-Time Scam Detection and Conversational Scambaiting by Leveraging LLMs and Federated Learning

Arxiv

0+阅读 · 1月20日

SecureCAI: Injection-Resilient LLM Assistants for Cybersecurity Operations

Arxiv

0+阅读 · 1月12日

SecureDyn-FL: A Robust Privacy-Preserving Federated Learning Framework for Intrusion Detection in IoT Networks

Arxiv

0+阅读 · 1月10日

Chaining the Evidence: Robust Reinforcement Learning for Deep Search Agents with Citation-Aware Rubric Rewards

Arxiv

0+阅读 · 1月9日

AI-Powered Algorithms for the Prevention and Detection of Computer Malware Infections

Arxiv

0+阅读 · 1月9日

Cyber Threat Detection and Vulnerability Assessment System using Generative AI and Large Language Model

Arxiv

0+阅读 · 1月8日

Byzantine-Robust Federated Learning Framework with Post-Quantum Secure Aggregation for Real-Time Threat Intelligence Sharing in Critical IoT Infrastructure

Arxiv

0+阅读 · 1月3日

相关基金

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

6+阅读 · 2017年12月31日

面向移动云环境的委托式数据安全共享关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

网络空间安全关键技术研究

国家自然科学基金

20+阅读 · 2015年12月31日

基于网络活动分析的窃密木马检测技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

31+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

面向大规模数据流的集成学习模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员