Diffusion-Driven Synthetic Tabular Data Generation for Enhanced DoS/DDoS Attack Classification - 专知论文

会员服务 ·

0

类别 · 合成 · 样本 · 攻击 · 不平衡 ·

Diffusion-Driven Synthetic Tabular Data Generation for Enhanced DoS/DDoS Attack Classification

翻译：扩散驱动合成表格数据生成以增强DoS/DDoS攻击分类

Aravind B,Anirud R. S.,Sai Surya Teja N,Bala Subrahmanya Sriranga Navaneeth A,Karthika R,Mohankumar N

from arxiv, This preprint is being withdrawn due to substantial revisions in methodology and experimental results. A corrected and extended version will be submitted in the future

Class imbalance refers to a situation where certain classes in a dataset have significantly fewer samples than oth- ers, leading to biased model performance. Class imbalance in network intrusion detection using Tabular Denoising Diffusion Probability Models (TabDDPM) for data augmentation is ad- dressed in this paper. Our approach synthesizes high-fidelity minority-class samples from the CIC-IDS2017 dataset through iterative denoising processes. For the minority classes that have smaller samples, synthetic samples were generated and merged with the original dataset. The augmented training data enables an ANN classifier to achieve near-perfect recall on previously underrepresented attack classes. These results establish diffusion models as an effective solution for tabular data imbalance in security domains, with potential applications in fraud detection and medical diagnostics.

翻译：类别不平衡指数据集中某些类别的样本数量显著少于其他类别，导致模型性能出现偏差。本文针对使用表格去噪扩散概率模型（TabDDPM）进行数据增强的网络入侵检测中的类别不平衡问题展开研究。我们的方法通过迭代去噪过程，从CIC-IDS2017数据集中合成高保真度的少数类样本。针对样本量较少的少数类别，我们生成了合成样本并将其与原始数据集合并。增强后的训练数据使ANN分类器在先前代表性不足的攻击类别上实现了近乎完美的召回率。这些结果确立了扩散模型作为安全领域表格数据不平衡问题的有效解决方案，在欺诈检测和医疗诊断领域具有潜在应用价值。

0

相关内容

生成式人工智能的扩散模型概述

生成式人工智能的扩散模型概述

专知会员服务

67+阅读 · 2024年12月8日

生成扩散模型的攻击与防御：全面综述

生成扩散模型的攻击与防御：全面综述

专知会员服务

22+阅读 · 2024年8月11日

【CVPR2024】生成式多模态模型是优秀的类增量学习器

【CVPR2024】生成式多模态模型是优秀的类增量学习器

专知会员服务

32+阅读 · 2024年3月28日

【博士论文】无监督深度图聚类中的自适应表示学习，144页pdf

【博士论文】无监督深度图聚类中的自适应表示学习，144页pdf

专知会员服务

43+阅读 · 2023年10月21日

DiffRec: 扩散推荐模型（SIGIR'23）

DiffRec: 扩散推荐模型（SIGIR'23）

专知会员服务

48+阅读 · 2023年4月16日

扩撒模型如何用在医学上？最新《扩散模型医学图像分析》综述，25页pdf全面阐述医学图像扩散模型方法体系

扩撒模型如何用在医学上？最新《扩散模型医学图像分析》综述，25页pdf全面阐述医学图像扩散模型方法体系

专知会员服务

64+阅读 · 2022年11月19日

《用生成性对抗网络增强无人机图像分类训练集》美国空军技术学院2022最新209页论文

《用生成性对抗网络增强无人机图像分类训练集》美国空军技术学院2022最新209页论文

专知会员服务

55+阅读 · 2022年11月14日

生成式对抗网络异常检测，GANs for Anomaly Detection

专知会员服务

34+阅读 · 2021年9月16日

【KDD2021-谷歌】面向推荐的学习在不嵌入表的情况下嵌入类别特征

专知会员服务

11+阅读 · 2021年8月17日

【AAAI2020论文】分类感知的生成式对抗网络，具有分类文本生成的层次进化学习 (附pdf)

专知会员服务

21+阅读 · 2019年11月19日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

成熟的目标检测，也该自己学习数据增强策略达到SOTA了

成熟的目标检测，也该自己学习数据增强策略达到SOTA了

机器之心

17+阅读 · 2019年6月28日

推荐：一文教你如何处理不平衡数据集（附代码）

推荐：一文教你如何处理不平衡数据集（附代码）

数据分析

20+阅读 · 2019年6月3日

一行TensorFlow/Keras代码解决真实场景中数据不平衡(imbalanced)问题

一行TensorFlow/Keras代码解决真实场景中数据不平衡(imbalanced)问题

专知

78+阅读 · 2019年5月31日

【干货】李沐等人：CNN图像分类Trick合集（附详细代码）

【干货】李沐等人：CNN图像分类Trick合集（附详细代码）

GAN生成式对抗网络

58+阅读 · 2018年12月11日

李沐等人：CNN图像分类Trick合集（附详细代码）

李沐等人：CNN图像分类Trick合集（附详细代码）

专知

12+阅读 · 2018年12月11日

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

专知

17+阅读 · 2018年3月3日

【论文推荐】最新六篇视频分类相关论文—层次标签推断、知识图谱、CNNs、DAiSEE、表观和关系网络、转移学习

【论文推荐】最新六篇视频分类相关论文—层次标签推断、知识图谱、CNNs、DAiSEE、表观和关系网络、转移学习

专知

14+阅读 · 2018年2月18日

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

专知

10+阅读 · 2018年2月1日

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

17+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

基于聚类分析的高性能包分类技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

结合图像块联合聚类加权和混合分类器的非对齐稀疏表示识别方法

国家自然科学基金

1+阅读 · 2015年12月31日

谱聚类在多个网络模块识别中的推广及在生物网络中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

面向社会化媒体异构大数据的快速组合聚类研究

国家自然科学基金

1+阅读 · 2014年12月31日

Bias-Corrected Data Synthesis for Imbalanced Learning

Arxiv

0+阅读 · 2月15日

The Entropic Signature of Class Speciation in Diffusion Models

Arxiv

0+阅读 · 2月10日

Synthetic Oversampling: Theory and A Practical Approach Using LLMs to Address Data Imbalance

Arxiv

0+阅读 · 2月8日

CTTVAE: Latent Space Structuring for Conditional Tabular Data Generation on Imbalanced Datasets

Arxiv

0+阅读 · 2月3日

Synthetic Data Augmentation for Medical Audio Classification: A Preliminary Evaluation

Arxiv

0+阅读 · 2月3日

Latent Diffusion for Internet of Things Attack Data Generation in Intrusion Detection

Arxiv

0+阅读 · 1月23日

Balanced Diffusion-Guided Fusion for Multimodal Remote Sensing Classification

Arxiv

0+阅读 · 1月20日

Clustering High-dimensional Data: Balancing Abstraction and Representation Tutorial at AAAI 2026

Arxiv

0+阅读 · 1月16日

Classification Imbalance as Transfer Learning

Arxiv

0+阅读 · 1月15日

Continuous Diffusion for Mixed-Type Tabular Data

Arxiv

0+阅读 · 1月15日

VIP会员

文章信息

相关主题

最新内容

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

专知会员服务

2+阅读 · 今天7:13

俄乌无人机战争的六大启示

俄乌无人机战争的六大启示

专知会员服务

4+阅读 · 今天7:07

《无人机空中监控：通信实验洞察》

《无人机空中监控：通信实验洞察》

专知会员服务

3+阅读 · 今天7:05

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

专知会员服务

3+阅读 · 今天6:59

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

12+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

5+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

10+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

12+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

6+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

10+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

8+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

9+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

8+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

6+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

相关VIP内容

生成式人工智能的扩散模型概述

生成式人工智能的扩散模型概述

专知会员服务

67+阅读 · 2024年12月8日

生成扩散模型的攻击与防御：全面综述

生成扩散模型的攻击与防御：全面综述

专知会员服务

22+阅读 · 2024年8月11日

【CVPR2024】生成式多模态模型是优秀的类增量学习器

【CVPR2024】生成式多模态模型是优秀的类增量学习器

专知会员服务

32+阅读 · 2024年3月28日

【博士论文】无监督深度图聚类中的自适应表示学习，144页pdf

【博士论文】无监督深度图聚类中的自适应表示学习，144页pdf

专知会员服务

43+阅读 · 2023年10月21日

DiffRec: 扩散推荐模型（SIGIR'23）

DiffRec: 扩散推荐模型（SIGIR'23）

专知会员服务

48+阅读 · 2023年4月16日

扩撒模型如何用在医学上？最新《扩散模型医学图像分析》综述，25页pdf全面阐述医学图像扩散模型方法体系

扩撒模型如何用在医学上？最新《扩散模型医学图像分析》综述，25页pdf全面阐述医学图像扩散模型方法体系

专知会员服务

64+阅读 · 2022年11月19日

《用生成性对抗网络增强无人机图像分类训练集》美国空军技术学院2022最新209页论文

《用生成性对抗网络增强无人机图像分类训练集》美国空军技术学院2022最新209页论文

专知会员服务

55+阅读 · 2022年11月14日

生成式对抗网络异常检测，GANs for Anomaly Detection

专知会员服务

34+阅读 · 2021年9月16日

【KDD2021-谷歌】面向推荐的学习在不嵌入表的情况下嵌入类别特征

专知会员服务

11+阅读 · 2021年8月17日

【AAAI2020论文】分类感知的生成式对抗网络，具有分类文本生成的层次进化学习 (附pdf)

专知会员服务

21+阅读 · 2019年11月19日

热门VIP内容

开通专知VIP会员享更多权益服务

俄乌无人机战争的六大启示

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《无人机空中监控：通信实验洞察》

相关资讯

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

成熟的目标检测，也该自己学习数据增强策略达到SOTA了

成熟的目标检测，也该自己学习数据增强策略达到SOTA了

机器之心

17+阅读 · 2019年6月28日

推荐：一文教你如何处理不平衡数据集（附代码）

推荐：一文教你如何处理不平衡数据集（附代码）

数据分析

20+阅读 · 2019年6月3日

一行TensorFlow/Keras代码解决真实场景中数据不平衡(imbalanced)问题

一行TensorFlow/Keras代码解决真实场景中数据不平衡(imbalanced)问题

专知

78+阅读 · 2019年5月31日

【干货】李沐等人：CNN图像分类Trick合集（附详细代码）

【干货】李沐等人：CNN图像分类Trick合集（附详细代码）

GAN生成式对抗网络

58+阅读 · 2018年12月11日

李沐等人：CNN图像分类Trick合集（附详细代码）

李沐等人：CNN图像分类Trick合集（附详细代码）

专知

12+阅读 · 2018年12月11日

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

专知

17+阅读 · 2018年3月3日

【论文推荐】最新六篇视频分类相关论文—层次标签推断、知识图谱、CNNs、DAiSEE、表观和关系网络、转移学习

【论文推荐】最新六篇视频分类相关论文—层次标签推断、知识图谱、CNNs、DAiSEE、表观和关系网络、转移学习

专知

14+阅读 · 2018年2月18日

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

专知

10+阅读 · 2018年2月1日

相关论文

Bias-Corrected Data Synthesis for Imbalanced Learning

Arxiv

0+阅读 · 2月15日

The Entropic Signature of Class Speciation in Diffusion Models

Arxiv

0+阅读 · 2月10日

Synthetic Oversampling: Theory and A Practical Approach Using LLMs to Address Data Imbalance

Arxiv

0+阅读 · 2月8日

CTTVAE: Latent Space Structuring for Conditional Tabular Data Generation on Imbalanced Datasets

Arxiv

0+阅读 · 2月3日

Synthetic Data Augmentation for Medical Audio Classification: A Preliminary Evaluation

Arxiv

0+阅读 · 2月3日

Latent Diffusion for Internet of Things Attack Data Generation in Intrusion Detection

Arxiv

0+阅读 · 1月23日

Balanced Diffusion-Guided Fusion for Multimodal Remote Sensing Classification

Arxiv

0+阅读 · 1月20日

Clustering High-dimensional Data: Balancing Abstraction and Representation Tutorial at AAAI 2026

Arxiv

0+阅读 · 1月16日

Classification Imbalance as Transfer Learning

Arxiv

0+阅读 · 1月15日

Continuous Diffusion for Mixed-Type Tabular Data

Arxiv

0+阅读 · 1月15日

相关基金

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

17+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

基于聚类分析的高性能包分类技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

结合图像块联合聚类加权和混合分类器的非对齐稀疏表示识别方法

国家自然科学基金

1+阅读 · 2015年12月31日

谱聚类在多个网络模块识别中的推广及在生物网络中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

面向社会化媒体异构大数据的快速组合聚类研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员