基于VAE、GAN与SMOTE的加密网络流量中Tor流量检测对比评估 (Comparative Evaluation of VAE, GAN, and SMOTE for Tor Detection in Encrypted Network Traffic) - 专知论文

会员服务 ·

0

变分自编码 · 网络流 · 网络流量 · 合成 · GaN ·

Comparative Evaluation of VAE, GAN, and SMOTE for Tor Detection in Encrypted Network Traffic

翻译：基于VAE、GAN与SMOTE的加密网络流量中Tor流量检测对比评估

Saravanan A,Aswani Kumar Cherukuri

from arxiv, The entire code is available at https://colab.research.google.com/drive/1ubglT_7WsiKfzEQ547Kjej3r9xD-4lkT#scrollTo=2-v2GLgWjt1L

Encrypted network traffic poses significant challenges for intrusion detection due to the lack of payload visibility, limited labeled datasets, and high class imbalance between benign and malicious activities. Traditional data augmentation methods struggle to preserve the complex temporal and statistical characteristics of real network traffic. To address these issues, this work explores the use of Generative AI (GAI) models to synthesize realistic and diverse encrypted traffic traces. We evaluate three approaches: Variational Autoencoders (VAE), Generative Adversarial Networks (GAN), and SMOTE (Synthetic Minority Over-sampling Technique), each integrated with a preprocessing pipeline that includes feature selection and class balancing. The UNSW NB-15 dataset is used as the primary benchmark, focusing on Tor traffic as anomalies. We analyze statistical similarity between real and synthetic data, and assess classifier performance using metrics such as Accuracy, F1-score, and AUC-ROC. Results show that VAE-generated data provides the best balance between privacy and performance, while GANs offer higher fidelity but risk overfitting. SMOTE, though simple, enhances recall but may lack diversity. The findings demonstrate that GAI methods can significantly improve encrypted traffic detection when trained with privacy-preserving synthetic data.

翻译：加密网络流量因载荷不可见、标注数据集有限以及正常与恶意活动间的高度类别不平衡，给入侵检测带来了重大挑战。传统数据增强方法难以保持真实网络流量的复杂时序与统计特征。为解决这些问题，本研究探索利用生成式人工智能模型合成真实且多样化的加密流量轨迹。我们评估了三种方法：变分自编码器、生成对抗网络以及合成少数类过采样技术，每种方法均集成了包含特征选择与类别平衡的预处理流程。研究以UNSW NB-15数据集为主要基准，重点关注Tor流量作为异常流量。我们分析了真实数据与合成数据间的统计相似性，并使用准确率、F1分数和AUC-ROC等指标评估分类器性能。结果表明，VAE生成的数据在隐私保护与性能间取得了最佳平衡，而GAN虽能提供更高保真度却存在过拟合风险。SMOTE方法虽简单且能提升召回率，但可能缺乏多样性。研究证明，当使用具备隐私保护能力的合成数据进行训练时，生成式人工智能方法能显著提升加密流量检测性能。

0

相关内容

变分自编码

变分自编码

《网络安全中的机器学习算法：网络防护与攻击检测》最新报告

《网络安全中的机器学习算法：网络防护与攻击检测》最新报告

专知会员服务

19+阅读 · 2025年6月24日

《通过机器学习检测 5G 网络上的无人机系统》2023最新71页论文

《通过机器学习检测 5G 网络上的无人机系统》2023最新71页论文

专知会员服务

28+阅读 · 2023年9月5日

《仅有包头的网络流量异常检测和分类的实证调查》美国陆军研究实验室2023最新5页报告

《仅有包头的网络流量异常检测和分类的实证调查》美国陆军研究实验室2023最新5页报告

专知会员服务

28+阅读 · 2023年5月22日

《基于高斯混合流和入包的异常检测》2023最新57页论文

《基于高斯混合流和入包的异常检测》2023最新57页论文

专知会员服务

28+阅读 · 2023年5月15日

对抗机器学习在网络入侵检测领域的应用

对抗机器学习在网络入侵检测领域的应用

专知会员服务

35+阅读 · 2022年1月4日

基于深度学习的网络流量预测研究综述

专知会员服务

40+阅读 · 2021年5月30日

网络攻击模型研究综述

专知会员服务

56+阅读 · 2020年12月28日

ISWC2020最佳论文《可解释假信息检测的链接可信度评价》

ISWC2020最佳论文《可解释假信息检测的链接可信度评价》

专知会员服务

20+阅读 · 2020年11月7日

【论文推荐】基于机器学习的5G网络异常检测，Machine Learning based Anomaly Detection for 5G Networks

【论文推荐】基于机器学习的5G网络异常检测，Machine Learning based Anomaly Detection for 5G Networks

专知会员服务

36+阅读 · 2020年3月12日

网络流量监测与分析大数据综述，A Survey on Big Data for Network Traffic Monitoring and Analysis

网络流量监测与分析大数据综述，A Survey on Big Data for Network Traffic Monitoring and Analysis

专知会员服务

65+阅读 · 2020年3月5日

「工业物联网异常检测技术」最新2022研究综述

「工业物联网异常检测技术」最新2022研究综述

专知

12+阅读 · 2022年5月3日

苏宁易购基于机器学习预测流量波动趋势的实践经验

苏宁易购基于机器学习预测流量波动趋势的实践经验

AI前线

15+阅读 · 2019年10月17日

最新《生成式对抗网络GAN进展》论文

最新《生成式对抗网络GAN进展》论文

专知

95+阅读 · 2019年4月5日

硬件加速神经网络综述

硬件加速神经网络综述

计算机研究与发展

26+阅读 · 2019年2月1日

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

七月在线实验室

11+阅读 · 2018年7月18日

NetworkMiner - 网络取证分析工具

NetworkMiner - 网络取证分析工具

黑白之道

16+阅读 · 2018年6月29日

深度学习在CTR预估中的应用 | CTR深度模型大盘点

深度学习在CTR预估中的应用 | CTR深度模型大盘点

PaperWeekly

15+阅读 · 2018年4月11日

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

专知

10+阅读 · 2018年2月1日

【360人工智能研究院与NUS颜水成团队】HashGAN:基于注意力机制的深度对抗哈希模型提升跨模态检索效果

【360人工智能研究院与NUS颜水成团队】HashGAN:基于注意力机制的深度对抗哈希模型提升跨模态检索效果

专知

16+阅读 · 2017年11月29日

CNN 模型压缩与加速算法综述

CNN 模型压缩与加速算法综述

机器学习研究会

16+阅读 · 2017年8月25日

面向移动互联网流量的行为特征和自适应分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

抽样环境下基于流记录的行为特征分析与多分类器识别模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于故障注入和指标模型的工业无线传感器网络可靠性测试与评估方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

通信网络在不确定业务流量需求下的路由鲁棒性优化研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

社交网络级联数据流异常检测模型研究

国家自然科学基金

4+阅读 · 2015年12月31日

流密码可约性高效判别算法存在性的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于网络活动分析的窃密木马检测技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

Latent Diffusion for Internet of Things Attack Data Generation in Intrusion Detection

Arxiv

0+阅读 · 1月23日

TempoNet: Learning Realistic Communication and Timing Patterns for Network Traffic Simulation

Arxiv

0+阅读 · 1月22日

A Measurement of Genuine Tor Traces for Realistic Website Fingerprinting

Arxiv

0+阅读 · 1月21日

Rethinking On-Device LLM Reasoning: Why Analogical Mapping Outperforms Abstract Thinking for IoT DDoS Detection

Arxiv

0+阅读 · 1月20日

Evaluating MCC for Low-Frequency Cyberattack Detection in Imbalanced Intrusion Detection Data

Arxiv

0+阅读 · 1月19日

On-line Anomaly Detection and Qualification of Random Bit Streams

Arxiv

0+阅读 · 1月16日

Which Deep Learner? A Systematic Evaluation of Advanced Deep Forecasting Models Accuracy and Efficiency for Network Traffic Prediction

Arxiv

0+阅读 · 1月6日

A Comprehensive Survey of Website Fingerprinting Attacks and Defenses in Tor: Advances and Open Challenges

Arxiv

0+阅读 · 1月4日

NOS-Gate: Queue-Aware Streaming IDS for Consumer Gateways under Timing-Controlled Evasion

Arxiv

0+阅读 · 1月1日

Towards eco friendly cybersecurity: machine learning based anomaly detection with carbon and energy metrics

Arxiv

0+阅读 · 2025年12月31日

VIP会员

文章信息

相关主题

变分自编码

相关VIP内容

《网络安全中的机器学习算法：网络防护与攻击检测》最新报告

《网络安全中的机器学习算法：网络防护与攻击检测》最新报告

专知会员服务

19+阅读 · 2025年6月24日

《通过机器学习检测 5G 网络上的无人机系统》2023最新71页论文

《通过机器学习检测 5G 网络上的无人机系统》2023最新71页论文

专知会员服务

28+阅读 · 2023年9月5日

《仅有包头的网络流量异常检测和分类的实证调查》美国陆军研究实验室2023最新5页报告

《仅有包头的网络流量异常检测和分类的实证调查》美国陆军研究实验室2023最新5页报告

专知会员服务

28+阅读 · 2023年5月22日

《基于高斯混合流和入包的异常检测》2023最新57页论文

《基于高斯混合流和入包的异常检测》2023最新57页论文

专知会员服务

28+阅读 · 2023年5月15日

对抗机器学习在网络入侵检测领域的应用

对抗机器学习在网络入侵检测领域的应用

专知会员服务

35+阅读 · 2022年1月4日

基于深度学习的网络流量预测研究综述

专知会员服务

40+阅读 · 2021年5月30日

网络攻击模型研究综述

专知会员服务

56+阅读 · 2020年12月28日

ISWC2020最佳论文《可解释假信息检测的链接可信度评价》

ISWC2020最佳论文《可解释假信息检测的链接可信度评价》

专知会员服务

20+阅读 · 2020年11月7日

【论文推荐】基于机器学习的5G网络异常检测，Machine Learning based Anomaly Detection for 5G Networks

【论文推荐】基于机器学习的5G网络异常检测，Machine Learning based Anomaly Detection for 5G Networks

专知会员服务

36+阅读 · 2020年3月12日

网络流量监测与分析大数据综述，A Survey on Big Data for Network Traffic Monitoring and Analysis

网络流量监测与分析大数据综述，A Survey on Big Data for Network Traffic Monitoring and Analysis

专知会员服务

65+阅读 · 2020年3月5日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

「工业物联网异常检测技术」最新2022研究综述

「工业物联网异常检测技术」最新2022研究综述

专知

12+阅读 · 2022年5月3日

苏宁易购基于机器学习预测流量波动趋势的实践经验

苏宁易购基于机器学习预测流量波动趋势的实践经验

AI前线

15+阅读 · 2019年10月17日

最新《生成式对抗网络GAN进展》论文

最新《生成式对抗网络GAN进展》论文

专知

95+阅读 · 2019年4月5日

硬件加速神经网络综述

硬件加速神经网络综述

计算机研究与发展

26+阅读 · 2019年2月1日

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

七月在线实验室

11+阅读 · 2018年7月18日

NetworkMiner - 网络取证分析工具

NetworkMiner - 网络取证分析工具

黑白之道

16+阅读 · 2018年6月29日

深度学习在CTR预估中的应用 | CTR深度模型大盘点

深度学习在CTR预估中的应用 | CTR深度模型大盘点

PaperWeekly

15+阅读 · 2018年4月11日

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

专知

10+阅读 · 2018年2月1日

【360人工智能研究院与NUS颜水成团队】HashGAN:基于注意力机制的深度对抗哈希模型提升跨模态检索效果

【360人工智能研究院与NUS颜水成团队】HashGAN:基于注意力机制的深度对抗哈希模型提升跨模态检索效果

专知

16+阅读 · 2017年11月29日

CNN 模型压缩与加速算法综述

CNN 模型压缩与加速算法综述

机器学习研究会

16+阅读 · 2017年8月25日

相关论文

Latent Diffusion for Internet of Things Attack Data Generation in Intrusion Detection

Arxiv

0+阅读 · 1月23日

TempoNet: Learning Realistic Communication and Timing Patterns for Network Traffic Simulation

Arxiv

0+阅读 · 1月22日

A Measurement of Genuine Tor Traces for Realistic Website Fingerprinting

Arxiv

0+阅读 · 1月21日

Rethinking On-Device LLM Reasoning: Why Analogical Mapping Outperforms Abstract Thinking for IoT DDoS Detection

Arxiv

0+阅读 · 1月20日

Evaluating MCC for Low-Frequency Cyberattack Detection in Imbalanced Intrusion Detection Data

Arxiv

0+阅读 · 1月19日

On-line Anomaly Detection and Qualification of Random Bit Streams

Arxiv

0+阅读 · 1月16日

Which Deep Learner? A Systematic Evaluation of Advanced Deep Forecasting Models Accuracy and Efficiency for Network Traffic Prediction

Arxiv

0+阅读 · 1月6日

A Comprehensive Survey of Website Fingerprinting Attacks and Defenses in Tor: Advances and Open Challenges

Arxiv

0+阅读 · 1月4日

NOS-Gate: Queue-Aware Streaming IDS for Consumer Gateways under Timing-Controlled Evasion

Arxiv

0+阅读 · 1月1日

Towards eco friendly cybersecurity: machine learning based anomaly detection with carbon and energy metrics

Arxiv

0+阅读 · 2025年12月31日

相关基金

面向移动互联网流量的行为特征和自适应分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

抽样环境下基于流记录的行为特征分析与多分类器识别模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于故障注入和指标模型的工业无线传感器网络可靠性测试与评估方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

通信网络在不确定业务流量需求下的路由鲁棒性优化研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

社交网络级联数据流异常检测模型研究

国家自然科学基金

4+阅读 · 2015年12月31日

流密码可约性高效判别算法存在性的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于网络活动分析的窃密木马检测技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员