Domain Generation Algorithms (DGAs) evolve continuously to evade botnet detection, posing a persistent challenge for dependable network defense. While deep learning-based detectors achieve strong performance under static conditions, they suffer severe degradation when facing temporal drift. Through a 9-year longitudinal study (2017-2025), we empirically show that state-of-the-art character- and word-based DGA classifiers rapidly lose effectiveness as new DGA variants emerge. To address this problem, we propose a drift-resilient Transformer-based framework that learns invariant representations through a hybrid tokenization strategy and multi-task self-supervised pre-training. The model integrates (i) character-level encoding to capture stochastic morphological patterns and (ii) subword-level encoding for word-based DGAs. Three pre-training tasks enable the model to learn robust structural and contextual features prior to supervised fine-tuning. Comprehensive evaluations demonstrate that our method significantly mitigates temporal degradation and consistently outperforms state-of-the-art baselines in forward-chaining experiments. The proposed approach offers a dependable foundation for long-term DGA defense in evolving threat landscapes. Our code is available at: https://github.com/snsec-net/2026-DSN-DRIFT.


翻译:域名生成算法(DGA)持续进化以规避僵尸网络检测,对可靠网络防御构成持久挑战。尽管基于深度学习的检测器在静态条件下表现出色,但面对时间漂移时性能会严重退化。通过一项为期9年的纵向研究(2017-2025),我们实证表明,随着新DGA变体的出现,当前最先进的基于字符和基于词的DGA分类器会迅速失效。为解决该问题,我们提出一种漂移鲁棒的Transformer框架,通过混合分词策略和多任务自监督预训练学习不变表示。该模型整合了(i)用于捕捉随机形态模式的字符级编码和(ii)用于基于词的DGA的子词级编码。三项预训练任务使模型在监督微调前学习到鲁棒的结构与上下文特征。全面评估表明,我们的方法显著缓解了时间退化,在前向链实验(forward-chaining experiments)中持续优于当前最先进基线方法。所提方法为演进威胁环境中的长期DGA防御提供了可靠基础。代码开源地址:https://github.com/snsec-net/2026-DSN-DRIFT。

0
下载
关闭预览

相关内容

基于扩散模型的异常检测综述
专知会员服务
30+阅读 · 2025年1月23日
《深度伪造检测模型的准确性和鲁棒性》2023最新论文
专知会员服务
42+阅读 · 2023年10月29日
《Transformer小目标检测》最新综述
专知会员服务
60+阅读 · 2023年9月13日
最新《生成式对抗网络GAN进展》论文
专知
95+阅读 · 2019年4月5日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 5月17日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
7+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
8+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
6+阅读 · 6月17日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员