Web attack detection is the first line of defense for securing web applications, designed to preemptively identify malicious activities. Deep learning-based approaches are increasingly popular for their advantages: automatically learning complex patterns and extracting semantic features from HTTP requests to achieve superior detection performance. However, existing methods are less effective in embedding irregular HTTP requests, even failing to model unordered parameters and achieve attack traceability. In this paper, we propose an effective web attack detection model, named WADBERT. It achieves high detection accuracy while enabling the precise identification of malicious parameters. To this end, we first employ Hybrid Granularity Embedding (HGE) to generate fine-grained embeddings for URL and payload parameters. Then, URLBERT and SecBERT are respectively utilized to extract their semantic features. Further, parameter-level features (extracted by SecBERT) are fused through a multi-head attention mechanism, resulting in a comprehensive payload feature. Finally, by feeding the concatenated URL and payload features into a linear classifier, a final detection result is obtained. The experimental results on CSIC2010 and SR-BH2020 datasets validate the efficacy of WADBERT, which respectively achieves F1-scores of 99.63% and 99.50%, and significantly outperforms state-of-the-art methods.


翻译:Web攻击检测是保障Web应用程序安全的第一道防线,旨在预先识别恶意活动。基于深度学习的方法因其优势而日益流行:能够自动学习复杂模式并从HTTP请求中提取语义特征,从而实现卓越的检测性能。然而,现有方法在处理不规则HTTP请求的嵌入方面效果欠佳,甚至无法对无序参数进行建模并实现攻击溯源。本文提出一种有效的Web攻击检测模型,命名为WADBERT。该模型在实现高检测精度的同时,能够精确识别恶意参数。为此,我们首先采用混合粒度嵌入(HGE)为URL和载荷参数生成细粒度嵌入。随后,分别利用URLBERT和SecBERT提取其语义特征。进一步地,通过多头注意力机制融合参数级特征(由SecBERT提取),形成综合的载荷特征。最后,将拼接后的URL特征与载荷特征输入线性分类器,获得最终检测结果。在CSIC2010和SR-BH2020数据集上的实验结果验证了WADBERT的有效性,其F1分数分别达到99.63%和99.50%,显著优于现有最先进方法。

0
下载
关闭预览

相关内容

基于深度学习的入侵检测系统:综述
专知会员服务
15+阅读 · 2025年4月11日
《基于高斯混合流和入包的异常检测》2023最新57页论文
专知会员服务
28+阅读 · 2023年5月15日
对抗机器学习在网络入侵检测领域的应用
专知会员服务
35+阅读 · 2022年1月4日
专知会员服务
96+阅读 · 2021年1月17日
专知会员服务
67+阅读 · 2021年1月10日
专知会员服务
56+阅读 · 2020年12月28日
Web渗透测试Fuzz字典分享
黑白之道
21+阅读 · 2019年5月22日
谷歌BERT模型深度解析
AINLP
42+阅读 · 2018年11月15日
博客 | 基于深度学习的目标检测算法综述(二)
AI研习社
11+阅读 · 2018年8月22日
深度学习目标检测模型全面综述:Faster R-CNN、R-FCN和SSD
深度学习世界
10+阅读 · 2017年9月18日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关VIP内容
基于深度学习的入侵检测系统:综述
专知会员服务
15+阅读 · 2025年4月11日
《基于高斯混合流和入包的异常检测》2023最新57页论文
专知会员服务
28+阅读 · 2023年5月15日
对抗机器学习在网络入侵检测领域的应用
专知会员服务
35+阅读 · 2022年1月4日
专知会员服务
96+阅读 · 2021年1月17日
专知会员服务
67+阅读 · 2021年1月10日
专知会员服务
56+阅读 · 2020年12月28日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员