The rise of Generative AI (GenAI) has reshaped the cybersecurity landscape by enabling new attack vectors and lowering the barrier for executing advanced social engineering campaigns. This study conducts an empirical analysis of jailbreaking vulnerabilities in ChatGPT-4o-Mini, showing that novices can bypass safeguards to generate complete multivector phishing attacks across email, web, SMS, and voice channels. Controlled experiments reveal that role-based jailbreaks produce fully operational attack paths capable of credential harvesting. User studies further demonstrate the disruptive potential of GenAI: novice participants exhibited a 240\% increase in perceived phishing competence, a 400\% improvement in task completion rates, and a 57\% reduction in implementation time when assisted by GenAI compared to traditional internet resources. To address these risks, a transformer-based detection framework was developed, achieving an F1-score of 0.9864 (XLNET) for identifying malicious prompts. The work underscores the urgency of strengthening LLM guardrails and provides an annotated dataset to support future defenses.


翻译:生成式人工智能(GenAI)的兴起通过启用新型攻击向量并降低执行先进社会工程攻击的门槛,重塑了网络安全格局。本研究对ChatGPT-4o-Mini的越狱漏洞进行了实证分析,表明新手能够绕过安全防护措施,在电子邮件、网页、短信和语音渠道上生成完整的多向量钓鱼攻击。控制实验揭示,基于角色的越狱能够产生完全可操作的攻击路径,实现凭据窃取。用户研究进一步展示了GenAI的破坏性潜力:与传统互联网资源相比,在GenAI辅助下,新手参与者的钓鱼能力感知提升了240%,任务完成率提高了400%,实施时间减少了57%。为应对这些风险,我们开发了一种基于Transformer的检测框架,在识别恶意提示词方面取得了0.9864(XLNET)的F1分数。该工作强调了加强大语言模型护栏的紧迫性,并提供了一个带注释的数据集以支持未来防御。

0
下载
关闭预览

相关内容

《生成式人工智能及其在防御性网络安全课程中的应用》
专知会员服务
18+阅读 · 2025年10月30日
中文版 | 战争算法:生成式人工智能在战场的崛起
专知会员服务
29+阅读 · 2025年7月14日
用于自动驾驶的生成式人工智能:前沿与机遇
专知会员服务
26+阅读 · 2025年5月16日
【新书】利用生成式人工智能进行网络防御策略
专知会员服务
31+阅读 · 2024年10月18日
生成式人工智能在可视化中的应用:现状与未来方向
专知会员服务
41+阅读 · 2024年6月8日
《网络安全中的生成式人工智能方法综述》41页长综述
专知会员服务
40+阅读 · 2024年5月7日
【麦肯锡报告】捕捉生成式AI新机遇,106页pdf
专知会员服务
57+阅读 · 2023年9月16日
AI新方向:对抗攻击
网易智能菌
10+阅读 · 2018年11月14日
人工智能对网络空间安全的影响
走向智能论坛
21+阅读 · 2018年6月7日
群体智能:新一代人工智能的重要方向
走向智能论坛
12+阅读 · 2017年8月16日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
【ICML2026】大型视觉语言模型在注意力中迷失
专知会员服务
0+阅读 · 今天14:08
美海军EA-18G“咆哮者”与电子攻击的崛起
专知会员服务
5+阅读 · 今天5:15
《用于防空反导作战的分布式控制技术》
专知会员服务
6+阅读 · 今天3:55
美国军方使用的10种反无人机武器(2026年更新)
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员