We present Foundation-Sec-8B-Reasoning, the first open-source native reasoning model for cybersecurity. Built upon our previously released Foundation-Sec-8B base model (derived from Llama-3.1-8B-Base), the model is trained through a two-stage process combining supervised fine-tuning (SFT) and reinforcement learning from verifiable rewards (RLVR). Our training leverages proprietary reasoning data spanning cybersecurity analysis, instruction-following, and mathematical reasoning. Evaluation across 10 cybersecurity benchmarks and 10 general-purpose benchmarks demonstrates performance competitive with significantly larger models on cybersecurity tasks while maintaining strong general capabilities. The model shows effective generalization on multi-hop reasoning tasks and strong safety performance when deployed with appropriate system prompts and guardrails. This work demonstrates that domain-specialized reasoning models can achieve strong performance on specialized tasks while maintaining broad general capabilities. We release the model publicly at https://huggingface.co/fdtn-ai/Foundation-Sec-8B-Reasoning.


翻译:我们提出了Foundation-Sec-8B-Reasoning,这是首个面向网络安全领域的开源原生推理模型。该模型基于我们先前发布的Foundation-Sec-8B基础模型(源自Llama-3.1-8B-Base),通过结合监督微调(SFT)和基于可验证奖励的强化学习(RLVR)的两阶段过程进行训练。我们的训练利用了涵盖网络安全分析、指令遵循和数学推理的专有推理数据。在10个网络安全基准测试和10个通用基准测试上的评估表明,该模型在网络安全任务上的性能可与规模大得多的模型相媲美,同时保持了强大的通用能力。该模型在多跳推理任务上展现出有效的泛化能力,并且在部署适当的系统提示和防护措施时表现出强大的安全性。这项工作表明,领域专用的推理模型可以在保持广泛通用能力的同时,在特定任务上实现强大的性能。我们已在 https://huggingface.co/fdtn-ai/Foundation-Sec-8B-Reasoning 公开发布该模型。

0
下载
关闭预览

相关内容

SEC:IFIP International Information Security Conference。 Explanation:国际信息安全会议。 Publisher:Springer。 SIT: http://dblp.uni-trier.de/db/conf/sec/
《人工智能安全治理框架》2.0版发布,90页pdf
专知会员服务
22+阅读 · 2025年10月8日
机密计算保障人工智能系统安全研究报告
专知会员服务
19+阅读 · 2025年1月20日
《Llama 3大模型》技术报告中英文版,95页pdf
专知会员服务
107+阅读 · 2024年8月2日
Llama-3-SynE:实现有效且高效的大语言模型持续预训练
专知会员服务
36+阅读 · 2024年7月30日
万字长文带你梳理Llama开源家族:从Llama-1到Llama-3
专知会员服务
43+阅读 · 2024年4月22日
Llama 2:开放基础和微调聊天模型,30页ppt
专知会员服务
68+阅读 · 2023年10月21日
网络安全态势感知浅析
计算机与网络安全
18+阅读 · 2017年10月13日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2月18日
Arxiv
0+阅读 · 2月9日
Arxiv
18+阅读 · 2024年12月27日
VIP会员
相关资讯
网络安全态势感知浅析
计算机与网络安全
18+阅读 · 2017年10月13日
相关基金
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员