Validating Threat Modeling Results with the Help of Vulnerable Test Applications

Validating threat modeling results remains difficult because completeness is hard to judge without an external oracle. Existing studies often rely on expert-produced reference models and other human baselines, but these can contain omissions or disagreements. This paper evaluates a complementary, vulnerability-grounded validation approach. We apply threat modeling to intentionally vulnerable applications with a known vulnerability set to measure the number of related vulnerabilities that can be discovered. We compare ThreMoLIA, an LLM-assisted threat modeling solution developed by our team, with the Microsoft Threat Modeling Tool (MTMT) across two vulnerable applications: AzureGoat and the Vulnerable Bank Application (VulnBank). The inputs to both tools are limited to architecture, data flow diagrams, and their descriptions. The results show that ThreMoLIA achieved higher vulnerability coverage on both systems. We show that vulnerable test applications provide a practical benchmark for assessing threat coverage and complement expert-based validation.

翻译：验证威胁建模结果的完整性仍然困难，因为缺乏外部基准时难以判断完备性。现有研究常依赖专家生成的参考模型及其他人工基线，但这些方法可能存在遗漏或分歧。本文评估了一种基于漏洞的互补性验证方法。我们针对已知漏洞集合的脆弱性应用进行威胁建模，以衡量可发现的关联漏洞数量。我们比较了团队开发的LLM辅助威胁建模工具ThreMoLIA与微软威胁建模工具（MTMT）在AzureGoat和脆弱银行应用（VulnBank）上的表现。两者的输入均限定为架构图、数据流图及其描述。结果表明，ThreMoLIA在两个系统上均实现了更高的漏洞覆盖率。我们证明，脆弱测试应用为评估威胁覆盖率提供了实用基准，并能补充基于专家的验证方法。

相关内容

MoDELS

关注 46

ACM/IEEE第23届模型驱动工程语言和系统国际会议，是模型驱动软件和系统工程的首要会议系列，由ACM-SIGSOFT和IEEE-TCSE支持组织。自1998年以来，模型涵盖了建模的各个方面，从语言和方法到工具和应用程序。模特的参加者来自不同的背景，包括研究人员、学者、工程师和工业专业人士。MODELS 2019是一个论坛，参与者可以围绕建模和模型驱动的软件和系统交流前沿研究成果和创新实践经验。今年的版本将为建模社区提供进一步推进建模基础的机会，并在网络物理系统、嵌入式系统、社会技术系统、云计算、大数据、机器学习、安全、开源等新兴领域提出建模的创新应用以及可持续性。官网链接：http://www.modelsconference.org/

《基于理论的威慑效能评估》

专知会员服务

13+阅读 · 5月28日

《基于深度学习的软件定义网络模型用于物联网网络威胁检测》

专知会员服务

12+阅读 · 3月16日

《多智能体影响图在混合威胁建模中的应用》最新30页报告

专知会员服务

22+阅读 · 3月15日

《运用人工神经网络的防空系统威胁评估模型》

专知会员服务

16+阅读 · 2月21日