\textbf{Context:} Policy-as-Code (PaC) has become a foundational approach for embedding governance, compliance, and security requirements directly into software systems. While organizations increasingly adopt PaC tools, the software engineering community lacks an empirical understanding of how these tools are used in real-world development practices. \textbf{Objective:} This paper aims to bridge this gap by conducting the first large-scale study of PaC usage in open-source software. Our goal is to characterize how PaC tools are adopted, what purposes they serve, and what governance activities they support across diverse software ecosystems. \textbf{Method:} We analyzed 399 GitHub repositories using nine widely adopted PaC tools. Our mixed-methods approach combines quantitative analysis of tool usage and project characteristics with a qualitative investigation of policy files. We further employ a Large Language Model (LLM)--assisted classification pipeline, refined through expert validation, to derive a taxonomy of PaC usage consisting of 5 categories and 15 sub-categories. \textbf{Results:} Our study reveals substantial diversity in PaC adoption. PaC tools are frequently used in early-stage projects and are heavily oriented toward governance, configuration control, and documentation. We also observe emerging PaC usage in MLOps pipelines and strong co-usage patterns, such as between OPA and Gatekeeper. Our taxonomy highlights recurring governance intents. \textbf{Conclusion:} Our findings offer actionable insights for practitioners and tool developers. They highlight concrete usage patterns, emphasize actual PaC usage, and motivate opportunities for improving tool interoperability. This study lays the empirical foundation for future research on PaC practices and their role in ensuring trustworthy, compliant software systems.


翻译:\textbf{背景:}策略即代码已成为将治理、合规性和安全性要求直接嵌入软件系统的基础性方法。尽管各组织越来越多地采用PaC工具,但软件工程界对于这些工具在真实开发实践中的使用方式仍缺乏实证理解。\textbf{目标:}本文旨在通过开展首次针对开源软件中PaC使用的大规模研究来弥合这一差距。我们的目标是刻画PaC工具如何被采用、服务于何种目的,以及在不同软件生态系统中支持哪些治理活动。\textbf{方法:}我们分析了使用九种广泛采用的PaC工具的399个GitHub仓库。我们的混合方法结合了对工具使用情况和项目特征的定量分析,以及对策略文件的定性调查。我们进一步采用了一个经过专家验证优化的大语言模型辅助分类流程,推导出一个包含5个类别和15个子类别的PaC使用分类体系。\textbf{结果:}我们的研究揭示了PaC采用的显著多样性。PaC工具常在早期项目中使用,并高度侧重于治理、配置控制和文档编制。我们还观察到PaC在MLOps流水线中的新兴应用,以及强烈的共现使用模式,例如OPA与Gatekeeper之间的搭配。我们的分类体系突显了反复出现的治理意图。\textbf{结论:}我们的发现为从业者和工具开发者提供了可操作的见解。它们揭示了具体的使用模式,强调了实际的PaC应用情况,并指出了改进工具互操作性的机遇。本研究为未来关于PaC实践及其在确保可信、合规软件系统中的作用的研究奠定了实证基础。

0
下载
关闭预览

相关内容

PAC学习理论不关心假设选择算法,他关心的是能否从假设空间H中学习一个好的假设h。此理论不关心怎样在假设空间中寻找好的假设,只关心能不能找得到。现在我们在来看一下什么叫“好假设”?只要满足两个条件(PAC辨识条件)即可
《基于Transformer的智能体的战术决策解释》
专知会员服务
39+阅读 · 2025年12月28日
《基于大型语言模型的软件工程自动化研究》最新264页
专知会员服务
37+阅读 · 2025年7月14日
【新书】《实用规范分析:使用Python优化决策制定》
专知会员服务
31+阅读 · 2024年11月23日
智能博弈决策策略求解新视角实证分析
专知会员服务
72+阅读 · 2024年1月9日
哈德逊研究所报告:软件定义战术
专知会员服务
88+阅读 · 2023年1月6日
编码计算研究综述
专知会员服务
22+阅读 · 2021年10月26日
智能合约的形式化验证方法研究综述
专知
16+阅读 · 2021年5月8日
基于python的开源量化交易,量化投资架构
运维帮
15+阅读 · 2018年7月5日
尽早跑通深度学习的实践代码,是入门深度学习的最快途径
算法与数据结构
22+阅读 · 2017年12月13日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员