An Empirical Study of Policy-as-Code Adoption in Open-Source Software Projects - 专知论文

会员服务 ·

0

PAC学习理论 · 工具 · 软件 · 代码 · 系统 ·

An Empirical Study of Policy-as-Code Adoption in Open-Source Software Projects

翻译：开源软件项目中策略即代码采用的实证研究

Patrick Loic Foalem,Foutse Khomh,Leuson Da Silva,Ettore Merlo

\textbf{Context:} Policy-as-Code (PaC) has become a foundational approach for embedding governance, compliance, and security requirements directly into software systems. While organizations increasingly adopt PaC tools, the software engineering community lacks an empirical understanding of how these tools are used in real-world development practices. \textbf{Objective:} This paper aims to bridge this gap by conducting the first large-scale study of PaC usage in open-source software. Our goal is to characterize how PaC tools are adopted, what purposes they serve, and what governance activities they support across diverse software ecosystems. \textbf{Method:} We analyzed 399 GitHub repositories using nine widely adopted PaC tools. Our mixed-methods approach combines quantitative analysis of tool usage and project characteristics with a qualitative investigation of policy files. We further employ a Large Language Model (LLM)--assisted classification pipeline, refined through expert validation, to derive a taxonomy of PaC usage consisting of 5 categories and 15 sub-categories. \textbf{Results:} Our study reveals substantial diversity in PaC adoption. PaC tools are frequently used in early-stage projects and are heavily oriented toward governance, configuration control, and documentation. We also observe emerging PaC usage in MLOps pipelines and strong co-usage patterns, such as between OPA and Gatekeeper. Our taxonomy highlights recurring governance intents. \textbf{Conclusion:} Our findings offer actionable insights for practitioners and tool developers. They highlight concrete usage patterns, emphasize actual PaC usage, and motivate opportunities for improving tool interoperability. This study lays the empirical foundation for future research on PaC practices and their role in ensuring trustworthy, compliant software systems.

翻译：\textbf{背景：}策略即代码已成为将治理、合规性和安全性要求直接嵌入软件系统的基础性方法。尽管各组织越来越多地采用PaC工具，但软件工程界对于这些工具在真实开发实践中的使用方式仍缺乏实证理解。\textbf{目标：}本文旨在通过开展首次针对开源软件中PaC使用的大规模研究来弥合这一差距。我们的目标是刻画PaC工具如何被采用、服务于何种目的，以及在不同软件生态系统中支持哪些治理活动。\textbf{方法：}我们分析了使用九种广泛采用的PaC工具的399个GitHub仓库。我们的混合方法结合了对工具使用情况和项目特征的定量分析，以及对策略文件的定性调查。我们进一步采用了一个经过专家验证优化的大语言模型辅助分类流程，推导出一个包含5个类别和15个子类别的PaC使用分类体系。\textbf{结果：}我们的研究揭示了PaC采用的显著多样性。PaC工具常在早期项目中使用，并高度侧重于治理、配置控制和文档编制。我们还观察到PaC在MLOps流水线中的新兴应用，以及强烈的共现使用模式，例如OPA与Gatekeeper之间的搭配。我们的分类体系突显了反复出现的治理意图。\textbf{结论：}我们的发现为从业者和工具开发者提供了可操作的见解。它们揭示了具体的使用模式，强调了实际的PaC应用情况，并指出了改进工具互操作性的机遇。本研究为未来关于PaC实践及其在确保可信、合规软件系统中的作用的研究奠定了实证基础。

0

相关内容

PAC学习理论

PAC学习理论

PAC学习理论不关心假设选择算法，他关心的是能否从假设空间H中学习一个好的假设h。此理论不关心怎样在假设空间中寻找好的假设，只关心能不能找得到。现在我们在来看一下什么叫“好假设”？只要满足两个条件(PAC辨识条件)即可

《基于Transformer的智能体的战术决策解释》

《基于Transformer的智能体的战术决策解释》

专知会员服务

40+阅读 · 2025年12月28日

《基于大型语言模型的软件工程自动化研究》最新264页

《基于大型语言模型的软件工程自动化研究》最新264页

专知会员服务

38+阅读 · 2025年7月14日

《算法战略：在军事及地缘政治决策中取代人类判断》最新资料

《算法战略：在军事及地缘政治决策中取代人类判断》最新资料

专知会员服务

26+阅读 · 2025年6月11日

《推荐可行策略：将分析框架与决策启发式方法相结合的语义方法》

《推荐可行策略：将分析框架与决策启发式方法相结合的语义方法》

专知会员服务

21+阅读 · 2025年2月25日

【新书】《实用规范分析：使用Python优化决策制定》

【新书】《实用规范分析：使用Python优化决策制定》

专知会员服务

31+阅读 · 2024年11月23日

智能博弈决策策略求解新视角实证分析

智能博弈决策策略求解新视角实证分析

专知会员服务

72+阅读 · 2024年1月9日

ChatGPT的代码生成是怎么做的？「基于深度学习的代码生成方法」最新研究进展

ChatGPT的代码生成是怎么做的？「基于深度学习的代码生成方法」最新研究进展

专知会员服务

62+阅读 · 2023年4月1日

哈德逊研究所报告：软件定义战术

哈德逊研究所报告：软件定义战术

专知会员服务

88+阅读 · 2023年1月6日

编码计算研究综述

编码计算研究综述

专知会员服务

22+阅读 · 2021年10月26日

【2020密歇根大学论文】基于学习的序列决策算法的公平性综述论文，Fairness in Learning-Based Sequential Decision Algorithms: A Survey

【2020密歇根大学论文】基于学习的序列决策算法的公平性综述论文，Fairness in Learning-Based Sequential Decision Algorithms: A Survey

专知会员服务

22+阅读 · 2020年1月15日

智能合约的形式化验证方法研究综述

智能合约的形式化验证方法研究综述

专知

16+阅读 · 2021年5月8日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知

17+阅读 · 2021年1月18日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

这套1600赞的NLP课程已开放，面向实战，视频代码都有丨资源

这套1600赞的NLP课程已开放，面向实战，视频代码都有丨资源

量子位

15+阅读 · 2019年7月9日

十种深度学习推荐系统代码实现，持续更新中！！！

十种深度学习推荐系统代码实现，持续更新中！！！

专知

113+阅读 · 2019年4月25日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

机器之心

15+阅读 · 2018年10月21日

基于python的开源量化交易，量化投资架构

基于python的开源量化交易，量化投资架构

运维帮

15+阅读 · 2018年7月5日

推荐｜清华老师推荐30来项算法代码和工具包列表（开源）

推荐｜清华老师推荐30来项算法代码和工具包列表（开源）

全球人工智能

26+阅读 · 2018年3月26日

尽早跑通深度学习的实践代码，是入门深度学习的最快途径

尽早跑通深度学习的实践代码，是入门深度学习的最快途径

算法与数据结构

22+阅读 · 2017年12月13日

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

6+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

我国开放教育资源项目质量监测评价及质量保证策略研究——基于用户满意度视角

国家自然科学基金

1+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

基于代数结构及公理语义的泛型约束方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

基于博弈论的信息安全理论与方法研究

国家自然科学基金

10+阅读 · 2012年12月31日

CodeSense: a Real-World Benchmark and Dataset for Code Semantic Reasoning

Arxiv

0+阅读 · 2月3日

Policy Contrastive Decoding for Robotic Foundation Models

Arxiv

0+阅读 · 2月2日

PolicyFlow: Policy Optimization with Continuous Normalizing Flow in Reinforcement Learning

Arxiv

0+阅读 · 2月1日

Usage, Effects and Requirements for AI Coding Assistants in the Enterprise: An Empirical Study

Arxiv

0+阅读 · 1月27日

Learning Adaptive Parallel Execution for Efficient Code Localization

Arxiv

0+阅读 · 1月27日

Guidelines to Prompt Large Language Models for Code Generation: An Empirical Characterization

Arxiv

0+阅读 · 1月19日

Adoption and Evolution of Code Style and Best Programming Practices in Open-Source Projects

Arxiv

0+阅读 · 1月14日

TerraFormer: Automated Infrastructure-as-Code with LLMs Fine-Tuned via Policy-Guided Verifier Feedback

Arxiv

0+阅读 · 1月13日

Extracting Policies from Quantified Answer Set Programs

Arxiv

0+阅读 · 1月7日

CodeEvolve: an open source evolutionary coding agent for algorithm discovery and optimization

Arxiv

0+阅读 · 1月6日

VIP会员

文章信息

相关主题

PAC学习理论

最新内容

【NTU博士论文】3D人体动作生成

【NTU博士论文】3D人体动作生成

专知会员服务

2+阅读 · 4月24日

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

专知会员服务

2+阅读 · 4月24日

以色列军事技术对美国军力发展的持续性赋能

以色列军事技术对美国军力发展的持续性赋能

专知会员服务

8+阅读 · 4月24日

战场之外的较量：美伊冲突中的认知战与心理博弈

战场之外的较量：美伊冲突中的认知战与心理博弈

专知会员服务

6+阅读 · 4月24日

俄乌战争中乌克兰防空能力演变与见解（中文版）

俄乌战争中乌克兰防空能力演变与见解（中文版）

专知会员服务

4+阅读 · 4月24日

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

专知会员服务

8+阅读 · 4月24日

《深度强化学习在兵棋推演中的应用》40页报告

《深度强化学习在兵棋推演中的应用》40页报告

专知会员服务

11+阅读 · 4月24日

《多域作战面临复杂现实》

《多域作战面临复杂现实》

专知会员服务

8+阅读 · 4月24日

《印度的多域作战：条令与能力发展》报告

《印度的多域作战：条令与能力发展》报告

专知会员服务

3+阅读 · 4月24日

《是“修复情报”还是修复部队？阿富汗反叛乱行动中的美军情报调整》400页

《是“修复情报”还是修复部队？阿富汗反叛乱行动中的美军情报调整》400页

专知会员服务

3+阅读 · 4月24日

美军的算法化军备库：无人机优势计划（DDP）、复制者倡议（Replicator）与联合全域指挥控制（JADC2）如何重写战争规则

美军的算法化军备库：无人机优势计划（DDP）、复制者倡议（Replicator）与联合全域指挥控制（JADC2）如何重写战争规则

专知会员服务

3+阅读 · 4月24日

（中文版）美空军部发布《空军部数据战略》与《人工智能战略》两份战略：旨在加速建立军事优势

（中文版）美空军部发布《空军部数据战略》与《人工智能战略》两份战略：旨在加速建立军事优势

专知会员服务

17+阅读 · 4月24日

【斯坦福博士论文】语言模型的机械可解释性与控制

【斯坦福博士论文】语言模型的机械可解释性与控制

专知会员服务

4+阅读 · 4月23日

大语言模型智能体长期记忆安全性综述：迈向记忆主权

大语言模型智能体长期记忆安全性综述：迈向记忆主权

专知会员服务

5+阅读 · 4月23日

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

专知会员服务

5+阅读 · 4月23日

相关VIP内容

《基于Transformer的智能体的战术决策解释》

《基于Transformer的智能体的战术决策解释》

专知会员服务

40+阅读 · 2025年12月28日

《基于大型语言模型的软件工程自动化研究》最新264页

《基于大型语言模型的软件工程自动化研究》最新264页

专知会员服务

38+阅读 · 2025年7月14日

《算法战略：在军事及地缘政治决策中取代人类判断》最新资料

《算法战略：在军事及地缘政治决策中取代人类判断》最新资料

专知会员服务

26+阅读 · 2025年6月11日

《推荐可行策略：将分析框架与决策启发式方法相结合的语义方法》

《推荐可行策略：将分析框架与决策启发式方法相结合的语义方法》

专知会员服务

21+阅读 · 2025年2月25日

【新书】《实用规范分析：使用Python优化决策制定》

【新书】《实用规范分析：使用Python优化决策制定》

专知会员服务

31+阅读 · 2024年11月23日

智能博弈决策策略求解新视角实证分析

智能博弈决策策略求解新视角实证分析

专知会员服务

72+阅读 · 2024年1月9日

ChatGPT的代码生成是怎么做的？「基于深度学习的代码生成方法」最新研究进展

ChatGPT的代码生成是怎么做的？「基于深度学习的代码生成方法」最新研究进展

专知会员服务

62+阅读 · 2023年4月1日

哈德逊研究所报告：软件定义战术

哈德逊研究所报告：软件定义战术

专知会员服务

88+阅读 · 2023年1月6日

编码计算研究综述

编码计算研究综述

专知会员服务

22+阅读 · 2021年10月26日

【2020密歇根大学论文】基于学习的序列决策算法的公平性综述论文，Fairness in Learning-Based Sequential Decision Algorithms: A Survey

【2020密歇根大学论文】基于学习的序列决策算法的公平性综述论文，Fairness in Learning-Based Sequential Decision Algorithms: A Survey

专知会员服务

22+阅读 · 2020年1月15日

热门VIP内容

开通专知VIP会员享更多权益服务

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

战场之外的较量：美伊冲突中的认知战与心理博弈

【NTU博士论文】3D人体动作生成

以色列军事技术对美国军力发展的持续性赋能

相关资讯

智能合约的形式化验证方法研究综述

智能合约的形式化验证方法研究综述

专知

16+阅读 · 2021年5月8日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知

17+阅读 · 2021年1月18日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

这套1600赞的NLP课程已开放，面向实战，视频代码都有丨资源

这套1600赞的NLP课程已开放，面向实战，视频代码都有丨资源

量子位

15+阅读 · 2019年7月9日

十种深度学习推荐系统代码实现，持续更新中！！！

十种深度学习推荐系统代码实现，持续更新中！！！

专知

113+阅读 · 2019年4月25日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

机器之心

15+阅读 · 2018年10月21日

基于python的开源量化交易，量化投资架构

基于python的开源量化交易，量化投资架构

运维帮

15+阅读 · 2018年7月5日

推荐｜清华老师推荐30来项算法代码和工具包列表（开源）

推荐｜清华老师推荐30来项算法代码和工具包列表（开源）

全球人工智能

26+阅读 · 2018年3月26日

尽早跑通深度学习的实践代码，是入门深度学习的最快途径

尽早跑通深度学习的实践代码，是入门深度学习的最快途径

算法与数据结构

22+阅读 · 2017年12月13日

相关论文

CodeSense: a Real-World Benchmark and Dataset for Code Semantic Reasoning

Arxiv

0+阅读 · 2月3日

Policy Contrastive Decoding for Robotic Foundation Models

Arxiv

0+阅读 · 2月2日

PolicyFlow: Policy Optimization with Continuous Normalizing Flow in Reinforcement Learning

Arxiv

0+阅读 · 2月1日

Usage, Effects and Requirements for AI Coding Assistants in the Enterprise: An Empirical Study

Arxiv

0+阅读 · 1月27日

Learning Adaptive Parallel Execution for Efficient Code Localization

Arxiv

0+阅读 · 1月27日

Guidelines to Prompt Large Language Models for Code Generation: An Empirical Characterization

Arxiv

0+阅读 · 1月19日

Adoption and Evolution of Code Style and Best Programming Practices in Open-Source Projects

Arxiv

0+阅读 · 1月14日

TerraFormer: Automated Infrastructure-as-Code with LLMs Fine-Tuned via Policy-Guided Verifier Feedback

Arxiv

0+阅读 · 1月13日

Extracting Policies from Quantified Answer Set Programs

Arxiv

0+阅读 · 1月7日

CodeEvolve: an open source evolutionary coding agent for algorithm discovery and optimization

Arxiv

0+阅读 · 1月6日

相关基金

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

6+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

我国开放教育资源项目质量监测评价及质量保证策略研究——基于用户满意度视角

国家自然科学基金

1+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

基于代数结构及公理语义的泛型约束方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

基于博弈论的信息安全理论与方法研究

国家自然科学基金

10+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员