GenAI-based coding assistants have disrupted software development. The next generation of these tools is agent-based, operating with more autonomy and potentially without human oversight. Like human developers, AI agents require contextual information to develop solutions that are in line with the standards, policies, and workflows of the software projects they operate in. Vendors of popular agentic tools (e.g., Claude Code) recommend maintaining version-controlled Markdown files that describe aspects such as the project structure, code style, or building and testing. The content of these files is then automatically added to each prompt. Recently, AGENTS$.$md has emerged as a potential standard that consolidates existing tool-specific formats. However, little is known about whether and how developers adopt this format. Therefore, in this paper, we present the results of a preliminary study investigating the adoption of AI context files in 466 open-source software projects. We analyze the information that developers provide in AGENTS$.$md files, how they present that information, and how the files evolve over time. Our findings indicate that there is no established content structure yet and that there is a lot of variation in terms of how context is provided (descriptive, prescriptive, prohibitive, explanatory, conditional). Our commit-level analysis provides first insights into the evolution of the provided context. AI context files provide a unique opportunity to study real-world context engineering. In particular, we see great potential in studying which structural or presentational modifications can positively affect the quality of the generated content.


翻译:基于生成式人工智能的编码助手已经颠覆了软件开发。这些工具的下一代是基于智能体的,它们以更高的自主性运行,并且可能在没有人工监督的情况下工作。与人类开发者类似,AI智能体需要上下文信息来开发符合其所在软件项目的标准、政策和工作流程的解决方案。流行的智能体工具(例如Claude Code)的供应商建议维护版本控制的Markdown文件,这些文件描述诸如项目结构、代码风格、构建和测试等方面。这些文件的内容随后会自动添加到每个提示中。最近,AGENTS$.$md作为一种潜在的标准出现,它整合了现有的工具特定格式。然而,关于开发者是否以及如何采用这种格式,目前知之甚少。因此,在本文中,我们展示了一项初步研究的结果,该研究调查了466个开源软件项目中AI上下文文件的采用情况。我们分析了开发者在AGENTS$.$md文件中提供的信息、他们呈现这些信息的方式,以及这些文件随时间的演变。我们的研究结果表明,目前尚未建立固定的内容结构,并且在提供上下文的方式(描述性、规定性、禁止性、解释性、条件性)上存在很大差异。我们的提交级别分析首次揭示了所提供上下文的演变过程。AI上下文文件为研究现实世界中的上下文工程提供了一个独特的机会。特别是,我们看到了研究哪些结构或呈现方式的修改能够对生成内容的质量产生积极影响的巨大潜力。

0
下载
关闭预览

相关内容

智能体工程(Agent Engineering)
专知会员服务
27+阅读 · 2025年12月31日
AI智能体编程:技术、挑战与机遇综述
专知会员服务
41+阅读 · 2025年8月18日
上下文工程到底是什么?一文起底
专知会员服务
22+阅读 · 2025年7月21日
《负责任的AI智能体》最新50页
专知会员服务
59+阅读 · 2025年3月2日
【新书】使用AI智能体构建应用程序
专知会员服务
61+阅读 · 2024年10月26日
设计和构建强大的大语言模型智能体
专知会员服务
55+阅读 · 2024年10月6日
基于大型语言模型的软件工程智能体综述
专知会员服务
58+阅读 · 2024年9月6日
AI Agent:基于大模型的自主智能体
专知会员服务
248+阅读 · 2023年9月9日
重磅!AI框架发展白皮书(2022年),44页pdf
专知
28+阅读 · 2022年2月27日
面向人工智能的计算机体系结构
计算机研究与发展
14+阅读 · 2019年6月6日
Java 工程师快速入门深度学习,可以从 Deeplearning4j 开始
人工智能头条
13+阅读 · 2018年12月14日
群体智能:新一代人工智能的重要方向
走向智能论坛
12+阅读 · 2017年8月16日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
Arxiv
0+阅读 · 1月28日
VIP会员
相关VIP内容
智能体工程(Agent Engineering)
专知会员服务
27+阅读 · 2025年12月31日
AI智能体编程:技术、挑战与机遇综述
专知会员服务
41+阅读 · 2025年8月18日
上下文工程到底是什么?一文起底
专知会员服务
22+阅读 · 2025年7月21日
《负责任的AI智能体》最新50页
专知会员服务
59+阅读 · 2025年3月2日
【新书】使用AI智能体构建应用程序
专知会员服务
61+阅读 · 2024年10月26日
设计和构建强大的大语言模型智能体
专知会员服务
55+阅读 · 2024年10月6日
基于大型语言模型的软件工程智能体综述
专知会员服务
58+阅读 · 2024年9月6日
AI Agent:基于大模型的自主智能体
专知会员服务
248+阅读 · 2023年9月9日
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员