Understanding large software systems is a challenging task, especially when code is distributed across multiple repositories and microservices. Developers often need to reason not only about the structure of the code, but also about its domain logic and runtime behaviors, which are typically implicit and scattered. We introduce LogicLens, a reactive conversational agent that assists developers in exploring complex software systems through a semantic multi-repository graph. This graph is built in a preprocessing step by combining syntactic code analysis, via AST parsing and repository traversal, with semantic enrichment using Large Language Models (LLMs). The resulting graph captures both structural elements, such as files, classes, and functions, as well as functional abstractions like domain entities, operations, and workflows. Once the graph is constructed, LogicLens enables developers to interact with it via natural language, dynamically retrieving relevant subgraphs and answering technical or functional queries. We present the architecture of the system, discuss emergent behaviors, and evaluate its effectiveness on real-world multi-repository scenarios. We demonstrate emergent capabilities including impact analysis and symptom-based debugging that arise naturally from the semantic graph structure.


翻译:理解大型软件系统是一项具有挑战性的任务,尤其是在代码分布在多个仓库和微服务中的情况下。开发人员不仅需要推理代码的结构,还需要理解其领域逻辑和运行时行为,而这些信息通常是隐式且分散的。我们提出了LogicLens,一个反应式对话代理,它通过语义多仓库图来协助开发人员探索复杂的软件系统。该图在预处理步骤中构建,结合了通过AST解析和仓库遍历实现的语法代码分析,以及利用大型语言模型(LLMs)进行的语义增强。生成的图既捕获了结构元素(如文件、类和函数),也捕获了功能抽象(如领域实体、操作和工作流)。一旦图构建完成,LogicLens使开发人员能够通过自然语言与之交互,动态检索相关子图并回答技术或功能查询。我们介绍了该系统的架构,讨论了其涌现行为,并在真实世界的多仓库场景中评估了其有效性。我们展示了包括影响分析和基于症状的调试在内的涌现能力,这些能力自然地源于语义图结构。

0
下载
关闭预览

相关内容

代码(Code)是专知网的一个重要知识资料文档板块,旨在整理收录论文源代码、复现代码,经典工程代码等,便于用户查阅下载使用。
稀疏自编码器综述:解释大语言模型的内部机制
专知会员服务
17+阅读 · 2025年12月27日
大语言模型在多模态推荐系统中的应用综述
专知会员服务
17+阅读 · 2025年5月17日
多机器人系统的大型语言模型:综述
专知会员服务
33+阅读 · 2025年2月7日
《多语言大型语言模型:系统综述》
专知会员服务
49+阅读 · 2024年11月21日
《大型语言模型代码生成》综述
专知会员服务
68+阅读 · 2024年6月4日
【大规模数据系统,552页ppt】Large-scale Data Systems
专知会员服务
61+阅读 · 2019年12月21日
综述:Image Caption 任务之语句多样性
PaperWeekly
22+阅读 · 2018年11月30日
深度学习文本分类方法综述(代码)
中国人工智能学会
28+阅读 · 2018年6月16日
tensorflow系列笔记:流程,概念和代码解析
北京思腾合力科技有限公司
30+阅读 · 2017年11月11日
大数据分析研究组开源Easy Machine Learning系统
中国科学院网络数据重点实验室
17+阅读 · 2017年6月13日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员