Code intelligence is an emerging domain in software engineering, aiming to improve the effectiveness and efficiency of various code-related tasks. Recent research suggests that incorporating contextual information beyond the basic original task inputs (i.e., source code) can substantially enhance model performance. Such contextual signals may be obtained directly or indirectly from sources such as API documentation or intermediate representations like abstract syntax trees can significantly improve the effectiveness of code intelligence. Despite growing academic interest, there is a lack of systematic analysis of context in code intelligence. To address this gap, we conduct an extensive literature review of 146 relevant studies published between September 2007 and August 2024. Our investigation yields four main contributions. (1) A quantitative analysis of the research landscape, including publication trends, venues, and the explored domains; (2) A novel taxonomy of context types used in code intelligence; (3) A task-oriented analysis investigating context integration strategies across diverse code intelligence tasks; (4) A critical evaluation of evaluation methodologies for context-aware methods. Based on these findings, we identify fundamental challenges in context utilization in current code intelligence systems and propose a research roadmap that outlines key opportunities for future research.


翻译:代码智能是软件工程中的一个新兴领域,旨在提高各类代码相关任务的有效性和效率。近期研究表明,在基础原始任务输入(即源代码)之外纳入上下文信息,可以显著提升模型性能。此类上下文信号可直接或间接地从诸如API文档等来源获取,或通过抽象语法树等中间表示获得,从而能显著改善代码智能的效果。尽管学术界兴趣日益增长,但目前缺乏对代码智能中上下文的系统性分析。为填补这一空白,我们对2007年9月至2024年8月期间发表的146项相关研究进行了广泛的文献综述。我们的调查产生了四项主要贡献:(1) 对研究格局的定量分析,包括发表趋势、发表场所以及探索的领域;(2) 一种用于代码智能的上下文类型的新颖分类法;(3) 一项面向任务的分析,研究跨不同代码智能任务的上下文整合策略;(4) 对上下文感知方法评估方法论的关键性评估。基于这些发现,我们指出了当前代码智能系统中上下文利用的根本性挑战,并提出了一个研究路线图,概述了未来研究的关键机遇。

0
下载
关闭预览

相关内容

代码(Code)是专知网的一个重要知识资料文档板块,旨在整理收录论文源代码、复现代码,经典工程代码等,便于用户查阅下载使用。
AI生成代码缺陷综述
专知会员服务
16+阅读 · 2025年12月8日
上下文工程到底是什么?一文起底
专知会员服务
22+阅读 · 2025年7月21日
《深度学习代码智能》综述、基准和工具集
专知会员服务
56+阅读 · 2024年1月2日
【CMU博士论文】多视图上下文理解的知识增强表示学习
专知会员服务
35+阅读 · 2022年8月11日
文档智能: 数据集、模型和应用
专知会员服务
63+阅读 · 2022年7月31日
完备的 AI 学习路线,最详细的资源整理!
新智元
17+阅读 · 2019年5月4日
人工智能在教育领域的应用探析
MOOC
14+阅读 · 2019年3月16日
语音识别的前沿论文,看我们推荐的这4篇
人工智能前沿讲习班
26+阅读 · 2019年1月14日
深度文本匹配在智能客服中的应用
AI100
18+阅读 · 2018年10月24日
深度上下文词向量
微信AI
27+阅读 · 2018年9月13日
尽早跑通深度学习的实践代码,是入门深度学习的最快途径
算法与数据结构
22+阅读 · 2017年12月13日
NLP中自动生产文摘(auto text summarization)
机器学习研究会
14+阅读 · 2017年10月10日
【论文】图上的表示学习综述
机器学习研究会
15+阅读 · 2017年9月24日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
VIP会员
相关资讯
完备的 AI 学习路线,最详细的资源整理!
新智元
17+阅读 · 2019年5月4日
人工智能在教育领域的应用探析
MOOC
14+阅读 · 2019年3月16日
语音识别的前沿论文,看我们推荐的这4篇
人工智能前沿讲习班
26+阅读 · 2019年1月14日
深度文本匹配在智能客服中的应用
AI100
18+阅读 · 2018年10月24日
深度上下文词向量
微信AI
27+阅读 · 2018年9月13日
尽早跑通深度学习的实践代码,是入门深度学习的最快途径
算法与数据结构
22+阅读 · 2017年12月13日
NLP中自动生产文摘(auto text summarization)
机器学习研究会
14+阅读 · 2017年10月10日
【论文】图上的表示学习综述
机器学习研究会
15+阅读 · 2017年9月24日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员