This work investigates the performance of Large Language Models (LLMs) in generating ABAP code. Despite successful applications of generative AI in many programming languages, there are hardly any systematic analyses of ABAP code generation to date. The aim of the study is to empirically analyze to what extent various LLMs can generate syntactically correct and functional ABAP code, how effectively they use compiler feedback for iterative improvement, and which task types pose special challenges. For this purpose, a benchmark with 180 tasks is conducted, consisting of adapted HumanEval tasks and practical SAP scenarios. The results show significant performance differences between the models: more powerful LLMs achieve success rates of around 75% after several iterations and benefit greatly from compiler feedback, while smaller models perform significantly weaker. Overall, the study highlights the high potential of powerful LLMs for ABAP development processes, especially in iterative error correction.


翻译:本研究探讨了大型语言模型在生成ABAP代码方面的性能表现。尽管生成式人工智能已在多种编程语言中取得成功应用,但迄今为止针对ABAP代码生成的系统性分析仍极为有限。本研究的目的是通过实证方法分析各类大型语言模型在以下方面的能力:生成语法正确且功能完整的ABAP代码的程度、利用编译器反馈进行迭代改进的有效性,以及哪些任务类型会带来特殊挑战。为此,我们构建了一个包含180个任务的基准测试集,其中包含改编的HumanEval任务和实际SAP应用场景。实验结果表明不同模型之间存在显著性能差异:更强大的大型语言模型经过数次迭代后成功率可达75%左右,且能极大受益于编译器反馈;而较小模型的性能则明显较弱。总体而言,本研究揭示了强大大型语言模型在ABAP开发流程中的巨大潜力,特别是在迭代错误修正方面。

0
下载
关闭预览

相关内容

大语言模型中的检索与结构化增强生成综述
专知会员服务
32+阅读 · 2025年9月17日
大语言模型基准综述
专知会员服务
25+阅读 · 2025年8月22日
通过强化学习增强代码生成中的代码大语言模型:综述
专知会员服务
29+阅读 · 2025年1月1日
大语言模型评估技术研究进展
专知会员服务
48+阅读 · 2024年7月9日
《大型语言模型代码生成》综述
专知会员服务
68+阅读 · 2024年6月4日
大语言模型算法演进综述
专知会员服务
81+阅读 · 2024年5月30日
自然语言生成资源列表
专知
17+阅读 · 2020年1月4日
绝对干货!NLP预训练模型:从transformer到albert
新智元
13+阅读 · 2019年11月10日
自然语言处理中的语言模型预训练方法
PaperWeekly
14+阅读 · 2018年10月21日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2014年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关VIP内容
大语言模型中的检索与结构化增强生成综述
专知会员服务
32+阅读 · 2025年9月17日
大语言模型基准综述
专知会员服务
25+阅读 · 2025年8月22日
通过强化学习增强代码生成中的代码大语言模型:综述
专知会员服务
29+阅读 · 2025年1月1日
大语言模型评估技术研究进展
专知会员服务
48+阅读 · 2024年7月9日
《大型语言模型代码生成》综述
专知会员服务
68+阅读 · 2024年6月4日
大语言模型算法演进综述
专知会员服务
81+阅读 · 2024年5月30日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2014年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员