Prompt quality plays a critical role in the performance of large language models (LLMs), motivating a growing body of work on prompt optimization. Most existing methods optimize prompts over a fixed dataset, assuming static input distributions and offering limited support for iterative improvement. We introduce SIPDO (Self-Improving Prompts through Data-Augmented Optimization), a closed-loop framework for prompt learning that integrates synthetic data generation into the optimization process. SIPDO couples a synthetic data generator with a prompt optimizer, where the generator produces new examples that reveal current prompt weaknesses and the optimizer incrementally refines the prompt in response. This feedback-driven loop enables systematic improvement of prompt performance without assuming access to external supervision or new tasks. Experiments across question answering and reasoning benchmarks show that SIPDO outperforms standard prompt tuning methods, highlighting the value of integrating data synthesis into prompt learning workflows.


翻译:提示质量对大型语言模型(LLM)的性能至关重要,这推动了日益增多的提示优化研究工作。现有方法大多基于固定数据集进行提示优化,其假设输入分布是静态的,且对迭代改进的支持有限。本文提出SIPDO(基于数据增强优化的自改进提示),一种将合成数据生成整合到优化过程中的闭环提示学习框架。SIPDO将合成数据生成器与提示优化器耦合:生成器通过生成揭示当前提示缺陷的新示例,优化器则据此对提示进行增量式改进。这种反馈驱动的闭环机制能够在无需外部监督或新任务的前提下,实现提示性能的系统性提升。在问答与推理基准测试上的实验表明,SIPDO的性能优于标准提示调优方法,凸显了将数据合成融入提示学习工作流程的价值。

0
下载
关闭预览

相关内容

【SIGIR2025教程】动态与参数化检索增强生成
专知会员服务
16+阅读 · 2025年7月14日
提示调优综述
专知会员服务
18+阅读 · 2025年7月10日
【CVPR2025】ProAPO: 逐步自动化提示优化用于视觉分类
专知会员服务
15+阅读 · 2025年3月1日
自动化提示工程综述:一种优化视角
专知会员服务
28+阅读 · 2025年2月18日
多模态检索增强生成的综合综述
专知会员服务
43+阅读 · 2025年2月17日
【ICLR2025】DynaPrompt:动态测试时提示调优
专知会员服务
10+阅读 · 2025年2月2日
大型语言模型的高效提示方法综述
专知会员服务
75+阅读 · 2024年4月2日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
VIP会员
相关VIP内容
【SIGIR2025教程】动态与参数化检索增强生成
专知会员服务
16+阅读 · 2025年7月14日
提示调优综述
专知会员服务
18+阅读 · 2025年7月10日
【CVPR2025】ProAPO: 逐步自动化提示优化用于视觉分类
专知会员服务
15+阅读 · 2025年3月1日
自动化提示工程综述:一种优化视角
专知会员服务
28+阅读 · 2025年2月18日
多模态检索增强生成的综合综述
专知会员服务
43+阅读 · 2025年2月17日
【ICLR2025】DynaPrompt:动态测试时提示调优
专知会员服务
10+阅读 · 2025年2月2日
大型语言模型的高效提示方法综述
专知会员服务
75+阅读 · 2024年4月2日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员