Large language models (LLMs) are highly sensitive to prompts, but most automatic prompt optimization (APO) methods assume access to ground-truth references (e.g., labeled validation data) that are costly to obtain. We propose the Prompt Duel Optimizer (PDO), a sample-efficient framework for label-free prompt optimization based on pairwise preference feedback from an LLM judge. PDO casts prompt selection as a dueling-bandit problem and combines (i) Double Thompson Sampling to prioritize informative comparisons under a fixed judge budget, with (ii) top-performer guided mutation to expand the candidate pool while pruning weak prompts. Experiments on BIG-bench Hard (BBH) and MS MARCO show that PDO consistently identifies stronger prompts than label-free baselines, while offering favorable quality--cost trade-offs under constrained comparison budgets.


翻译:大型语言模型(LLM)对提示词高度敏感,但大多数自动提示优化(APO)方法都假设能够获取成本高昂的真实参考数据(例如带标注的验证数据)。我们提出了提示对决优化器(Prompt Duel Optimizer, PDO),这是一个基于LLM评判器成对偏好反馈的、样本高效的无需标注提示优化框架。PDO将提示选择建模为一个对决赌博机问题,并融合了两种机制:(i)双重汤普森采样,用于在固定的评判预算下优先处理信息量丰富的比较;(ii)基于顶级表现者的引导变异,用于扩展候选提示池并剪枝弱提示。在BIG-bench Hard(BBH)和MS MARCO数据集上的实验表明,PDO始终能比无需标注的基线方法识别出更强的提示,同时在受限的比较预算下提供了有利的质量-成本权衡。

0
下载
关闭预览

相关内容

【EMNLP2025】面向大语言模型的权重旋转偏好优化
专知会员服务
12+阅读 · 2025年8月27日
【ICML 2024】零阶优化器微调大模型,大幅降低内存
专知会员服务
32+阅读 · 2024年7月8日
大型语言模型的高效提示方法综述
专知会员服务
75+阅读 · 2024年4月2日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 1月23日
VIP会员
最新内容
ICML2026 | 重新思考顺序知识编辑中的正则化
专知会员服务
6+阅读 · 5月27日
《用于兵力发展选项优先排序的成本效益模型》
专知会员服务
10+阅读 · 5月27日
AutoResearch AI综述:迈向AI驱动的科学发现自动化
专知会员服务
10+阅读 · 5月26日
《Palantir边缘人工智能》手册
专知会员服务
25+阅读 · 5月26日
美军“国防自主作战群”(DAWG)概念解析
专知会员服务
6+阅读 · 5月26日
“史诗怒火”行动中的无人机与反无人机作战
专知会员服务
18+阅读 · 5月25日
相关基金
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员