Knowledge Gradient for Preference Learning - 专知论文

会员服务 ·

0

知识 · 知识梯度 · 梯度 · 贝叶斯 · 贝叶斯优化 ·

Knowledge Gradient for Preference Learning

翻译：知识梯度在偏好学习中的应用

Kaiwen Wu,Jacob R. Gardner

The knowledge gradient is a popular acquisition function in Bayesian optimization (BO) for optimizing black-box objectives with noisy function evaluations. Many practical settings, however, allow only pairwise comparison queries, yielding a preferential BO problem where direct function evaluations are unavailable. Extending the knowledge gradient to preferential BO is hindered by its computational challenge. At its core, the look-ahead step in the preferential setting requires computing a non-Gaussian posterior, which was previously considered intractable. In this paper, we address this challenge by deriving an exact and analytical knowledge gradient for preferential BO. We show that the exact knowledge gradient performs strongly on a suite of benchmark problems, often outperforming existing acquisition functions. In addition, we also present a case study illustrating the limitation of the knowledge gradient in certain scenarios.

翻译：知识梯度是贝叶斯优化中一种常用的采集函数，用于在含噪声函数评估条件下优化黑箱目标函数。然而，许多实际场景仅允许进行成对比较查询，从而形成了直接函数评估不可用的偏好贝叶斯优化问题。将知识梯度扩展至偏好贝叶斯优化领域一直受限于其计算复杂性。其核心困难在于：偏好场景中的前瞻步骤需要计算非高斯后验分布，此前该问题被认为无法解析处理。本文通过推导偏好贝叶斯优化的精确解析知识梯度来解决这一挑战。我们证明该精确知识梯度在基准测试集上表现优异，通常优于现有采集函数。此外，我们还通过案例研究揭示了知识梯度在特定场景下的局限性。

0

相关内容

【经典书】实用数学优化:基本优化理论与基于梯度的算法，388页pdf

【经典书】实用数学优化:基本优化理论与基于梯度的算法，388页pdf

专知会员服务

124+阅读 · 2022年9月7日

Nature. Mach. Intell. |基于梯度的学习通过平衡压缩和扩展来驱动循环神经网络中的鲁棒表示

Nature. Mach. Intell. |基于梯度的学习通过平衡压缩和扩展来驱动循环神经网络中的鲁棒表示

专知会员服务

10+阅读 · 2022年6月23日

为什么深度学习泛化性好？Google发布82页《深度学习泛化性揭秘》论文提出相干性梯度理论来解释

为什么深度学习泛化性好？Google发布82页《深度学习泛化性揭秘》论文提出相干性梯度理论来解释

专知会员服务

64+阅读 · 2022年3月23日

【干货书】优化与学习的随机梯度技术，238页pdf

【干货书】优化与学习的随机梯度技术，238页pdf

专知会员服务

54+阅读 · 2021年11月22日

通过条件梯度进行结构化机器学习训练，50页ppt与视频

通过条件梯度进行结构化机器学习训练，50页ppt与视频

专知会员服务

13+阅读 · 2021年2月25日

最新《机器学习最优化》课程笔记，36页pdf，Optimization for Machine Learning

专知会员服务

171+阅读 · 2020年5月10日

【机器学习最优化课程笔记】Optimization for Machine Learning，36页pdf

【机器学习最优化课程笔记】Optimization for Machine Learning，36页pdf

专知会员服务

117+阅读 · 2020年3月25日

【Google-普林斯顿】从学习速率中解开自适应梯度法，Disentangling Adaptive Gradient

专知会员服务

19+阅读 · 2020年3月5日

【推荐论文】具有深度学习知识的贝叶斯推理，Bayesian Reasoning with Deep-Learned Knowledge

【推荐论文】具有深度学习知识的贝叶斯推理，Bayesian Reasoning with Deep-Learned Knowledge

专知会员服务

39+阅读 · 2020年2月2日

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

专知会员服务

57+阅读 · 2019年11月8日

会议交流 | 盘点知识图谱的10大热点趋势与实践探索——DataFunSummit 2022 知识图谱在线峰会

会议交流 | 盘点知识图谱的10大热点趋势与实践探索——DataFunSummit 2022 知识图谱在线峰会

开放知识图谱

13+阅读 · 2022年3月8日

【SIGIR2020-清华】知识图谱上的增强推荐推理

【SIGIR2020-清华】知识图谱上的增强推荐推理

专知

15+阅读 · 2020年5月30日

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

深度学习与NLP

12+阅读 · 2018年9月13日

知识图谱中的深度学习技术应用概述

知识图谱中的深度学习技术应用概述

深度学习与NLP

11+阅读 · 2018年9月13日

【深度】让DL可解释？这一份66页贝叶斯深度学习教程告诉你

【深度】让DL可解释？这一份66页贝叶斯深度学习教程告诉你

GAN生成式对抗网络

15+阅读 · 2018年8月11日

让DL可解释？这一份66页贝叶斯深度学习教程告诉你

让DL可解释？这一份66页贝叶斯深度学习教程告诉你

专知

19+阅读 · 2018年8月4日

【知识图谱】如何将知识图谱特征学习应用到推荐系统？

【知识图谱】如何将知识图谱特征学习应用到推荐系统？

产业智能官

28+阅读 · 2018年6月14日

如何将知识图谱特征学习应用到推荐系统？

如何将知识图谱特征学习应用到推荐系统？

AI100

16+阅读 · 2018年6月10日

【论文推荐】最新5篇知识图谱相关论文—强化学习、习知识图谱的表示、词义消除歧义、并行翻译嵌入、图数据库

【论文推荐】最新5篇知识图谱相关论文—强化学习、习知识图谱的表示、词义消除歧义、并行翻译嵌入、图数据库

专知

10+阅读 · 2018年1月24日

【深度】专知主题链路知识推荐#8-机器学习中的变分推断方法(Variational Inference)简介01

【深度】专知主题链路知识推荐#8-机器学习中的变分推断方法(Variational Inference)简介01

专知

15+阅读 · 2017年9月26日

面向海量高维数据的可深度结合的贝叶斯网学习与推理新方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

视知觉学习中的脑功能网络变化及其与学习效果的关系

国家自然科学基金

0+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

面向大数据的群体偏好决策分析研究

国家自然科学基金

6+阅读 · 2014年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

信息论学习中的正则化及相关高维数据分析方法的数学理论

国家自然科学基金

12+阅读 · 2014年12月31日

基于领域知识和链路预测的个性化推荐研究

国家自然科学基金

4+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

Contextual Preference Distribution Learning

Arxiv

0+阅读 · 3月17日

Biased Compression in Gradient Coding for Distributed Learning

Arxiv

0+阅读 · 3月17日

Deterministic Policy Gradient for Reinforcement Learning with Continuous Time and State

Arxiv

0+阅读 · 3月16日

Delightful Policy Gradient

Arxiv

0+阅读 · 3月15日

GRADIEND: Feature Learning within Neural Networks Exemplified through Biases

Arxiv

0+阅读 · 3月9日

Gradient is All You Need? How Consensus-Based Optimization can be Interpreted as a Stochastic Relaxation of Gradient Descent

Arxiv

0+阅读 · 2月27日

Learning Preference from Observed Rankings

Arxiv

0+阅读 · 2月18日

Policy Gradients for Cumulative Prospect Theory in Reinforcement Learning

Arxiv

0+阅读 · 2月17日

Pragmatic Curiosity: A Hybrid Learning-Optimization Paradigm via Active Inference

Arxiv

0+阅读 · 2月5日

Gradient Flow Through Diagram Expansions: Learning Regimes and Explicit Solutions

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

贝叶斯优化

最新内容

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

3+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

3+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

4+阅读 · 5月30日

美以伊战争：首次人工智能战争——军事自主性困境

美以伊战争：首次人工智能战争——军事自主性困境

专知会员服务

4+阅读 · 5月30日

《Palantir任务保障性软件安全标准（MA-S2）》

《Palantir任务保障性软件安全标准（MA-S2）》

专知会员服务

10+阅读 · 5月30日

《美海军利用扩展现实增强知识流动研究》300页报告

《美海军利用扩展现实增强知识流动研究》300页报告

专知会员服务

6+阅读 · 5月30日

基于声学的无人机检测技术综述

基于声学的无人机检测技术综述

专知会员服务

7+阅读 · 5月30日

《当代混合战争分析框架：俄乌战争经验教训》

《当代混合战争分析框架：俄乌战争经验教训》

专知会员服务

8+阅读 · 5月30日

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

11+阅读 · 5月29日

AutoScientists：自组织智能体团队驱动长期科学实验

AutoScientists：自组织智能体团队驱动长期科学实验

专知会员服务

6+阅读 · 5月29日

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

专知会员服务

6+阅读 · 5月29日

战略前沿人工智能的再思考（中文）

战略前沿人工智能的再思考（中文）

专知会员服务

8+阅读 · 5月29日

《量化地基防空系统间接效应的博弈论方法》

《量化地基防空系统间接效应的博弈论方法》

专知会员服务

6+阅读 · 5月29日

传感器网络：美国如何探测来自伊朗的导弹与无人机

传感器网络：美国如何探测来自伊朗的导弹与无人机

专知会员服务

6+阅读 · 5月29日

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

专知会员服务

9+阅读 · 5月29日

相关VIP内容

【经典书】实用数学优化:基本优化理论与基于梯度的算法，388页pdf

【经典书】实用数学优化:基本优化理论与基于梯度的算法，388页pdf

专知会员服务

124+阅读 · 2022年9月7日

Nature. Mach. Intell. |基于梯度的学习通过平衡压缩和扩展来驱动循环神经网络中的鲁棒表示

Nature. Mach. Intell. |基于梯度的学习通过平衡压缩和扩展来驱动循环神经网络中的鲁棒表示

专知会员服务

10+阅读 · 2022年6月23日

为什么深度学习泛化性好？Google发布82页《深度学习泛化性揭秘》论文提出相干性梯度理论来解释

为什么深度学习泛化性好？Google发布82页《深度学习泛化性揭秘》论文提出相干性梯度理论来解释

专知会员服务

64+阅读 · 2022年3月23日

【干货书】优化与学习的随机梯度技术，238页pdf

【干货书】优化与学习的随机梯度技术，238页pdf

专知会员服务

54+阅读 · 2021年11月22日

通过条件梯度进行结构化机器学习训练，50页ppt与视频

通过条件梯度进行结构化机器学习训练，50页ppt与视频

专知会员服务

13+阅读 · 2021年2月25日

最新《机器学习最优化》课程笔记，36页pdf，Optimization for Machine Learning

专知会员服务

171+阅读 · 2020年5月10日

【机器学习最优化课程笔记】Optimization for Machine Learning，36页pdf

【机器学习最优化课程笔记】Optimization for Machine Learning，36页pdf

专知会员服务

117+阅读 · 2020年3月25日

【Google-普林斯顿】从学习速率中解开自适应梯度法，Disentangling Adaptive Gradient

专知会员服务

19+阅读 · 2020年3月5日

【推荐论文】具有深度学习知识的贝叶斯推理，Bayesian Reasoning with Deep-Learned Knowledge

【推荐论文】具有深度学习知识的贝叶斯推理，Bayesian Reasoning with Deep-Learned Knowledge

专知会员服务

39+阅读 · 2020年2月2日

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

【CCF优秀博士学位论文奖-2019】机器学习算法的分布式梯度优化研究，北京大学江佳伟

专知会员服务

57+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

美以伊战争：首次人工智能战争——军事自主性困境

BES：让语言模型通过双向进化搜索自我改进

以色列-美国-伊朗战争中的无人机：关键要点

相关资讯

会议交流 | 盘点知识图谱的10大热点趋势与实践探索——DataFunSummit 2022 知识图谱在线峰会

会议交流 | 盘点知识图谱的10大热点趋势与实践探索——DataFunSummit 2022 知识图谱在线峰会

开放知识图谱

13+阅读 · 2022年3月8日

【SIGIR2020-清华】知识图谱上的增强推荐推理

【SIGIR2020-清华】知识图谱上的增强推荐推理

专知

15+阅读 · 2020年5月30日

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

深度学习与NLP

12+阅读 · 2018年9月13日

知识图谱中的深度学习技术应用概述

知识图谱中的深度学习技术应用概述

深度学习与NLP

11+阅读 · 2018年9月13日

【深度】让DL可解释？这一份66页贝叶斯深度学习教程告诉你

【深度】让DL可解释？这一份66页贝叶斯深度学习教程告诉你

GAN生成式对抗网络

15+阅读 · 2018年8月11日

让DL可解释？这一份66页贝叶斯深度学习教程告诉你

让DL可解释？这一份66页贝叶斯深度学习教程告诉你

专知

19+阅读 · 2018年8月4日

【知识图谱】如何将知识图谱特征学习应用到推荐系统？

【知识图谱】如何将知识图谱特征学习应用到推荐系统？

产业智能官

28+阅读 · 2018年6月14日

如何将知识图谱特征学习应用到推荐系统？

如何将知识图谱特征学习应用到推荐系统？

AI100

16+阅读 · 2018年6月10日

【论文推荐】最新5篇知识图谱相关论文—强化学习、习知识图谱的表示、词义消除歧义、并行翻译嵌入、图数据库

【论文推荐】最新5篇知识图谱相关论文—强化学习、习知识图谱的表示、词义消除歧义、并行翻译嵌入、图数据库

专知

10+阅读 · 2018年1月24日

【深度】专知主题链路知识推荐#8-机器学习中的变分推断方法(Variational Inference)简介01

【深度】专知主题链路知识推荐#8-机器学习中的变分推断方法(Variational Inference)简介01

专知

15+阅读 · 2017年9月26日

相关论文

Contextual Preference Distribution Learning

Arxiv

0+阅读 · 3月17日

Biased Compression in Gradient Coding for Distributed Learning

Arxiv

0+阅读 · 3月17日

Deterministic Policy Gradient for Reinforcement Learning with Continuous Time and State

Arxiv

0+阅读 · 3月16日

Delightful Policy Gradient

Arxiv

0+阅读 · 3月15日

GRADIEND: Feature Learning within Neural Networks Exemplified through Biases

Arxiv

0+阅读 · 3月9日

Gradient is All You Need? How Consensus-Based Optimization can be Interpreted as a Stochastic Relaxation of Gradient Descent

Arxiv

0+阅读 · 2月27日

Learning Preference from Observed Rankings

Arxiv

0+阅读 · 2月18日

Policy Gradients for Cumulative Prospect Theory in Reinforcement Learning

Arxiv

0+阅读 · 2月17日

Pragmatic Curiosity: A Hybrid Learning-Optimization Paradigm via Active Inference

Arxiv

0+阅读 · 2月5日

Gradient Flow Through Diagram Expansions: Learning Regimes and Explicit Solutions

Arxiv

0+阅读 · 2月4日

相关基金

面向海量高维数据的可深度结合的贝叶斯网学习与推理新方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

视知觉学习中的脑功能网络变化及其与学习效果的关系

国家自然科学基金

0+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

面向大数据的群体偏好决策分析研究

国家自然科学基金

6+阅读 · 2014年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

信息论学习中的正则化及相关高维数据分析方法的数学理论

国家自然科学基金

12+阅读 · 2014年12月31日

基于领域知识和链路预测的个性化推荐研究

国家自然科学基金

4+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员