黑盒模型在非参数回归中的个性化：极小极大最优性 (Personalizing black-box models for nonparametric regression with minimax optimality) - 专知论文

会员服务 ·

0

预训练 · 样本 · 黑盒 · 预训练模型 · 非参数 ·

Personalizing black-box models for nonparametric regression with minimax optimality

翻译：黑盒模型在非参数回归中的个性化：极小极大最优性

Sai Li,Linjun Zhang

Recent advances in large-scale models, including deep neural networks and large language models, have substantially improved performance across a wide range of learning tasks. The widespread availability of such pre-trained models creates new opportunities for data-efficient statistical learning, provided they can be effectively integrated into downstream tasks. Motivated by this setting, we study few-shot personalization, where a pre-trained black-box model is adapted to a target domain using a limited number of samples. We develop a theoretical framework for few-shot personalization in nonparametric regression and propose algorithms that can incorporate a black-box pre-trained model into the regression procedure. We establish the minimax optimal rate for the personalization problem and show that the proposed method attains this rate. Our results clarify the statistical benefits of leveraging pre-trained models under sample scarcity and provide robustness guarantees when the pre-trained model is not informative. We illustrate the finite-sample performance of the methods through simulations and an application to the California housing dataset with several pre-trained models.

翻译：近年来，大规模模型（包括深度神经网络和大语言模型）的进展显著提升了各类学习任务的性能。此类预训练模型的广泛可获得性为数据高效的统计学习创造了新的机遇，前提是它们能够被有效地整合到下游任务中。受此背景启发，我们研究小样本个性化问题，即利用有限样本将预训练的黑盒模型适配到目标领域。我们为非参数回归中的小样本个性化建立了一个理论框架，并提出了能够将黑盒预训练模型整合到回归过程中的算法。我们确立了该个性化问题的极小极大最优收敛速率，并证明了所提方法能够达到该速率。我们的结果阐明了在样本稀缺条件下利用预训练模型的统计优势，并在预训练模型信息量不足时提供了鲁棒性保证。我们通过仿真实验以及在加利福尼亚住房数据集上结合多种预训练模型的应用，展示了所提方法的有限样本性能。

0

相关内容

预训练

在搭建网络模型时，需要随机初始化参数，然后开始训练网络，不断调整直到网络的损失越来越小。在训练的过程中，一开始初始化的参数会不断变化。当参数训练到比较好的时候就可以将训练模型的参数保存下来，以便训练好的模型可以在下次执行类似任务时获得较好的结果。

跨越黑盒：大语言模型的理论与机制

跨越黑盒：大语言模型的理论与机制

专知会员服务

37+阅读 · 1月7日

大规模语言模型的个性化：综述

大规模语言模型的个性化：综述

专知会员服务

43+阅读 · 2024年11月4日

大型模型中的参数高效微调：方法论综述

大型模型中的参数高效微调：方法论综述

专知会员服务

69+阅读 · 2024年11月3日

【牛津大学博士论文】深度概率模型的最优传输仿真方法，172页pdf

【牛津大学博士论文】深度概率模型的最优传输仿真方法，172页pdf

专知会员服务

38+阅读 · 2024年6月22日

大模型如何做个性化？中科大等最新《当大型语言模型遇到个性化》综述，详述大模型与个性化的挑战与机遇

大模型如何做个性化？中科大等最新《当大型语言模型遇到个性化》综述，详述大模型与个性化的挑战与机遇

专知会员服务

84+阅读 · 2023年8月8日

黑盒模型如何透明化？MIT博士论文《黑盒模型的可解释性和透明性技术》，207页pdf阐述可信赖机器学习路径

黑盒模型如何透明化？MIT博士论文《黑盒模型的可解释性和透明性技术》，207页pdf阐述可信赖机器学习路径

专知会员服务

63+阅读 · 2023年4月29日

清华49页长文全方位分析参数高效微调方案Delta Tuning，揭秘大模型背后的机理

清华49页长文全方位分析参数高效微调方案Delta Tuning，揭秘大模型背后的机理

专知会员服务

50+阅读 · 2022年4月8日

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

专知会员服务

26+阅读 · 2022年3月15日

【ICML2020-DeepMind】小数据，大决策:小数据模式下的模型选择

专知会员服务

37+阅读 · 2020年9月14日

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

【2022 新版书籍】第2版《可解释的机器学习：黑盒模型可解释性理解指南》，330页pdf

【2022 新版书籍】第2版《可解释的机器学习：黑盒模型可解释性理解指南》，330页pdf

专知

13+阅读 · 2022年11月9日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

[Google]BERT压缩到7MB！最新基于最优子词和共享投影的极限语言压缩模型

[Google]BERT压缩到7MB！最新基于最优子词和共享投影的极限语言压缩模型

专知

31+阅读 · 2019年10月6日

从 ICLR 2019 一览小样本学习最新进展！

从 ICLR 2019 一览小样本学习最新进展！

AI科技评论

15+阅读 · 2019年6月9日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

独家 | 机器学习解释模型：黑盒VS白盒（附资料链接）

独家 | 机器学习解释模型：黑盒VS白盒（附资料链接）

数据派THU

16+阅读 · 2019年4月11日

大数据时代小样本如何学习？看这篇最新《小样本学习方法综述》论文

大数据时代小样本如何学习？看这篇最新《小样本学习方法综述》论文

专知

127+阅读 · 2019年3月31日

小样本如何进行深度学习？西北工夏勇教授这一份54页《医学影像小数据深度学习》PPT为你讲解

小样本如何进行深度学习？西北工夏勇教授这一份54页《医学影像小数据深度学习》PPT为你讲解

GAN生成式对抗网络

23+阅读 · 2018年12月2日

【干货|如何打开黑盒子模型？】41页最新机器学习可解释模型综述论文，143篇参考文献，2300次下载

【干货|如何打开黑盒子模型？】41页最新机器学习可解释模型综述论文，143篇参考文献，2300次下载

专知

25+阅读 · 2018年11月25日

删失数据超高维共线性模型的变量选择

国家自然科学基金

0+阅读 · 2017年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

基于个体分析的投影式非线性非负张量分解在高维非结构化数据模式分析中的研究

国家自然科学基金

0+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

极限学习机拓展研究及其在近红外光谱分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

非线性混合效应模型的最优与稳健设计

国家自然科学基金

0+阅读 · 2014年12月31日

PolarGrad: A Class of Matrix-Gradient Optimizers from a Unifying Preconditioning Perspective

Arxiv

0+阅读 · 2月5日

LLM-Inspired Pretrain-Then-Finetune for Small-Data, Large-Scale Optimization

Arxiv

0+阅读 · 2月3日

Small Generalizable Prompt Predictive Models Can Steer Efficient RL Post-Training of Large Reasoning Models

Arxiv

0+阅读 · 2月2日

Smoothing the Black-Box: Signed-Distance Supervision for Black-Box Model Copying

Arxiv

0+阅读 · 1月28日

NIMO: a Nonlinear Interpretable MOdel

Arxiv

0+阅读 · 1月27日

Crafting Adversarial Inputs for Large Vision-Language Models Using Black-Box Optimization

Arxiv

0+阅读 · 1月22日

Diffusion Large Language Models for Black-Box Optimization

Arxiv

0+阅读 · 1月20日

Revitalizing Black-Box Interpretability: Actionable Interpretability for LLMs via Proxy Models

Arxiv

0+阅读 · 1月20日

Crafting Adversarial Inputs for Large Vision-Language Models Using Black-Box Optimization

Arxiv

0+阅读 · 1月8日

Model non-collapse: Minimax bounds for recursive discrete distribution estimation

Arxiv

0+阅读 · 1月5日

VIP会员

文章信息

相关主题

预训练模型

相关VIP内容

跨越黑盒：大语言模型的理论与机制

跨越黑盒：大语言模型的理论与机制

专知会员服务

37+阅读 · 1月7日

大规模语言模型的个性化：综述

大规模语言模型的个性化：综述

专知会员服务

43+阅读 · 2024年11月4日

大型模型中的参数高效微调：方法论综述

大型模型中的参数高效微调：方法论综述

专知会员服务

69+阅读 · 2024年11月3日

【牛津大学博士论文】深度概率模型的最优传输仿真方法，172页pdf

【牛津大学博士论文】深度概率模型的最优传输仿真方法，172页pdf

专知会员服务

38+阅读 · 2024年6月22日

大模型如何做个性化？中科大等最新《当大型语言模型遇到个性化》综述，详述大模型与个性化的挑战与机遇

大模型如何做个性化？中科大等最新《当大型语言模型遇到个性化》综述，详述大模型与个性化的挑战与机遇

专知会员服务

84+阅读 · 2023年8月8日

黑盒模型如何透明化？MIT博士论文《黑盒模型的可解释性和透明性技术》，207页pdf阐述可信赖机器学习路径

黑盒模型如何透明化？MIT博士论文《黑盒模型的可解释性和透明性技术》，207页pdf阐述可信赖机器学习路径

专知会员服务

63+阅读 · 2023年4月29日

清华49页长文全方位分析参数高效微调方案Delta Tuning，揭秘大模型背后的机理

清华49页长文全方位分析参数高效微调方案Delta Tuning，揭秘大模型背后的机理

专知会员服务

50+阅读 · 2022年4月8日

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

专知会员服务

26+阅读 · 2022年3月15日

【ICML2020-DeepMind】小数据，大决策:小数据模式下的模型选择

专知会员服务

37+阅读 · 2020年9月14日

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】基于自适应表征的高效视觉建模

《多域作战中融合网络、电子战与动能机动》

AI智能体时代大模型安全风险与攻防新挑战

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

相关资讯

【2022 新版书籍】第2版《可解释的机器学习：黑盒模型可解释性理解指南》，330页pdf

【2022 新版书籍】第2版《可解释的机器学习：黑盒模型可解释性理解指南》，330页pdf

专知

13+阅读 · 2022年11月9日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

[Google]BERT压缩到7MB！最新基于最优子词和共享投影的极限语言压缩模型

[Google]BERT压缩到7MB！最新基于最优子词和共享投影的极限语言压缩模型

专知

31+阅读 · 2019年10月6日

从 ICLR 2019 一览小样本学习最新进展！

从 ICLR 2019 一览小样本学习最新进展！

AI科技评论

15+阅读 · 2019年6月9日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

独家 | 机器学习解释模型：黑盒VS白盒（附资料链接）

独家 | 机器学习解释模型：黑盒VS白盒（附资料链接）

数据派THU

16+阅读 · 2019年4月11日

大数据时代小样本如何学习？看这篇最新《小样本学习方法综述》论文

大数据时代小样本如何学习？看这篇最新《小样本学习方法综述》论文

专知

127+阅读 · 2019年3月31日

小样本如何进行深度学习？西北工夏勇教授这一份54页《医学影像小数据深度学习》PPT为你讲解

小样本如何进行深度学习？西北工夏勇教授这一份54页《医学影像小数据深度学习》PPT为你讲解

GAN生成式对抗网络

23+阅读 · 2018年12月2日

【干货|如何打开黑盒子模型？】41页最新机器学习可解释模型综述论文，143篇参考文献，2300次下载

【干货|如何打开黑盒子模型？】41页最新机器学习可解释模型综述论文，143篇参考文献，2300次下载

专知

25+阅读 · 2018年11月25日

相关论文

PolarGrad: A Class of Matrix-Gradient Optimizers from a Unifying Preconditioning Perspective

Arxiv

0+阅读 · 2月5日

LLM-Inspired Pretrain-Then-Finetune for Small-Data, Large-Scale Optimization

Arxiv

0+阅读 · 2月3日

Small Generalizable Prompt Predictive Models Can Steer Efficient RL Post-Training of Large Reasoning Models

Arxiv

0+阅读 · 2月2日

Smoothing the Black-Box: Signed-Distance Supervision for Black-Box Model Copying

Arxiv

0+阅读 · 1月28日

NIMO: a Nonlinear Interpretable MOdel

Arxiv

0+阅读 · 1月27日

Crafting Adversarial Inputs for Large Vision-Language Models Using Black-Box Optimization

Arxiv

0+阅读 · 1月22日

Diffusion Large Language Models for Black-Box Optimization

Arxiv

0+阅读 · 1月20日

Revitalizing Black-Box Interpretability: Actionable Interpretability for LLMs via Proxy Models

Arxiv

0+阅读 · 1月20日

Crafting Adversarial Inputs for Large Vision-Language Models Using Black-Box Optimization

Arxiv

0+阅读 · 1月8日

Model non-collapse: Minimax bounds for recursive discrete distribution estimation

Arxiv

0+阅读 · 1月5日

相关基金

删失数据超高维共线性模型的变量选择

国家自然科学基金

0+阅读 · 2017年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

基于个体分析的投影式非线性非负张量分解在高维非结构化数据模式分析中的研究

国家自然科学基金

0+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

极限学习机拓展研究及其在近红外光谱分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

非线性混合效应模型的最优与稳健设计

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员