广义对数调整：通过消除基础模型中的标签偏差来校准微调模型 (Generalized Logit Adjustment: Calibrating Fine-tuned Models by Removing Label Bias in Foundation Models) - 专知论文

会员服务 ·

0

偏差 · 微调 · 广义 · 样本 · 大模型 ·

Generalized Logit Adjustment: Calibrating Fine-tuned Models by Removing Label Bias in Foundation Models

翻译：广义对数调整：通过消除基础模型中的标签偏差来校准微调模型

Beier Zhu,Kaihua Tang,Qianru Sun,Hanwang Zhang

from arxiv, Accepted by NeurIPS2023

Foundation models like CLIP allow zero-shot transfer on various tasks without additional training data. Yet, the zero-shot performance is less competitive than a fully supervised one. Thus, to enhance the performance, fine-tuning and ensembling are also commonly adopted to better fit the downstream tasks. However, we argue that such prior work has overlooked the inherent biases in foundation models. Due to the highly imbalanced Web-scale training set, these foundation models are inevitably skewed toward frequent semantics, and thus the subsequent fine-tuning or ensembling is still biased. In this study, we systematically examine the biases in foundation models and demonstrate the efficacy of our proposed Generalized Logit Adjustment (GLA) method. Note that bias estimation in foundation models is challenging, as most pre-train data cannot be explicitly accessed like in traditional long-tailed classification tasks. To this end, GLA has an optimization-based bias estimation approach for debiasing foundation models. As our work resolves a fundamental flaw in the pre-training, the proposed GLA demonstrates significant improvements across a diverse range of tasks: it achieves 1.5 pp accuracy gains on ImageNet, an large average improvement (1.4-4.6 pp) on 11 few-shot datasets, 2.4 pp gains on long-tailed classification. Codes are in https://github.com/BeierZhu/GLA.

翻译：像CLIP这样的基础模型允许在各种任务上进行零样本迁移，而无需额外的训练数据。然而，零样本性能仍不如完全监督的方法具有竞争力。因此，为了提升性能，微调和集成学习也常被采用，以更好地适应下游任务。然而，我们认为此类先前工作忽视了基础模型中固有的偏差。由于网络规模训练集的高度不平衡，这些基础模型不可避免地偏向于频繁出现的语义，因此后续的微调或集成学习仍然存在偏差。在本研究中，我们系统地检验了基础模型中的偏差，并证明了我们提出的广义对数调整（GLA）方法的有效性。需要注意的是，基础模型中的偏差估计具有挑战性，因为大多数预训练数据无法像传统长尾分类任务那样被显式访问。为此，GLA采用了一种基于优化的偏差估计方法来消除基础模型的偏差。由于我们的工作解决了预训练中的一个根本缺陷，所提出的GLA在多种任务上均展现出显著改进：在ImageNet上实现了1.5个百分点的准确率提升，在11个少样本数据集上平均提升显著（1.4-4.6个百分点），在长尾分类任务上获得2.4个百分点的增益。代码位于https://github.com/BeierZhu/GLA。

0

相关内容

【ICML2025】Proxy-FDA：基于代理的特征分布对齐方法，用于无遗忘地微调视觉基础模型

【ICML2025】Proxy-FDA：基于代理的特征分布对齐方法，用于无遗忘地微调视觉基础模型

专知会员服务

9+阅读 · 2025年6月3日

联邦学习中基础模型参数高效微调综述

联邦学习中基础模型参数高效微调综述

专知会员服务

16+阅读 · 2025年5月5日

【CVPR2025】用于视觉-语言基础模型模态对齐的后预训练方法

【CVPR2025】用于视觉-语言基础模型模态对齐的后预训练方法

专知会员服务

15+阅读 · 2025年4月18日

【NeurIPS2024】通过方差减少实现零样本模型的稳健微调

【NeurIPS2024】通过方差减少实现零样本模型的稳健微调

专知会员服务

19+阅读 · 2024年11月12日

[ICML2024]消除偏差：微调基础模型以进行半监督学习

[ICML2024]消除偏差：微调基础模型以进行半监督学习

专知会员服务

18+阅读 · 2024年5月23日

【CVPR2024】AMU-Tuning：基于CLIP的少样本学习中的有效对数偏差

【CVPR2024】AMU-Tuning：基于CLIP的少样本学习中的有效对数偏差

专知会员服务

21+阅读 · 2024年4月28日

预训练视觉模型的参数高效微调

预训练视觉模型的参数高效微调

专知会员服务

32+阅读 · 2024年3月19日

【NeurIPS2023】对齐提示:测试时提示与分布对齐以实现零样本泛化

【NeurIPS2023】对齐提示:测试时提示与分布对齐以实现零样本泛化

专知会员服务

24+阅读 · 2023年11月3日

【ICML2023】调整语言模型作为增强少样本学习的训练数据生成器

【ICML2023】调整语言模型作为增强少样本学习的训练数据生成器

专知会员服务

32+阅读 · 2023年5月19日

【浙江大学ICLR2022】可微分提示—一种更加高效的预训练少样本微调方法

【浙江大学ICLR2022】可微分提示—一种更加高效的预训练少样本微调方法

专知会员服务

32+阅读 · 2022年2月18日

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

零样本文本分类，Zero-Shot Learning for Text Classification

零样本文本分类，Zero-Shot Learning for Text Classification

专知

16+阅读 · 2020年5月31日

【Google AI-Luong】无标记数据学习, 83ppt, 一致性学习与自监督学习是什么？

【Google AI-Luong】无标记数据学习, 83ppt, 一致性学习与自监督学习是什么？

专知

12+阅读 · 2020年3月5日

以BERT为例,如何优化机器学习模型性能?

以BERT为例,如何优化机器学习模型性能?

专知

10+阅读 · 2019年10月3日

【干货】BERT模型的标准调优和花式调优

【干货】BERT模型的标准调优和花式调优

新智元

11+阅读 · 2019年4月26日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

放弃手工标记数据，斯坦福大学开发弱监督编程范式Snorkel

放弃手工标记数据，斯坦福大学开发弱监督编程范式Snorkel

新智元

14+阅读 · 2019年3月15日

机器学习中如何处理不平衡数据？

机器学习中如何处理不平衡数据？

机器之心

13+阅读 · 2019年2月17日

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

开放知识图谱

22+阅读 · 2018年9月26日

入门 | 深度学习模型的简单优化技巧

入门 | 深度学习模型的简单优化技巧

机器之心

10+阅读 · 2018年6月10日

近似计算中基于概率图模型的软错误量化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

31+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

非局部总变差正则化图像恢复模型的快速子空间校正算法

国家自然科学基金

0+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

测量误差数据下约束线性模型的有偏估计及变量选择研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向众核计算的数值方法协同设计--一种高效且高精度广义有限元方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

广义线性模型的组变量选择及其在信用评分中的应用

国家自然科学基金

2+阅读 · 2014年12月31日

Explicit Uncertainty Modeling for Active CLIP Adaptation with Dual Prompt Tuning

Arxiv

0+阅读 · 2月4日

Fine-tuning Pre-trained Vision-Language Models in a Human-Annotation-Free Manner

Arxiv

0+阅读 · 2月4日

AnomalyVFM -- Transforming Vision Foundation Models into Zero-Shot Anomaly Detectors

Arxiv

0+阅读 · 1月28日

MERGETUNE: Continued fine-tuning of vision-language models

Arxiv

0+阅读 · 1月16日

mergetune: Continued fine-tuning of vision-language models

Arxiv

0+阅读 · 1月15日

Exploring Fine-Tuning for Tabular Foundation Models

Arxiv

0+阅读 · 1月14日

Prototypical Contrastive Learning-based CLIP Fine-tuning for Object Re-identification

Arxiv

0+阅读 · 1月14日

Fine-tuning Done Right in Model Editing

Arxiv

0+阅读 · 1月9日

BiPrompt: Bilateral Prompt Optimization for Visual and Textual Debiasing in Vision-Language Models

Arxiv

0+阅读 · 1月5日

Efficiently Estimating Data Efficiency for Language Model Fine-tuning

Arxiv

0+阅读 · 2025年12月31日

VIP会员

文章信息

相关主题

相关VIP内容

【ICML2025】Proxy-FDA：基于代理的特征分布对齐方法，用于无遗忘地微调视觉基础模型

【ICML2025】Proxy-FDA：基于代理的特征分布对齐方法，用于无遗忘地微调视觉基础模型

专知会员服务

9+阅读 · 2025年6月3日

联邦学习中基础模型参数高效微调综述

联邦学习中基础模型参数高效微调综述

专知会员服务

16+阅读 · 2025年5月5日

【CVPR2025】用于视觉-语言基础模型模态对齐的后预训练方法

【CVPR2025】用于视觉-语言基础模型模态对齐的后预训练方法

专知会员服务

15+阅读 · 2025年4月18日

【NeurIPS2024】通过方差减少实现零样本模型的稳健微调

【NeurIPS2024】通过方差减少实现零样本模型的稳健微调

专知会员服务

19+阅读 · 2024年11月12日

[ICML2024]消除偏差：微调基础模型以进行半监督学习

[ICML2024]消除偏差：微调基础模型以进行半监督学习

专知会员服务

18+阅读 · 2024年5月23日

【CVPR2024】AMU-Tuning：基于CLIP的少样本学习中的有效对数偏差

【CVPR2024】AMU-Tuning：基于CLIP的少样本学习中的有效对数偏差

专知会员服务

21+阅读 · 2024年4月28日

预训练视觉模型的参数高效微调

预训练视觉模型的参数高效微调

专知会员服务

32+阅读 · 2024年3月19日

【NeurIPS2023】对齐提示:测试时提示与分布对齐以实现零样本泛化

【NeurIPS2023】对齐提示:测试时提示与分布对齐以实现零样本泛化

专知会员服务

24+阅读 · 2023年11月3日

【ICML2023】调整语言模型作为增强少样本学习的训练数据生成器

【ICML2023】调整语言模型作为增强少样本学习的训练数据生成器

专知会员服务

32+阅读 · 2023年5月19日

【浙江大学ICLR2022】可微分提示—一种更加高效的预训练少样本微调方法

【浙江大学ICLR2022】可微分提示—一种更加高效的预训练少样本微调方法

专知会员服务

32+阅读 · 2022年2月18日

热门VIP内容

开通专知VIP会员享更多权益服务

论学习、公平性与复杂度

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

2025中国人工智能学会系列白皮书⸺棋盘上的人工智能|附下载

通用智能体评估的逻辑架构

相关资讯

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

零样本文本分类，Zero-Shot Learning for Text Classification

零样本文本分类，Zero-Shot Learning for Text Classification

专知

16+阅读 · 2020年5月31日

【Google AI-Luong】无标记数据学习, 83ppt, 一致性学习与自监督学习是什么？

【Google AI-Luong】无标记数据学习, 83ppt, 一致性学习与自监督学习是什么？

专知

12+阅读 · 2020年3月5日

以BERT为例,如何优化机器学习模型性能?

以BERT为例,如何优化机器学习模型性能?

专知

10+阅读 · 2019年10月3日

【干货】BERT模型的标准调优和花式调优

【干货】BERT模型的标准调优和花式调优

新智元

11+阅读 · 2019年4月26日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

放弃手工标记数据，斯坦福大学开发弱监督编程范式Snorkel

放弃手工标记数据，斯坦福大学开发弱监督编程范式Snorkel

新智元

14+阅读 · 2019年3月15日

机器学习中如何处理不平衡数据？

机器学习中如何处理不平衡数据？

机器之心

13+阅读 · 2019年2月17日

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

开放知识图谱

22+阅读 · 2018年9月26日

入门 | 深度学习模型的简单优化技巧

入门 | 深度学习模型的简单优化技巧

机器之心

10+阅读 · 2018年6月10日

相关论文

Explicit Uncertainty Modeling for Active CLIP Adaptation with Dual Prompt Tuning

Arxiv

0+阅读 · 2月4日

Fine-tuning Pre-trained Vision-Language Models in a Human-Annotation-Free Manner

Arxiv

0+阅读 · 2月4日

AnomalyVFM -- Transforming Vision Foundation Models into Zero-Shot Anomaly Detectors

Arxiv

0+阅读 · 1月28日

MERGETUNE: Continued fine-tuning of vision-language models

Arxiv

0+阅读 · 1月16日

mergetune: Continued fine-tuning of vision-language models

Arxiv

0+阅读 · 1月15日

Exploring Fine-Tuning for Tabular Foundation Models

Arxiv

0+阅读 · 1月14日

Prototypical Contrastive Learning-based CLIP Fine-tuning for Object Re-identification

Arxiv

0+阅读 · 1月14日

Fine-tuning Done Right in Model Editing

Arxiv

0+阅读 · 1月9日

BiPrompt: Bilateral Prompt Optimization for Visual and Textual Debiasing in Vision-Language Models

Arxiv

0+阅读 · 1月5日

Efficiently Estimating Data Efficiency for Language Model Fine-tuning

Arxiv

0+阅读 · 2025年12月31日

相关基金

近似计算中基于概率图模型的软错误量化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

31+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

非局部总变差正则化图像恢复模型的快速子空间校正算法

国家自然科学基金

0+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

测量误差数据下约束线性模型的有偏估计及变量选择研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向众核计算的数值方法协同设计--一种高效且高精度广义有限元方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

广义线性模型的组变量选择及其在信用评分中的应用

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员