Simple-Sampling and Hard-Mixup with Prototypes to Rebalance Contrastive Learning for Text Classification - 专知论文

会员服务 ·

0

监督 · 监督对比学习 · 类别 · 对比学习 · 文本分类 ·

Simple-Sampling and Hard-Mixup with Prototypes to Rebalance Contrastive Learning for Text Classification

翻译：简单采样与原型硬混合：用于文本分类对比学习的再平衡方法

Mengyu Li,Yonghao Liu,Fausto Giunchiglia,Ximing Li,Xiaoyue Feng,Renchu Guan

from arxiv, WWW26

Text classification is a crucial and fundamental task in web content mining. Compared with the previous learning paradigm of pre-training and fine-tuning by cross entropy loss, the recently proposed supervised contrastive learning approach has received tremendous attention due to its powerful feature learning capability and robustness. Although several studies have incorporated this technique for text classification, some limitations remain. First, many text datasets are imbalanced, and the learning mechanism of supervised contrastive learning is sensitive to data imbalance, which may harm the model's performance. Moreover, these models leverage separate classification branches with cross entropy and supervised contrastive learning branches without explicit mutual guidance. To this end, we propose a novel model named SharpReCL for imbalanced text classification tasks. First, we obtain the prototype vector of each class in the balanced classification branch to act as a representation of each class. Then, by further explicitly leveraging the prototype vectors, we construct a proper and sufficient target sample set with the same size for each class to perform the supervised contrastive learning procedure. The empirical results show the effectiveness of our model, which even outperforms popular large language models across several datasets. Our code is available here.

翻译：文本分类是网络内容挖掘中一项关键且基础的任务。与先前通过交叉熵损失进行预训练和微调的学习范式相比，最近提出的监督对比学习方法因其强大的特征学习能力和鲁棒性而受到极大关注。尽管已有若干研究将该技术应用于文本分类，但仍存在一些局限性。首先，许多文本数据集存在类别不平衡问题，而监督对比学习的学习机制对数据不平衡较为敏感，这可能损害模型性能。此外，现有模型通常采用独立的分类分支（交叉熵损失）与监督对比学习分支，缺乏明确的相互指导机制。为此，我们提出了一种名为SharpReCL的新型模型，专门用于不平衡文本分类任务。首先，我们在平衡分类分支中获取每个类别的原型向量，作为各类别的表征。随后，通过进一步显式利用这些原型向量，我们为每个类别构建一个规模适当且充分的目标样本集，以执行监督对比学习过程。实证结果表明，我们的模型具有显著有效性，在多个数据集上甚至超越了流行的大型语言模型。我们的代码已公开。

0

相关内容

【博士论文】针对基于文本的基础模型的分类偏差分析与缓解

【博士论文】针对基于文本的基础模型的分类偏差分析与缓解

专知会员服务

15+阅读 · 2025年3月10日

文本分类算法及其应用场景研究

文本分类算法及其应用场景研究

专知会员服务

19+阅读 · 2024年7月31日

文本分类算法及其应用场景研究综述

文本分类算法及其应用场景研究综述

专知会员服务

30+阅读 · 2024年6月18日

基于深度学习的中文文本分类综述

基于深度学习的中文文本分类综述

专知会员服务

25+阅读 · 2024年5月9日

基于深度学习的文本分类技术研究进展

专知会员服务

58+阅读 · 2020年12月6日

【Google】监督对比学习，Supervised Contrastive Learning

【Google】监督对比学习，Supervised Contrastive Learning

专知会员服务

75+阅读 · 2020年4月24日

【单样本(One-shot)学习】《One-shot learning》by Pragati Baheti Part 1/2: Definitions and fundamental techniques

【单样本(One-shot)学习】《One-shot learning》by Pragati Baheti Part 1/2: Definitions and fundamental techniques

专知会员服务

30+阅读 · 2020年4月22日

【Snapchat-谷歌-微软】最新《深度学习文本分类》2020综述论文大全，150+DL分类模型，42页pdf215篇参考文献

【Snapchat-谷歌-微软】最新《深度学习文本分类》2020综述论文大全，150+DL分类模型，42页pdf215篇参考文献

专知会员服务

84+阅读 · 2020年4月9日

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

专知会员服务

185+阅读 · 2020年2月22日

【元学习 | 论文】元学习聚类，Meta-Learning to Cluster，哥伦比亚大学

【元学习 | 论文】元学习聚类，Meta-Learning to Cluster，哥伦比亚大学

专知会员服务

42+阅读 · 2019年11月21日

《文本分类大综述：从浅层到深度学习》最新2020版35页pdf

《文本分类大综述：从浅层到深度学习》最新2020版35页pdf

专知

59+阅读 · 2020年8月6日

一文综述经典的深度文本分类方法

一文综述经典的深度文本分类方法

AI100

12+阅读 · 2019年6月8日

五年12篇顶会论文综述！一文读懂深度学习文本分类方法

五年12篇顶会论文综述！一文读懂深度学习文本分类方法

AI100

10+阅读 · 2019年6月5日

【GitHub项目推荐】文本分类最好的几个深度学习方法 TensorFlow 实践

【GitHub项目推荐】文本分类最好的几个深度学习方法 TensorFlow 实践

专知

39+阅读 · 2018年11月27日

ML通用指南：文本分类详细教程（上）

ML通用指南：文本分类详细教程（上）

论智

19+阅读 · 2018年7月29日

基于深度学习的文本分类6大算法-原理、结构、论文、源码打包分享

基于深度学习的文本分类6大算法-原理、结构、论文、源码打包分享

深度学习与NLP

25+阅读 · 2018年7月18日

深度学习在文本分类中的应用

深度学习在文本分类中的应用

AI研习社

13+阅读 · 2018年1月7日

Tensorflow 文本分类-Python深度学习

Tensorflow 文本分类-Python深度学习

Python程序员

12+阅读 · 2017年11月22日

文本聚类：从非结构化数据快速获取见解

文本聚类：从非结构化数据快速获取见解

Datartisan数据工匠

15+阅读 · 2017年10月12日

fastText、TextCNN、TextRNN…这套NLP文本分类深度学习方法库供你选择

fastText、TextCNN、TextRNN…这套NLP文本分类深度学习方法库供你选择

数据派THU

29+阅读 · 2017年8月2日

基于分类能力结构度量与类相关性关系保留的特征选取方法研究

国家自然科学基金

1+阅读 · 2017年12月31日

基于多源语义表示学习的社交媒体文本属性情感分类研究

国家自然科学基金

4+阅读 · 2017年12月31日

图文混合跨媒体知识单元的模糊分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

多标记文本数据流分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于概率语义分析的多关系图多类标分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于记忆的不变图像特征学习方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

基于字典学习的小样本高光谱遥感图像稀疏表示分类精度研究与应用

国家自然科学基金

3+阅读 · 2014年12月31日

Equilibrium contrastive learning for imbalanced image classification

Arxiv

0+阅读 · 2月18日

ART: Adaptive Resampling-based Training for Imbalanced Classification

Arxiv

0+阅读 · 2月15日

Noisy-Pair Robust Representation Alignment for Positive-Unlabeled Learning

Arxiv

0+阅读 · 2月10日

Equilibrium contrastive learning for imbalanced image classification

Arxiv

0+阅读 · 2月10日

Synthetic Oversampling: Theory and A Practical Approach Using LLMs to Address Data Imbalance

Arxiv

0+阅读 · 2月8日

A Contrastive Learning Foundation Model Based on Perfectly Aligned Sample Pairs for Remote Sensing Images

Arxiv

0+阅读 · 2月5日

Breaking the Adversarial Robustness-Performance Trade-off in Text Classification via Manifold Purification

Arxiv

0+阅读 · 1月30日

GORAG: Graph-based Online Retrieval Augmented Generation for Dynamic Few-shot Social Media Text Classification

Arxiv

0+阅读 · 1月29日

UniHash: Unifying Pointwise and Pairwise Hashing Paradigms for Seen and Unseen Category Retrieval

Arxiv

0+阅读 · 1月20日

Prototypical Contrastive Learning-based CLIP Fine-tuning for Object Re-identification

Arxiv

0+阅读 · 1月14日

VIP会员

文章信息

相关主题

监督对比学习

最新内容

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

6+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

5+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

7+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

7+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

7+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

9+阅读 · 6月25日

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

8+阅读 · 6月25日

《国防领域敏感性分析白皮书》

《国防领域敏感性分析白皮书》

专知会员服务

8+阅读 · 6月25日

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

9+阅读 · 6月24日

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

10+阅读 · 6月24日

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

11+阅读 · 6月24日

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

10+阅读 · 6月24日

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

7+阅读 · 6月24日

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

10+阅读 · 6月24日

相关VIP内容

【博士论文】针对基于文本的基础模型的分类偏差分析与缓解

【博士论文】针对基于文本的基础模型的分类偏差分析与缓解

专知会员服务

15+阅读 · 2025年3月10日

文本分类算法及其应用场景研究

文本分类算法及其应用场景研究

专知会员服务

19+阅读 · 2024年7月31日

文本分类算法及其应用场景研究综述

文本分类算法及其应用场景研究综述

专知会员服务

30+阅读 · 2024年6月18日

基于深度学习的中文文本分类综述

基于深度学习的中文文本分类综述

专知会员服务

25+阅读 · 2024年5月9日

基于深度学习的文本分类技术研究进展

专知会员服务

58+阅读 · 2020年12月6日

【Google】监督对比学习，Supervised Contrastive Learning

【Google】监督对比学习，Supervised Contrastive Learning

专知会员服务

75+阅读 · 2020年4月24日

【单样本(One-shot)学习】《One-shot learning》by Pragati Baheti Part 1/2: Definitions and fundamental techniques

【单样本(One-shot)学习】《One-shot learning》by Pragati Baheti Part 1/2: Definitions and fundamental techniques

专知会员服务

30+阅读 · 2020年4月22日

【Snapchat-谷歌-微软】最新《深度学习文本分类》2020综述论文大全，150+DL分类模型，42页pdf215篇参考文献

【Snapchat-谷歌-微软】最新《深度学习文本分类》2020综述论文大全，150+DL分类模型，42页pdf215篇参考文献

专知会员服务

84+阅读 · 2020年4月9日

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

专知会员服务

185+阅读 · 2020年2月22日

【元学习 | 论文】元学习聚类，Meta-Learning to Cluster，哥伦比亚大学

【元学习 | 论文】元学习聚类，Meta-Learning to Cluster，哥伦比亚大学

专知会员服务

42+阅读 · 2019年11月21日

热门VIP内容

开通专知VIP会员享更多权益服务

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

网状网络及其在军事领域的运用

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

相关资讯

《文本分类大综述：从浅层到深度学习》最新2020版35页pdf

《文本分类大综述：从浅层到深度学习》最新2020版35页pdf

专知

59+阅读 · 2020年8月6日

一文综述经典的深度文本分类方法

一文综述经典的深度文本分类方法

AI100

12+阅读 · 2019年6月8日

五年12篇顶会论文综述！一文读懂深度学习文本分类方法

五年12篇顶会论文综述！一文读懂深度学习文本分类方法

AI100

10+阅读 · 2019年6月5日

【GitHub项目推荐】文本分类最好的几个深度学习方法 TensorFlow 实践

【GitHub项目推荐】文本分类最好的几个深度学习方法 TensorFlow 实践

专知

39+阅读 · 2018年11月27日

ML通用指南：文本分类详细教程（上）

ML通用指南：文本分类详细教程（上）

论智

19+阅读 · 2018年7月29日

基于深度学习的文本分类6大算法-原理、结构、论文、源码打包分享

基于深度学习的文本分类6大算法-原理、结构、论文、源码打包分享

深度学习与NLP

25+阅读 · 2018年7月18日

深度学习在文本分类中的应用

深度学习在文本分类中的应用

AI研习社

13+阅读 · 2018年1月7日

Tensorflow 文本分类-Python深度学习

Tensorflow 文本分类-Python深度学习

Python程序员

12+阅读 · 2017年11月22日

文本聚类：从非结构化数据快速获取见解

文本聚类：从非结构化数据快速获取见解

Datartisan数据工匠

15+阅读 · 2017年10月12日

fastText、TextCNN、TextRNN…这套NLP文本分类深度学习方法库供你选择

fastText、TextCNN、TextRNN…这套NLP文本分类深度学习方法库供你选择

数据派THU

29+阅读 · 2017年8月2日

相关论文

Equilibrium contrastive learning for imbalanced image classification

Arxiv

0+阅读 · 2月18日

ART: Adaptive Resampling-based Training for Imbalanced Classification

Arxiv

0+阅读 · 2月15日

Noisy-Pair Robust Representation Alignment for Positive-Unlabeled Learning

Arxiv

0+阅读 · 2月10日

Equilibrium contrastive learning for imbalanced image classification

Arxiv

0+阅读 · 2月10日

Synthetic Oversampling: Theory and A Practical Approach Using LLMs to Address Data Imbalance

Arxiv

0+阅读 · 2月8日

A Contrastive Learning Foundation Model Based on Perfectly Aligned Sample Pairs for Remote Sensing Images

Arxiv

0+阅读 · 2月5日

Breaking the Adversarial Robustness-Performance Trade-off in Text Classification via Manifold Purification

Arxiv

0+阅读 · 1月30日

GORAG: Graph-based Online Retrieval Augmented Generation for Dynamic Few-shot Social Media Text Classification

Arxiv

0+阅读 · 1月29日

UniHash: Unifying Pointwise and Pairwise Hashing Paradigms for Seen and Unseen Category Retrieval

Arxiv

0+阅读 · 1月20日

Prototypical Contrastive Learning-based CLIP Fine-tuning for Object Re-identification

Arxiv

0+阅读 · 1月14日

相关基金

基于分类能力结构度量与类相关性关系保留的特征选取方法研究

国家自然科学基金

1+阅读 · 2017年12月31日

基于多源语义表示学习的社交媒体文本属性情感分类研究

国家自然科学基金

4+阅读 · 2017年12月31日

图文混合跨媒体知识单元的模糊分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

多标记文本数据流分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于概率语义分析的多关系图多类标分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于记忆的不变图像特征学习方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

基于字典学习的小样本高光谱遥感图像稀疏表示分类精度研究与应用

国家自然科学基金

3+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员