Meta-augmented Prompt Tuning for Better Few-shot Learning - 专知论文

会员服务 ·

0

样本 · 提示学习 · 初始化 · 少样本学习 · 拟合 ·

2023 年 3 月 28 日

Meta-augmented Prompt Tuning for Better Few-shot Learning

翻译：元增强提示调优用于提升少样本学习性能

Kaihang Pan,Juncheng Li,Hongye Song,Jun Lin,Xiaozhong Liu,Siliang Tang

Prompt tuning is a parameter-efficient method, which freezes all PLM parameters and only prepends some additional tunable tokens called soft prompts to the input text. However, soft prompts heavily rely on a better initialization and may easily result in overfitting under few-shot settings, which causes prompt-tuning performing much worse than fine-tuning. To address the above issues, this paper proposes a novel Self-sUpervised Meta-prompt learning framework with MEtagradient Regularization for few shot generalization (SUMMER). We leverage self-supervised meta-learning to better initialize soft prompts and curriculum-based task augmentation is further proposed to enrich the meta-task distribution. Besides, a novel meta-gradient regularization method is integrated into the meta-prompt learning framework, which meta-learns to transform the raw gradient during few-shot learning into a domain-generalizable direction, thus alleviating the problem of overfitting. Extensive experiments show that SUMMER achieves better performance for different few-shot downstream tasks, and also exhibits a stronger domain generalization ability.

翻译：提示调优是一种参数高效方法，它冻结所有预训练语言模型参数，仅在输入文本前添加少量可调优的令牌（称为软提示）。然而，软提示严重依赖于更优的初始化，且在少样本设置下容易过拟合，导致提示调优性能远低于微调。针对上述问题，本文提出一种新颖的基于元梯度正则化的自监督元提示学习框架（SUMMER），用于少样本泛化。我们利用自监督元学习来更好地初始化软提示，并进一步提出基于课程的任务增强以丰富元任务分布。此外，一种新颖的元梯度正则化方法被集成到元提示学习框架中，该方法通过元学习将少样本学习过程中的原始梯度转换为领域可泛化的方向，从而缓解过拟合问题。大量实验表明，SUMMER在多种少样本下游任务中取得更优性能，同时展现出更强的领域泛化能力。

0

相关内容

【ICML2023】调整语言模型作为增强少样本学习的训练数据生成器

【ICML2023】调整语言模型作为增强少样本学习的训练数据生成器

专知会员服务

32+阅读 · 2023年5月19日

ChatAug: 利用ChatGPT进行文本数据增强

ChatAug: 利用ChatGPT进行文本数据增强

专知会员服务

81+阅读 · 2023年3月4日

【CVPR 2022】视觉提示调整（VPT），Vision Prompt Tuning

【CVPR 2022】视觉提示调整（VPT），Vision Prompt Tuning

专知会员服务

32+阅读 · 2022年3月12日

【CIKM2021】超链接预训练信息检索

专知会员服务

17+阅读 · 2021年8月24日

【WSDM 2021】面向信息检索的预训练语言模型

专知会员服务

36+阅读 · 2020年11月29日

【CIKM2020】研究和减轻图卷积网络中度相关的偏差

专知会员服务

19+阅读 · 2020年9月11日

近期必读的七篇 ECCV 2020【少样本学习（FSL）】相关论文

近期必读的七篇 ECCV 2020【少样本学习（FSL）】相关论文

专知会员服务

44+阅读 · 2020年9月1日

注意力图神经网络的小样本学习

注意力图神经网络的小样本学习

专知会员服务

192+阅读 · 2020年7月16日

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

专知会员服务

167+阅读 · 2020年3月18日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning

专知会员服务

159+阅读 · 2020年2月29日

举一反三：示例增强的（example augmented）自然语言处理

举一反三：示例增强的（example augmented）自然语言处理

RUC AI Box

1+阅读 · 2022年5月13日

强化学习三篇论文避免遗忘等

强化学习三篇论文避免遗忘等

CreateAMind

20+阅读 · 2019年5月24日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

44+阅读 · 2019年1月3日

【SIGIR2018】五篇对抗训练文章

【SIGIR2018】五篇对抗训练文章

专知

12+阅读 · 2018年7月9日

【论文推荐】最新八篇生成对抗网络相关论文—BRE、图像合成、多模态图像生成、非配对多域图、注意力、对抗特征增强、深度对抗性训练

【论文推荐】最新八篇生成对抗网络相关论文—BRE、图像合成、多模态图像生成、非配对多域图、注意力、对抗特征增强、深度对抗性训练

专知

16+阅读 · 2018年5月14日

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

专知

10+阅读 · 2018年2月1日

肝素酶1通过血管生成相关分子介导宫颈癌辐射抵抗的作用及机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于PPARγ节点双向调控探寻葛根芩连汤改善脂肪胰岛素抵抗的分子网络机制

国家自然科学基金

0+阅读 · 2014年12月31日

SPARC对脾脏边缘带B细胞功能的调节作用及机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

用于细胞内超氧自由基含量检测的新型稀土配位聚合物荧光探针的设计合成

国家自然科学基金

0+阅读 · 2014年12月31日

基于静息态和任务态的脑网络连接性fMRI研究运动想象训练促进皮层下脑卒中患者功能恢复的作用机制

国家自然科学基金

0+阅读 · 2013年12月31日

不同基因型（p53codon72）鼻咽癌细胞放射敏感性差异的机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

溶瘤新城疫病毒通过自噬效应杀伤耐药肺癌细胞的分子机制及应用

国家自然科学基金

0+阅读 · 2012年12月31日

穴位不同针刺方式促进脑卒中手功能恢复的神经影像学评价

国家自然科学基金

0+阅读 · 2011年12月31日

基于合成样本和MCE准则下判别学习的汉字手写文本识别研究

国家自然科学基金

0+阅读 · 2009年12月31日

汉族和维吾尔族遗传性乳腺癌BRCA基因检测及临床相关研究

国家自然科学基金

0+阅读 · 2009年12月31日

Efficient Prompting via Dynamic In-Context Learning

Arxiv

0+阅读 · 2023年5月18日

Learning to Generalize for Cross-domain QA

Arxiv

0+阅读 · 2023年5月18日

Data Augmentation for Diverse Voice Conversion in Noisy Environments

Arxiv

0+阅读 · 2023年5月18日

Rethinking Data Augmentation for Tabular Data in Deep Learning

Arxiv

0+阅读 · 2023年5月17日

Self-Prompting Large Language Models for Zero-Shot Open-Domain QA

Arxiv

0+阅读 · 2023年5月16日

Prompt Distribution Learning

Arxiv

14+阅读 · 2022年5月6日

Conditional Prompt Learning for Vision-Language Models

Conditional Prompt Learning for Vision-Language Models

Arxiv

13+阅读 · 2022年3月10日

MetAug: Contrastive Learning via Meta Feature Augmentation

Arxiv

10+阅读 · 2022年3月10日

Attribute-Guided Adversarial Training for Robustness to Natural Perturbations

Arxiv

15+阅读 · 2020年12月3日

Data Augmentation for Graph Neural Networks

Arxiv

38+阅读 · 2020年12月2日

VIP会员

文章信息

相关主题

少样本学习

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

3+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

4+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

5+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

4+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

4+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

4+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

21+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

【ICML2023】调整语言模型作为增强少样本学习的训练数据生成器

【ICML2023】调整语言模型作为增强少样本学习的训练数据生成器

专知会员服务

32+阅读 · 2023年5月19日

ChatAug: 利用ChatGPT进行文本数据增强

ChatAug: 利用ChatGPT进行文本数据增强

专知会员服务

81+阅读 · 2023年3月4日

【CVPR 2022】视觉提示调整（VPT），Vision Prompt Tuning

【CVPR 2022】视觉提示调整（VPT），Vision Prompt Tuning

专知会员服务

32+阅读 · 2022年3月12日

【CIKM2021】超链接预训练信息检索

专知会员服务

17+阅读 · 2021年8月24日

【WSDM 2021】面向信息检索的预训练语言模型

专知会员服务

36+阅读 · 2020年11月29日

【CIKM2020】研究和减轻图卷积网络中度相关的偏差

专知会员服务

19+阅读 · 2020年9月11日

近期必读的七篇 ECCV 2020【少样本学习（FSL）】相关论文

近期必读的七篇 ECCV 2020【少样本学习（FSL）】相关论文

专知会员服务

44+阅读 · 2020年9月1日

注意力图神经网络的小样本学习

注意力图神经网络的小样本学习

专知会员服务

192+阅读 · 2020年7月16日

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

专知会员服务

167+阅读 · 2020年3月18日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning

专知会员服务

159+阅读 · 2020年2月29日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

举一反三：示例增强的（example augmented）自然语言处理

举一反三：示例增强的（example augmented）自然语言处理

RUC AI Box

1+阅读 · 2022年5月13日

强化学习三篇论文避免遗忘等

强化学习三篇论文避免遗忘等

CreateAMind

20+阅读 · 2019年5月24日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

44+阅读 · 2019年1月3日

【SIGIR2018】五篇对抗训练文章

【SIGIR2018】五篇对抗训练文章

专知

12+阅读 · 2018年7月9日

【论文推荐】最新八篇生成对抗网络相关论文—BRE、图像合成、多模态图像生成、非配对多域图、注意力、对抗特征增强、深度对抗性训练

【论文推荐】最新八篇生成对抗网络相关论文—BRE、图像合成、多模态图像生成、非配对多域图、注意力、对抗特征增强、深度对抗性训练

专知

16+阅读 · 2018年5月14日

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

专知

10+阅读 · 2018年2月1日

相关论文

Efficient Prompting via Dynamic In-Context Learning

Arxiv

0+阅读 · 2023年5月18日

Learning to Generalize for Cross-domain QA

Arxiv

0+阅读 · 2023年5月18日

Data Augmentation for Diverse Voice Conversion in Noisy Environments

Arxiv

0+阅读 · 2023年5月18日

Rethinking Data Augmentation for Tabular Data in Deep Learning

Arxiv

0+阅读 · 2023年5月17日

Self-Prompting Large Language Models for Zero-Shot Open-Domain QA

Arxiv

0+阅读 · 2023年5月16日

Prompt Distribution Learning

Arxiv

14+阅读 · 2022年5月6日

Conditional Prompt Learning for Vision-Language Models

Conditional Prompt Learning for Vision-Language Models

Arxiv

13+阅读 · 2022年3月10日

MetAug: Contrastive Learning via Meta Feature Augmentation

Arxiv

10+阅读 · 2022年3月10日

Attribute-Guided Adversarial Training for Robustness to Natural Perturbations

Arxiv

15+阅读 · 2020年12月3日

Data Augmentation for Graph Neural Networks

Arxiv

38+阅读 · 2020年12月2日

相关基金

肝素酶1通过血管生成相关分子介导宫颈癌辐射抵抗的作用及机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于PPARγ节点双向调控探寻葛根芩连汤改善脂肪胰岛素抵抗的分子网络机制

国家自然科学基金

0+阅读 · 2014年12月31日

SPARC对脾脏边缘带B细胞功能的调节作用及机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

用于细胞内超氧自由基含量检测的新型稀土配位聚合物荧光探针的设计合成

国家自然科学基金

0+阅读 · 2014年12月31日

基于静息态和任务态的脑网络连接性fMRI研究运动想象训练促进皮层下脑卒中患者功能恢复的作用机制

国家自然科学基金

0+阅读 · 2013年12月31日

不同基因型（p53codon72）鼻咽癌细胞放射敏感性差异的机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

溶瘤新城疫病毒通过自噬效应杀伤耐药肺癌细胞的分子机制及应用

国家自然科学基金

0+阅读 · 2012年12月31日

穴位不同针刺方式促进脑卒中手功能恢复的神经影像学评价

国家自然科学基金

0+阅读 · 2011年12月31日

基于合成样本和MCE准则下判别学习的汉字手写文本识别研究

国家自然科学基金

0+阅读 · 2009年12月31日

汉族和维吾尔族遗传性乳腺癌BRCA基因检测及临床相关研究

国家自然科学基金

0+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员