No Train, all Gain: Self-Supervised Gradients Improve Deep Frozen Representations

This paper introduces FUNGI, Features from UNsupervised GradIents, a method to enhance the features of transformer encoders by leveraging self-supervised gradients. Our method is simple: given any pretrained model, we first compute gradients from various self-supervised objectives for each input. These gradients are projected to a lower dimension and then concatenated with the model's output embedding. The resulting features are evaluated on k-nearest neighbor classification over 11 datasets from vision, 5 from natural language processing, and 2 from audio. Across backbones spanning various sizes and pretraining strategies, FUNGI features provide consistent performance improvements over the embeddings. We also show that using FUNGI features can benefit linear classification, clustering and image retrieval, and that they significantly improve the retrieval-based in-context scene understanding abilities of pretrained models, for example improving upon DINO by +17% for semantic segmentation - without any training.

翻译：本文提出FUNGI（Features from UNsupervised GradIents）方法，通过利用自监督梯度增强Transformer编码器的特征表示。我们的方法简洁明了：给定任意预训练模型，首先针对每个输入计算来自不同自监督目标的梯度。这些梯度被投影至低维空间后，与模型输出的嵌入向量进行拼接。所得特征在涵盖视觉领域的11个数据集、自然语言处理领域的5个数据集及音频领域的2个数据集上，通过k近邻分类进行评估。在涵盖不同规模与预训练策略的骨干网络中，FUNGI特征相较于原始嵌入向量均能带来持续的性能提升。我们还证明，使用FUNGI特征可提升线性分类、聚类与图像检索任务的性能，并显著增强预训练模型基于检索的上下文场景理解能力——例如在无需任何训练的情况下，将DINO模型在语义分割任务上的性能提升17%。

相关内容

MoDELS

关注 45

ACM/IEEE第23届模型驱动工程语言和系统国际会议，是模型驱动软件和系统工程的首要会议系列，由ACM-SIGSOFT和IEEE-TCSE支持组织。自1998年以来，模型涵盖了建模的各个方面，从语言和方法到工具和应用程序。模特的参加者来自不同的背景，包括研究人员、学者、工程师和工业专业人士。MODELS 2019是一个论坛，参与者可以围绕建模和模型驱动的软件和系统交流前沿研究成果和创新实践经验。今年的版本将为建模社区提供进一步推进建模基础的机会，并在网络物理系统、嵌入式系统、社会技术系统、云计算、大数据、机器学习、安全、开源等新兴领域提出建模的创新应用以及可持续性。官网链接：http://www.modelsconference.org/

Linux导论，Introduction to Linux，96页ppt

专知会员服务

82+阅读 · 2020年7月26日

【跨语言BERT模型大集合】Transfer learning is increasingly going multilingual with language-specific BERT models

专知会员服务

54+阅读 · 2020年1月30日

FlowQA: Grasping Flow in History for Conversational Machine Comprehension

专知会员服务

34+阅读 · 2019年10月18日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

50+阅读 · 2019年10月17日