DistilMOS: Layer-Wise Self-Distillation For Self-Supervised Learning Model-Based MOS Prediction - 专知论文

会员服务 ·

0

MOS · SSL · 监督 · 自蒸馏 · 蒸馏 ·

DistilMOS: Layer-Wise Self-Distillation For Self-Supervised Learning Model-Based MOS Prediction

翻译：DistilMOS：基于自监督学习模型的MOS预测中的逐层自蒸馏

Jianing Yang,Wataru Nakata,Yuki Saito,Hiroshi Saruwatari

from arxiv, Accepted to ICASSP 2026

With the advancement of self-supervised learning (SSL), fine-tuning pretrained SSL models for mean opinion score (MOS) prediction has achieved state-of-the-art performance. However, during fine-tuning, these SSL-based MOS prediction models often suffer from catastrophic forgetting of the pretrained knowledge and tend to overfit the training set, resulting in poor generalization performance. In this study, we propose DistilMOS, a novel method that learns to predict not only MOS but also token IDs obtained by clustering the hidden representations of each layer in the pretrained SSL model. These layer-wise token targets serve as self-distillation signals that enables the MOS prediction model to extract rich internal knowledge from SSL models, enhancing both prediction accuracy and generalization capability. Experimental evaluations demonstrate that our method significantly outperforms standard SSL-based MOS prediction models on both in-domain and out-of-domain evaluations, verifying the effectiveness and practicality of the proposed method.

翻译：随着自监督学习（SSL）的发展，通过微调预训练的SSL模型进行平均意见得分（MOS）预测已取得最先进的性能。然而，在微调过程中，这些基于SSL的MOS预测模型常常遭遇对预训练知识的灾难性遗忘，并容易对训练集过拟合，导致泛化性能不佳。在本研究中，我们提出了DistilMOS，这是一种新颖的方法，它不仅学习预测MOS，还学习预测通过对预训练SSL模型中每一层的隐藏表示进行聚类而获得的令牌ID。这些逐层的令牌目标作为自蒸馏信号，使MOS预测模型能够从SSL模型中提取丰富的内部知识，从而同时提升预测准确性和泛化能力。实验评估表明，我们的方法在领域内和领域外评估中均显著优于标准的基于SSL的MOS预测模型，验证了所提方法的有效性和实用性。

0

相关内容

MOS

《视觉Transformers自监督学习机制综述》

《视觉Transformers自监督学习机制综述》

专知会员服务

29+阅读 · 2024年9月2日

【牛津大学博士论文】探索用于半监督学习的概率模型，127页pdf

【牛津大学博士论文】探索用于半监督学习的概率模型，127页pdf

专知会员服务

27+阅读 · 2024年6月15日

时间序列如何用自监督？浙大最新《自监督学习时间序列分析：分类、进展与展望》

时间序列如何用自监督？浙大最新《自监督学习时间序列分析：分类、进展与展望》

专知会员服务

72+阅读 · 2023年6月24日

【CVPR2023】基于多模态在线知识蒸馏的自监督视觉表示学习

【CVPR2023】基于多模态在线知识蒸馏的自监督视觉表示学习

专知会员服务

42+阅读 · 2023年4月15日

东南大学等最新《自监督学习》最新进展，26页pdf356篇文献阐述自监督学习算法、理论与应用

东南大学等最新《自监督学习》最新进展，26页pdf356篇文献阐述自监督学习算法、理论与应用

专知会员服务

68+阅读 · 2023年1月20日

自监督如何做推荐？昆士兰大学最新《自监督学习推荐系统》综述论文，阐述对比、生成、预测和混合四大类方法

自监督如何做推荐？昆士兰大学最新《自监督学习推荐系统》综述论文，阐述对比、生成、预测和混合四大类方法

专知会员服务

32+阅读 · 2022年4月5日

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

专知会员服务

26+阅读 · 2022年3月15日

【YannLecun最新报告】自监督学习与能量模型，附99页ppt与视频

【YannLecun最新报告】自监督学习与能量模型，附99页ppt与视频

专知会员服务

56+阅读 · 2021年6月19日

GNN如何自监督学习？TAMU首篇《图神经网络自监督学习》综述论文，17页pdf

GNN如何自监督学习？TAMU首篇《图神经网络自监督学习》综述论文，17页pdf

专知会员服务

74+阅读 · 2021年2月28日

Google研究院提出FixMatch，简单粗暴却极其有效的半监督学习方法，附14页PDF下载

Google研究院提出FixMatch，简单粗暴却极其有效的半监督学习方法，附14页PDF下载

专知会员服务

54+阅读 · 2020年1月24日

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

专知

46+阅读 · 2020年7月5日

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知

16+阅读 · 2020年5月29日

超越MoCo/SimCLR！华人博士提出PCL：无监督学习技术新前沿

超越MoCo/SimCLR！华人博士提出PCL：无监督学习技术新前沿

CVer

17+阅读 · 2020年5月18日

FAIR和牛津大学VGG组最新论文：多模态自监督学习

FAIR和牛津大学VGG组最新论文：多模态自监督学习

CVer

11+阅读 · 2020年3月29日

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

专知

133+阅读 · 2020年3月18日

【MIT-伯克利-ICLR2020】对比表示蒸馏，Contrastive Representation Distillation

【MIT-伯克利-ICLR2020】对比表示蒸馏，Contrastive Representation Distillation

专知

54+阅读 · 2020年3月12日

再发力！Facebook AI何恺明等最新研究MoCo(动量对比学习)第二版，超越Hinton的SimCLR，刷新SOTA准确率

再发力！Facebook AI何恺明等最新研究MoCo(动量对比学习)第二版，超越Hinton的SimCLR，刷新SOTA准确率

专知

48+阅读 · 2020年3月11日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

最新《深度神经网络自监督视觉特征学习综述》论文（附24页全文下载）

最新《深度神经网络自监督视觉特征学习综述》论文（附24页全文下载）

专知

36+阅读 · 2019年2月20日

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于概率计算的大规模MIMO检测方法

国家自然科学基金

1+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

零辅助数据MIMO雷达自适应检测问题研究

国家自然科学基金

7+阅读 · 2015年12月31日

排序与半监督学习的误差分析

国家自然科学基金

0+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

半监督进化文本聚类算法在动态多源文本分析上的研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

SA-SSL-MOS: Self-supervised Learning MOS Prediction with Spectral Augmentation for Generalized Multi-Rate Speech Assessment

Arxiv

0+阅读 · 2月16日

Lamer-SSL: Layer-aware Mixture of LoRA Experts for Continual Multilingual Expansion of Self-supervised Models without Forgetting

Arxiv

0+阅读 · 2月13日

Self-Supervised Learning Based on Transformed Image Reconstruction for Equivariance-Coherent Feature Representation

Arxiv

0+阅读 · 2月10日

BiSSL: Enhancing the Alignment Between Self-Supervised Pretraining and Downstream Fine-Tuning via Bilevel Optimization

Arxiv

0+阅读 · 2月10日

Self-Supervised Learning from Structural Invariance

Arxiv

0+阅读 · 2月2日

Enhancing Semantic Segmentation with Continual Self-Supervised Pre-training

Arxiv

0+阅读 · 1月29日

Self-Distillation Enables Continual Learning

Arxiv

0+阅读 · 1月27日

Scale-Aware Self-Supervised Learning for Segmentation of Small and Sparse Structures

Arxiv

0+阅读 · 1月26日

MoSE: Hierarchical Self-Distillation Enhances Early Layer Embeddings

Arxiv

0+阅读 · 1月25日

Self-supervised Learning of Echocardiographic Video Representations via Online Cluster Distillation

Arxiv

0+阅读 · 1月23日

VIP会员

文章信息

相关主题

最新内容

大语言模型平台在国防情报应用中的对比

大语言模型平台在国防情报应用中的对比

专知会员服务

3+阅读 · 今天3:12

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

专知会员服务

4+阅读 · 今天3:00

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

专知会员服务

2+阅读 · 今天2:56

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

专知会员服务

1+阅读 · 今天2:44

《仿真互操作性标准：实时平台参考联邦对象模型指南、原理与互操作性模式标准》300页

《仿真互操作性标准：实时平台参考联邦对象模型指南、原理与互操作性模式标准》300页

专知会员服务

3+阅读 · 今天2:37

《自主远程巡飞弹药打击系统的嵌入式人工智能感知框架》

《自主远程巡飞弹药打击系统的嵌入式人工智能感知框架》

专知会员服务

2+阅读 · 今天2:22

美海军“超配项目”

美海军“超配项目”

专知会员服务

2+阅读 · 今天2:13

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

10+阅读 · 4月21日

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

13+阅读 · 4月21日

《军用自主人工智能系统的治理与安全》

《军用自主人工智能系统的治理与安全》

专知会员服务

7+阅读 · 4月21日

美海军数字作战负责人：如何利用数据快速生成战斗力

美海军数字作战负责人：如何利用数据快速生成战斗力

专知会员服务

8+阅读 · 4月21日

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

11+阅读 · 4月20日

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

10+阅读 · 4月20日

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

6+阅读 · 4月20日

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

4+阅读 · 4月20日

相关VIP内容

《视觉Transformers自监督学习机制综述》

《视觉Transformers自监督学习机制综述》

专知会员服务

29+阅读 · 2024年9月2日

【牛津大学博士论文】探索用于半监督学习的概率模型，127页pdf

【牛津大学博士论文】探索用于半监督学习的概率模型，127页pdf

专知会员服务

27+阅读 · 2024年6月15日

时间序列如何用自监督？浙大最新《自监督学习时间序列分析：分类、进展与展望》

时间序列如何用自监督？浙大最新《自监督学习时间序列分析：分类、进展与展望》

专知会员服务

72+阅读 · 2023年6月24日

【CVPR2023】基于多模态在线知识蒸馏的自监督视觉表示学习

【CVPR2023】基于多模态在线知识蒸馏的自监督视觉表示学习

专知会员服务

42+阅读 · 2023年4月15日

东南大学等最新《自监督学习》最新进展，26页pdf356篇文献阐述自监督学习算法、理论与应用

东南大学等最新《自监督学习》最新进展，26页pdf356篇文献阐述自监督学习算法、理论与应用

专知会员服务

68+阅读 · 2023年1月20日

自监督如何做推荐？昆士兰大学最新《自监督学习推荐系统》综述论文，阐述对比、生成、预测和混合四大类方法

自监督如何做推荐？昆士兰大学最新《自监督学习推荐系统》综述论文，阐述对比、生成、预测和混合四大类方法

专知会员服务

32+阅读 · 2022年4月5日

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

专知会员服务

26+阅读 · 2022年3月15日

【YannLecun最新报告】自监督学习与能量模型，附99页ppt与视频

【YannLecun最新报告】自监督学习与能量模型，附99页ppt与视频

专知会员服务

56+阅读 · 2021年6月19日

GNN如何自监督学习？TAMU首篇《图神经网络自监督学习》综述论文，17页pdf

GNN如何自监督学习？TAMU首篇《图神经网络自监督学习》综述论文，17页pdf

专知会员服务

74+阅读 · 2021年2月28日

Google研究院提出FixMatch，简单粗暴却极其有效的半监督学习方法，附14页PDF下载

Google研究院提出FixMatch，简单粗暴却极其有效的半监督学习方法，附14页PDF下载

专知会员服务

54+阅读 · 2020年1月24日

热门VIP内容

开通专知VIP会员享更多权益服务

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

大语言模型平台在国防情报应用中的对比

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

相关资讯

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

专知

46+阅读 · 2020年7月5日

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知

16+阅读 · 2020年5月29日

超越MoCo/SimCLR！华人博士提出PCL：无监督学习技术新前沿

超越MoCo/SimCLR！华人博士提出PCL：无监督学习技术新前沿

CVer

17+阅读 · 2020年5月18日

FAIR和牛津大学VGG组最新论文：多模态自监督学习

FAIR和牛津大学VGG组最新论文：多模态自监督学习

CVer

11+阅读 · 2020年3月29日

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

专知

133+阅读 · 2020年3月18日

【MIT-伯克利-ICLR2020】对比表示蒸馏，Contrastive Representation Distillation

【MIT-伯克利-ICLR2020】对比表示蒸馏，Contrastive Representation Distillation

专知

54+阅读 · 2020年3月12日

再发力！Facebook AI何恺明等最新研究MoCo(动量对比学习)第二版，超越Hinton的SimCLR，刷新SOTA准确率

再发力！Facebook AI何恺明等最新研究MoCo(动量对比学习)第二版，超越Hinton的SimCLR，刷新SOTA准确率

专知

48+阅读 · 2020年3月11日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

最新《深度神经网络自监督视觉特征学习综述》论文（附24页全文下载）

最新《深度神经网络自监督视觉特征学习综述》论文（附24页全文下载）

专知

36+阅读 · 2019年2月20日

相关论文

SA-SSL-MOS: Self-supervised Learning MOS Prediction with Spectral Augmentation for Generalized Multi-Rate Speech Assessment

Arxiv

0+阅读 · 2月16日

Lamer-SSL: Layer-aware Mixture of LoRA Experts for Continual Multilingual Expansion of Self-supervised Models without Forgetting

Arxiv

0+阅读 · 2月13日

Self-Supervised Learning Based on Transformed Image Reconstruction for Equivariance-Coherent Feature Representation

Arxiv

0+阅读 · 2月10日

BiSSL: Enhancing the Alignment Between Self-Supervised Pretraining and Downstream Fine-Tuning via Bilevel Optimization

Arxiv

0+阅读 · 2月10日

Self-Supervised Learning from Structural Invariance

Arxiv

0+阅读 · 2月2日

Enhancing Semantic Segmentation with Continual Self-Supervised Pre-training

Arxiv

0+阅读 · 1月29日

Self-Distillation Enables Continual Learning

Arxiv

0+阅读 · 1月27日

Scale-Aware Self-Supervised Learning for Segmentation of Small and Sparse Structures

Arxiv

0+阅读 · 1月26日

MoSE: Hierarchical Self-Distillation Enhances Early Layer Embeddings

Arxiv

0+阅读 · 1月25日

Self-supervised Learning of Echocardiographic Video Representations via Online Cluster Distillation

Arxiv

0+阅读 · 1月23日

相关基金

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于概率计算的大规模MIMO检测方法

国家自然科学基金

1+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

零辅助数据MIMO雷达自适应检测问题研究

国家自然科学基金

7+阅读 · 2015年12月31日

排序与半监督学习的误差分析

国家自然科学基金

0+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

半监督进化文本聚类算法在动态多源文本分析上的研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员