What and When to Learn: CURriculum Ranking Loss for Large-Scale Speaker Verification - 专知论文

会员服务 ·

0

样本 · 损失 · 学习排序 · 排序 · 课程 ·

What and When to Learn: CURriculum Ranking Loss for Large-Scale Speaker Verification

翻译：课程学习排序损失：面向大规模说话人验证的“学什么、何时学”策略

Massa Baali,Sarthak Bisht,Rita Singh,Bhiksha Raj

Speaker verification at large scale remains an open challenge as fixed-margin losses treat all samples equally regardless of quality. We hypothesize that mislabeled or degraded samples introduce noisy gradients that disrupt compact speaker manifolds. We propose Curry (CURriculum Ranking), an adaptive loss that estimates sample difficulty online via Sub-center ArcFace: confidence scores from dominant sub-center cosine similarity rank samples into easy, medium, and hard tiers using running batch statistics, without auxiliary annotations. Learnable weights guide the model from stable identity foundations through manifold refinement to boundary sharpening. To our knowledge, this is the largest-scale speaker verification system trained to date. Evaluated on VoxCeleb1-O, and SITW, Curry reduces EER by 86.8\% and 60.0\% over the Sub-center ArcFace baseline, establishing a new paradigm for robust speaker verification on imperfect large-scale data.

翻译：大规模说话人验证仍是一个开放挑战，因为固定边距损失对所有样本一视同仁，忽略样本质量。我们假设错误标注或退化样本会产生噪声梯度，破坏紧凑的说话人流形。为此提出Curry（课程学习排序），一种自适应损失函数，通过子中心ArcFace在线估计样本难度：利用主导子中心余弦相似度得出的置信度分数，基于运行批次统计将样本划分为易、中、难三个等级，无需额外标注。可学习权重引导模型从稳定身份基础出发，历经流形精炼到边界锐化。据我们所知，这是迄今训练的最大规模说话人验证系统。在VoxCeleb1-O和SITW评估中，Curry相比子中心ArcFace基线将等错误率分别降低86.8%和60.0%，为不完美大规模数据上的鲁棒说话人验证建立了新范式。

0

相关内容

【博士论文】电商搜索中的排序学习

【博士论文】电商搜索中的排序学习

专知会员服务

13+阅读 · 2025年11月15日

如何用机器学习损失函数？最新《机器学习损失函数》综述，详述其33个损失函数与分类法

如何用机器学习损失函数？最新《机器学习损失函数》综述，详述其33个损失函数与分类法

专知会员服务

70+阅读 · 2023年1月17日

如何处理数据缺失值？INRIA研究员Gael 《机器学习缺失值处理》54页ppt教程，为你讲解

如何处理数据缺失值？INRIA研究员Gael 《机器学习缺失值处理》54页ppt教程，为你讲解

专知会员服务

26+阅读 · 2022年4月21日

机器学习损失函数概述，Loss Functions in Machine Learning

机器学习损失函数概述，Loss Functions in Machine Learning

专知会员服务

84+阅读 · 2022年3月19日

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

专知会员服务

26+阅读 · 2022年3月15日

香港浸会大学最新《标签噪声表示学习》综述论文，全面阐述LNRL的数据、目标函数与优化策略

香港浸会大学最新《标签噪声表示学习》综述论文，全面阐述LNRL的数据、目标函数与优化策略

专知会员服务

32+阅读 · 2022年2月15日

WWW21最新「比较学习」教程，135页PPT阐述从排名数据中学习

专知会员服务

37+阅读 · 2021年4月27日

【SIGIR2020】策略感知的无偏排序学习—Top-K排序，Policy-Aware Unbiased Learning to Rank for Top-𝑘 Rankings

【SIGIR2020】策略感知的无偏排序学习—Top-K排序，Policy-Aware Unbiased Learning to Rank for Top-𝑘 Rankings

专知会员服务

27+阅读 · 2020年6月10日

【论文推荐WWW2020-UIUC】修正排序系统中的选择偏差：Correcting for Selection Bias in Learning-to-rank Systems

【论文推荐WWW2020-UIUC】修正排序系统中的选择偏差：Correcting for Selection Bias in Learning-to-rank Systems

专知会员服务

32+阅读 · 2020年2月1日

【O’Reilly讲座】基于深度学习的异常检测方法用于检测大型数据集的质量：Anomaly detection using deep learning to measure the quality of large datasets

【O’Reilly讲座】基于深度学习的异常检测方法用于检测大型数据集的质量：Anomaly detection using deep learning to measure the quality of large datasets

专知会员服务

31+阅读 · 2020年1月11日

一文看尽15种语义分割损失函数（含代码解析）

一文看尽15种语义分割损失函数（含代码解析）

CVer

82+阅读 · 2020年7月2日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知

12+阅读 · 2020年6月9日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

GAN生成式对抗网络

14+阅读 · 2019年5月20日

从信息论的角度来理解损失函数

从信息论的角度来理解损失函数

深度学习每日摘要

17+阅读 · 2019年4月7日

小样本学习（Few-shot Learning）综述

小样本学习（Few-shot Learning）综述

云栖社区

22+阅读 · 2019年4月6日

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

专知

26+阅读 · 2019年2月12日

大众点评搜索基于知识图谱的深度学习排序实践

大众点评搜索基于知识图谱的深度学习排序实践

数据猿

11+阅读 · 2019年1月22日

领域应用 | 大众点评搜索基于知识图谱的深度学习排序实践

领域应用 | 大众点评搜索基于知识图谱的深度学习排序实践

开放知识图谱

11+阅读 · 2019年1月21日

详解常见的损失函数

详解常见的损失函数

七月在线实验室

20+阅读 · 2018年7月12日

基于非独立同分布学习理论的图模型词义消歧及领域适应方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

排序与半监督学习的误差分析

国家自然科学基金

0+阅读 · 2015年12月31日

非确定型Web服务流程重组的可靠性验证技术

国家自然科学基金

1+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

31+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

排序集抽样下随机删失数据的非参数估计

国家自然科学基金

1+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

Learning to Route Queries to Heads for Attention-based Re-ranking with Large Language Models

Arxiv

0+阅读 · 4月27日

How to Allocate, How to Learn? Dynamic Rollout Allocation and Advantage Modulation for Policy Optimization

Arxiv

0+阅读 · 4月23日

Mitigating Lost in Multi-turn Conversation via Curriculum RL with Verifiable Accuracy and Abstention Rewards

Arxiv

0+阅读 · 4月23日

What do Language Models Learn and When? The Implicit Curriculum Hypothesis

Arxiv

0+阅读 · 4月9日

Learning is Forgetting: LLM Training As Lossy Compression

Arxiv

0+阅读 · 4月8日

Online Reasoning Calibration: Test-Time Training Enables Generalizable Conformal LLM Reasoning

Arxiv

0+阅读 · 4月1日

Off-Policy Value-Based Reinforcement Learning for Large Language Models

Arxiv

0+阅读 · 3月24日

The Truncation Blind Spot: How Decoding Strategies Systematically Exclude Human-Like Token Choices

Arxiv

0+阅读 · 3月19日

Buffer Matters: Unleashing the Power of Off-Policy Reinforcement Learning in Large Language Model Reasoning

Arxiv

0+阅读 · 3月16日

Hearing the Order: Investigating Position Bias in Large Audio-Language Models

Arxiv

0+阅读 · 2月24日

VIP会员

文章信息

相关主题

最新内容

速度优先于谨慎：NSPM-11意味着什么（将人工智能融入美国国防和情报行动最全面的声明）

速度优先于谨慎：NSPM-11意味着什么（将人工智能融入美国国防和情报行动最全面的声明）

专知会员服务

4+阅读 · 今天16:15

《基于深度强化学习的反无人机技术研究》178页

《基于深度强化学习的反无人机技术研究》178页

专知会员服务

1+阅读 · 今天16:06

技术突破与战略优势竞争：美军人工智能技术运用阶段分析

技术突破与战略优势竞争：美军人工智能技术运用阶段分析

专知会员服务

2+阅读 · 今天15:54

“史诗怒火”行动与“AI中心战”模式的浮现

“史诗怒火”行动与“AI中心战”模式的浮现

专知会员服务

3+阅读 · 今天15:31

【CVPR2026教程】扩散模型的解析理解

【CVPR2026教程】扩散模型的解析理解

专知会员服务

0+阅读 · 今天14:49

【CVPR2026教程】从感知到模拟：多模态推理中世界模型的涌现

【CVPR2026教程】从感知到模拟：多模态推理中世界模型的涌现

专知会员服务

0+阅读 · 今天14:40

马赛克战：俄乌战场透析

马赛克战：俄乌战场透析

专知会员服务

13+阅读 · 今天4:12

《利用人工智能增强军事决策》

《利用人工智能增强军事决策》

专知会员服务

4+阅读 · 今天4:09

《自动机器学习在军事数据耕耘法中的应用》

《自动机器学习在军事数据耕耘法中的应用》

专知会员服务

6+阅读 · 今天4:02

为何指挥所生存能力要求范式转变

为何指挥所生存能力要求范式转变

专知会员服务

5+阅读 · 今天3:54

打造“新蛛网”模式与高科技动员

打造“新蛛网”模式与高科技动员

专知会员服务

4+阅读 · 今天3:33

“蛛网”行动一周年：远程无人机战争

“蛛网”行动一周年：远程无人机战争

专知会员服务

3+阅读 · 今天3:23

加沙、乌克兰和伊朗冲突：人工智能如何改变冲突

加沙、乌克兰和伊朗冲突：人工智能如何改变冲突

专知会员服务

3+阅读 · 今天3:15

为何“第一次人工智能战争（美以伊冲突）”仍是人类主导的斗争

为何“第一次人工智能战争（美以伊冲突）”仍是人类主导的斗争

专知会员服务

3+阅读 · 今天3:09

【剑桥博士论文】智能体-环境协同优化

【剑桥博士论文】智能体-环境协同优化

专知会员服务

7+阅读 · 6月9日

相关VIP内容

【博士论文】电商搜索中的排序学习

【博士论文】电商搜索中的排序学习

专知会员服务

13+阅读 · 2025年11月15日

如何用机器学习损失函数？最新《机器学习损失函数》综述，详述其33个损失函数与分类法

如何用机器学习损失函数？最新《机器学习损失函数》综述，详述其33个损失函数与分类法

专知会员服务

70+阅读 · 2023年1月17日

如何处理数据缺失值？INRIA研究员Gael 《机器学习缺失值处理》54页ppt教程，为你讲解

如何处理数据缺失值？INRIA研究员Gael 《机器学习缺失值处理》54页ppt教程，为你讲解

专知会员服务

26+阅读 · 2022年4月21日

机器学习损失函数概述，Loss Functions in Machine Learning

机器学习损失函数概述，Loss Functions in Machine Learning

专知会员服务

84+阅读 · 2022年3月19日

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

专知会员服务

26+阅读 · 2022年3月15日

香港浸会大学最新《标签噪声表示学习》综述论文，全面阐述LNRL的数据、目标函数与优化策略

香港浸会大学最新《标签噪声表示学习》综述论文，全面阐述LNRL的数据、目标函数与优化策略

专知会员服务

32+阅读 · 2022年2月15日

WWW21最新「比较学习」教程，135页PPT阐述从排名数据中学习

专知会员服务

37+阅读 · 2021年4月27日

【SIGIR2020】策略感知的无偏排序学习—Top-K排序，Policy-Aware Unbiased Learning to Rank for Top-𝑘 Rankings

【SIGIR2020】策略感知的无偏排序学习—Top-K排序，Policy-Aware Unbiased Learning to Rank for Top-𝑘 Rankings

专知会员服务

27+阅读 · 2020年6月10日

【论文推荐WWW2020-UIUC】修正排序系统中的选择偏差：Correcting for Selection Bias in Learning-to-rank Systems

【论文推荐WWW2020-UIUC】修正排序系统中的选择偏差：Correcting for Selection Bias in Learning-to-rank Systems

专知会员服务

32+阅读 · 2020年2月1日

【O’Reilly讲座】基于深度学习的异常检测方法用于检测大型数据集的质量：Anomaly detection using deep learning to measure the quality of large datasets

【O’Reilly讲座】基于深度学习的异常检测方法用于检测大型数据集的质量：Anomaly detection using deep learning to measure the quality of large datasets

专知会员服务

31+阅读 · 2020年1月11日

热门VIP内容

开通专知VIP会员享更多权益服务

《基于深度强化学习的反无人机技术研究》178页

“史诗怒火”行动与“AI中心战”模式的浮现

速度优先于谨慎：NSPM-11意味着什么（将人工智能融入美国国防和情报行动最全面的声明）

技术突破与战略优势竞争：美军人工智能技术运用阶段分析

相关资讯

一文看尽15种语义分割损失函数（含代码解析）

一文看尽15种语义分割损失函数（含代码解析）

CVer

82+阅读 · 2020年7月2日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知

12+阅读 · 2020年6月9日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

GAN生成式对抗网络

14+阅读 · 2019年5月20日

从信息论的角度来理解损失函数

从信息论的角度来理解损失函数

深度学习每日摘要

17+阅读 · 2019年4月7日

小样本学习（Few-shot Learning）综述

小样本学习（Few-shot Learning）综述

云栖社区

22+阅读 · 2019年4月6日

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

专知

26+阅读 · 2019年2月12日

大众点评搜索基于知识图谱的深度学习排序实践

大众点评搜索基于知识图谱的深度学习排序实践

数据猿

11+阅读 · 2019年1月22日

领域应用 | 大众点评搜索基于知识图谱的深度学习排序实践

领域应用 | 大众点评搜索基于知识图谱的深度学习排序实践

开放知识图谱

11+阅读 · 2019年1月21日

详解常见的损失函数

详解常见的损失函数

七月在线实验室

20+阅读 · 2018年7月12日

相关论文

Learning to Route Queries to Heads for Attention-based Re-ranking with Large Language Models

Arxiv

0+阅读 · 4月27日

How to Allocate, How to Learn? Dynamic Rollout Allocation and Advantage Modulation for Policy Optimization

Arxiv

0+阅读 · 4月23日

Mitigating Lost in Multi-turn Conversation via Curriculum RL with Verifiable Accuracy and Abstention Rewards

Arxiv

0+阅读 · 4月23日

What do Language Models Learn and When? The Implicit Curriculum Hypothesis

Arxiv

0+阅读 · 4月9日

Learning is Forgetting: LLM Training As Lossy Compression

Arxiv

0+阅读 · 4月8日

Online Reasoning Calibration: Test-Time Training Enables Generalizable Conformal LLM Reasoning

Arxiv

0+阅读 · 4月1日

Off-Policy Value-Based Reinforcement Learning for Large Language Models

Arxiv

0+阅读 · 3月24日

The Truncation Blind Spot: How Decoding Strategies Systematically Exclude Human-Like Token Choices

Arxiv

0+阅读 · 3月19日

Buffer Matters: Unleashing the Power of Off-Policy Reinforcement Learning in Large Language Model Reasoning

Arxiv

0+阅读 · 3月16日

Hearing the Order: Investigating Position Bias in Large Audio-Language Models

Arxiv

0+阅读 · 2月24日

相关基金

基于非独立同分布学习理论的图模型词义消歧及领域适应方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

排序与半监督学习的误差分析

国家自然科学基金

0+阅读 · 2015年12月31日

非确定型Web服务流程重组的可靠性验证技术

国家自然科学基金

1+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

31+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

排序集抽样下随机删失数据的非参数估计

国家自然科学基金

1+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员