Speaker embedding learning based on Euclidean space has achieved significant progress, but it is still insufficient in modeling hierarchical information within speaker features. Hyperbolic space, with its negative curvature geometric properties, can efficiently represent hierarchical information within a finite volume, making it more suitable for the feature distribution of speaker embeddings. In this paper, we propose Hyperbolic Softmax (H-Softmax) and Hyperbolic Additive Margin Softmax (HAM-Softmax) based on hyperbolic space. H-Softmax incorporates hierarchical information into speaker embeddings by projecting embeddings and speaker centers into hyperbolic space and computing hyperbolic distances. HAM-Softmax further enhances inter-class separability by introducing margin constraint on this basis. Experimental results show that H-Softmax and HAM-Softmax achieve average relative EER reductions of 27.84% and 14.23% compared with standard Softmax and AM-Softmax, respectively, demonstrating that the proposed methods effectively improve speaker verification performance and at the same time preserve the capability of hierarchical structure modeling. The code will be released at https://github.com/PunkMale/HAM-Softmax.


翻译:基于欧几里得空间的说话人嵌入学习已取得显著进展,但在建模说话人特征内部的层级信息方面仍显不足。双曲空间凭借其负曲率几何特性,能够在有限体积内高效表示层级信息,从而更契合说话人嵌入的特征分布。本文提出基于双曲空间的Hyperbolic Softmax(H-Softmax)与Hyperbolic Additive Margin Softmax(HAM-Softmax)。H-Softmax通过将嵌入向量与说话人中心投影至双曲空间并计算双曲距离,将层级信息融入说话人嵌入中。HAM-Softmax在此基础上引入间隔约束,进一步增强类间可分性。实验结果表明,与标准Softmax和AM-Softmax相比,H-Softmax和HAM-Softmax分别实现了平均相对EER降低27.84%和14.23%,证明所提方法在有效提升说话人验证性能的同时,保留了层级结构建模能力。代码发布于https://github.com/PunkMale/HAM-Softmax。

0
下载
关闭预览

相关内容

【KDD2024】Hypformer:在双曲空间中探索高效的双曲变换器
【CVPR2022】双曲图像分割
专知会员服务
19+阅读 · 2022年3月14日
【TPAMI2022】双曲深度神经网络研究综述
专知会员服务
66+阅读 · 2021年12月29日
【WWW2021】双曲图卷积网络的协同过滤
专知会员服务
40+阅读 · 2021年3月26日
专知会员服务
47+阅读 · 2020年11月13日
【ICLR 2019】双曲注意力网络,Hyperbolic  Attention Network
专知会员服务
84+阅读 · 2020年6月21日
从最优化的角度看待 Softmax 损失函数
极市平台
31+阅读 · 2019年2月21日
一文道尽softmax loss及其变种
极市平台
14+阅读 · 2019年2月19日
From Softmax to Sparsemax-ICML16(1)
KingsGarden
74+阅读 · 2016年11月26日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
11+阅读 · 2018年1月18日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员