This technical report describes our submission to the ICME 2025 audio encoder challenge. Our submitted system is built on BEATs, a masked speech token prediction based audio encoder. We extend the BEATs model using 74,000 hours of data derived from various speech, music, and sound corpora and scale its architecture upto 300 million parameters. We experiment with speech-heavy and balanced pre-training mixtures to study the impact of different domains on final performance. Our submitted system consists of an ensemble of the Dasheng 1.2 billion model with two custom scaled-up BEATs models trained on the aforementioned pre-training data mixtures. We also propose a simple ensembling technique that retains the best capabilities of constituent models and surpasses both the baseline and Dasheng 1.2B. For open science, we publicly release our trained checkpoints via huggingface at https://huggingface.co/shikhar7ssu/OpenBEATs-ICME-SOUND and https://huggingface.co/shikhar7ssu/OpenBEATs-ICME.


翻译:本技术报告介绍了我们提交给ICME 2025音频编码器挑战的方案。我们提交的系统基于BEATs构建,这是一种基于掩码语音标记预测的音频编码器。我们利用从多种语音、音乐和声音语料库中提取的74,000小时数据扩展了BEATs模型,并将其架构规模扩展至3亿参数。我们通过语音主导型与均衡型预训练混合数据的实验,研究了不同领域对最终性能的影响。我们提交的系统由达声12亿参数模型与两个在上述预训练数据混合上训练的自定义扩展BEATs模型集成构成。我们还提出了一种简单的集成技术,该技术保留了各组成模型的最佳能力,并超越了基线模型与达声12亿参数模型。为促进开放科学,我们已通过Hugging Face平台公开发布训练好的模型检查点,地址为:https://huggingface.co/shikhar7ssu/OpenBEATs-ICME-SOUND 与 https://huggingface.co/shikhar7ssu/OpenBEATs-ICME。

0
下载
关闭预览

相关内容

【CMU博士论文】鲁棒大规模音频/视觉学习,309页pdf
专知会员服务
26+阅读 · 2023年8月14日
《机器人语言》美陆军5年项目46页技术总结报告,2023年
专知会员服务
39+阅读 · 2023年5月17日
语音信号处理:基本方法与前沿技术
AINLP
10+阅读 · 2020年10月14日
ICML2019机器学习顶会接受论文列表!
专知
10+阅读 · 2019年5月12日
语音识别的前沿论文,看我们推荐的这4篇
人工智能前沿讲习班
26+阅读 · 2019年1月14日
一份AI博士生的ICML2018“学霸”笔记(55页)
大数据文摘
21+阅读 · 2018年7月17日
【好文解析】ICASSP最佳学生论文:深度对抗声学模型训练框架
中国科学院自动化研究所
13+阅读 · 2018年4月28日
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员