This work presents a seemingly simple but effective technique to improve low-resource ASR systems for phonetic languages. By identifying sets of acoustically similar graphemes in these languages, we first reduce the output alphabet of the ASR system using linguistically meaningful reductions and then reconstruct the original alphabet using a standalone module. We demonstrate that this lessens the burden and improves the performance of low-resource end-to-end ASR systems (because only reduced-alphabet predictions are needed) and that it is possible to design a very simple but effective reconstruction module that recovers sequences in the original alphabet from sequences in the reduced alphabet. We present a finite state transducer-based reconstruction module that operates on the 1-best ASR hypothesis in the reduced alphabet. We demonstrate the efficacy of our proposed technique using ASR systems for two Indian languages, Gujarati and Telugu. With access to only 10 hrs of speech data, we obtain relative WER reductions of up to 7% compared to systems that do not use any reduction.


翻译:这项工作提出了一种似乎简单但有效的技术,用于改进低资源语言的语音语言ASR系统。通过在这些语言中找出几组声学上相似的图形,我们首先使用语言上有意义的减少来减少ASR系统的输出字母,然后使用一个独立的模块来重建原字母。我们证明,这减轻了低资源终端到终端的ASR系统的负担,并改进了低资源终端到终端的功能(因为只需要减少字母的预测),并且有可能设计一个非常简单而有效的重建模块,从减少字母的顺序中恢复原字母序列的顺序。我们提出了一个基于有限的基于传输器的重建模块,在减少字母中的1个最佳ASR假设上运作。我们用ASR系统展示了我们提议的印度两种语言(古吉拉特语和泰卢古语)使用ASR系统的效率。我们只获得10个小时的语音数据,因此我们相对减少了7%的WER,而没有使用任何缩减的系统。

0
下载
关闭预览

相关内容

必须收藏!MIT-Gilbert老爷子《矩阵图解》,一张图看透矩阵
分布式并行架构Ray介绍
CreateAMind
10+阅读 · 2019年8月9日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
计算机视觉的不同任务
专知
5+阅读 · 2018年8月27日
已删除
将门创投
7+阅读 · 2018年4月18日
Arxiv
0+阅读 · 2021年7月22日
Arxiv
8+阅读 · 2018年11月27日
VIP会员
最新内容
综述 | 从问答到任务完成:Agent系统与Harness设计
Agentic RL:框架、实践与长程智能体训练
专知会员服务
2+阅读 · 6月24日
重新思考无人机时代的生存能力
专知会员服务
5+阅读 · 6月24日
装甲突击旅:现代战争思考、战斗与组织
专知会员服务
4+阅读 · 6月24日
在人工智能加速决策环境中拓展OODA循环
专知会员服务
4+阅读 · 6月24日
军事欺骗:供作战战术指挥官使用的工具
专知会员服务
4+阅读 · 6月24日
综述 | 世界动作模型:少做梦,多行动
专知会员服务
6+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
10+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
5+阅读 · 6月23日
相关VIP内容
必须收藏!MIT-Gilbert老爷子《矩阵图解》,一张图看透矩阵
Top
微信扫码咨询专知VIP会员