CMU多语种语音数据集:700多种语言的语音/文本对齐语料

2018 年 11 月 19 日 专知

【导读】CMU近日发布大规模语音数据集,提供音频、对齐文本和单词发音的700多种不同语言的数据集。平均而言,每种语言提供大约20个小时的句长的转录。 



数据爬取自:http://www.bible.is/


List of Languages with relative scores of accuracy of alignment

http://festvox.org/cmu_wilderness/


Map of Languages geopositioned

http://festvox.org/cmu_wilderness/map.html

Github链接地址:

https://github.com/festvox/datasets-CMU_Wilderness


-END-

专 · 知

人工智能领域26个主题知识资料全集获取与加入专知人工智能服务群: 欢迎微信扫一扫加入专知人工智能知识星球群,获取专业知识教程视频资料和与专家交流咨询!


请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!


请加专知小助手微信(扫一扫如下二维码添加),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~

 AI 项目技术 & 商务合作:[email protected], 或扫描上面二维码联系!

请关注专知公众号,获取人工智能的专业知识!

点击“阅读原文”,使用专知

登录查看更多
4

相关内容

【清华大学】低资源语言:回顾综述和未来的挑战,14页pdf
论文写作修辞速查:单词、短语、句子
专知
7+阅读 · 2018年10月29日
自然语言处理(NLP)前沿进展报告(PPT下载)
机器学习数学基础【附PPT下载】
专知
46+阅读 · 2018年9月17日
NLP论文的技术播客-NLP Highlights
专知
14+阅读 · 2018年8月6日
A Sketch-Based System for Semantic Parsing
Arxiv
4+阅读 · 2019年9月12日
Arxiv
5+阅读 · 2019年4月21日
Arxiv
3+阅读 · 2018年12月18日
Arxiv
5+阅读 · 2018年1月30日
VIP会员
最新内容
BES:让语言模型通过双向进化搜索自我改进
专知会员服务
0+阅读 · 今天16:48
以色列-美国-伊朗战争中的无人机:关键要点
专知会员服务
3+阅读 · 今天14:04
《Palantir任务保障性软件安全标准(MA-S2)》
专知会员服务
6+阅读 · 今天13:49
基于声学的无人机检测技术综述
专知会员服务
5+阅读 · 今天13:37
《当代混合战争分析框架:俄乌战争经验教训》
专知会员服务
5+阅读 · 今天13:11
战略前沿人工智能的再思考(中文)
专知会员服务
7+阅读 · 5月29日
《量化地基防空系统间接效应的博弈论方法》
专知会员服务
5+阅读 · 5月29日
Top
微信扫码咨询专知VIP会员