谷歌解读免费实时转录软件:面向听障人士 支持70种语言

2019 年 4 月 25 日 网易智能菌

来源 | 网易科技(公众号:tech_163)

作者 | 定西


近日,谷歌邀请媒体在京举行视频电话会议,谷歌产品经理Sagar Savla介绍了Live Transcribe软件,这是一项免费的Android服务,通过将自动字幕技术融入日常会话,减少现实世界中的对话障碍。


据了解,通过自动语音识别技术 (ASR),计算机能够检测有声语言并将其现场转录为供阅读的文本,由Google云提供技术支持,Live Transcribe可以进行实时的对话字幕转录,支持超过70种语言,覆盖全球80%以上的人口。

Sagar Savla表示,虽然依靠云ASR能为我们提供更高的准确性,但Google希望可以减少Live Transcribe所需的网络流量消耗。为此,Google在先前AudioSet的工作基础上,实现了基于神经网络的设备语音检测器。该网络是一种图像式模型,类似于我们之前发布的VGGish模型,它可以检测语音并自动管理与云ASR引擎的网络连接,将长时间使用过程中的数据流量消耗降至最低。


在技术呈现方面,Google曾考虑了几种不同的模式:计算机、平板电脑、智能手机、小型投影仪,以迭代方式显示听觉信息和字幕。最后,Sagar Savla的团队决定专注于智能手机模式,因为这类设备无处不在且功能日益强大。

(软件使用量热度图)


资料显示,世界卫生组织预计,到2055年全球将有九亿人听力受损。谷歌的这项软件可以为他们带去便利。目前该软件在亚洲已经非常流行。



往期推荐



社交网站上的照片,也许已经被用来训练人工智能

▲点击图片观看

剖析20世纪未来出行 这些畅想21世纪能成吗?


▲点击图片观看

是“洗稿”还是“创作”?AI画作所有权该归谁?

▲点击图片观看


- 加入社群吧 -

网易智能AI社群(AI芯片、医疗AI、金融AI、电商AI、自动驾驶、教育AI、AIoT、机器人等12个社群)火热招募中,对AI感兴趣的小伙伴,添加智能菌微信 kaiwu_club,说明身份即可加入。

登录查看更多
0

相关内容

【资源】100+本免费数据科学书
专知会员服务
110+阅读 · 2020年3月17日
深度神经网络实时物联网图像处理,241页pdf
专知会员服务
78+阅读 · 2020年3月15日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
108+阅读 · 2020年1月2日
【电子书】Flutter实战305页PDF免费下载
专知会员服务
23+阅读 · 2019年11月7日
免费!Google Colab现已支持英伟达T4 GPU
新智元
5+阅读 · 2019年4月25日
推荐几个权威且免费的人工智能学习资源
深度学习世界
10+阅读 · 2018年5月2日
python语音识别终极指南
AI100
13+阅读 · 2018年4月5日
业界 | 谷歌发布自然语言框架语义解析器SLING
机器之心
3+阅读 · 2017年11月16日
Arxiv
10+阅读 · 2020年4月5日
Arxiv
113+阅读 · 2020年2月5日
Neural Speech Synthesis with Transformer Network
Arxiv
5+阅读 · 2019年1月30日
Feature Selection Library (MATLAB Toolbox)
Arxiv
7+阅读 · 2018年8月6日
VIP会员
最新内容
战争机器学习:数据生态系统构建(155页)
专知会员服务
6+阅读 · 今天8:10
内省扩散语言模型
专知会员服务
5+阅读 · 4月14日
国外反无人机系统与技术动态
专知会员服务
3+阅读 · 4月14日
大规模作战行动中的战术作战评估(研究论文)
未来的海战无人自主系统
专知会员服务
3+阅读 · 4月14日
美军多域作战现状分析:战略、概念还是幻想?
无人机与反无人机系统(书籍)
专知会员服务
19+阅读 · 4月14日
美陆军2026条令:安全与机动支援
专知会员服务
9+阅读 · 4月14日
Top
微信扫码咨询专知VIP会员