谷歌推“同声传译”系统Translatotron 一种端到端的语音转换

2019-05-16 17:12:31   来源:新浪VR

       谷歌AI官方博客最新博文中向我们介绍了一项实验性质的新系统--Translatotron,它能够直接将语音翻译成为语音,中间不再需要任何文本在博文中写道:“Translatotron是首个能够直接将一种语言的语音翻译成为另一种语言语音的端到端模型。

       Translatotron将源光谱图作为输入并生成目标语言中的翻译内容的光谱图。它还使用了另外两个经过单独训练的组件,神经声码器将输出频谱图转换为时域波形。该系统避免将任务划分为单独的阶段,提供了比级联系统更多的优势,更快的推理速度,自然地避免了识别和翻译之间的复合错误,使得在翻译后保留原始发言者的声音,并且更好地处理不需要翻译的单词。

       谷歌表示当前的翻译系统分为三个步骤:自动语音识别,将语音转换为文本;机器翻译,将文本转换为另一种语言;最后是文本转语音(TTS)合成,也就是将翻译好的文本生成语音。在这三个步骤衍生出了Google Translate等服务,不过这家科技巨头希望通过一个模型就实现语音的翻译,而不再需要借助文本这个中间步骤。

       Google AI软件工程师Ye Jia和Ron Weiss表示:“该系统名为Translatotron,这个系统避免了将任务分成不同的阶段。”谷歌表示这意味着更快的翻译速度和更少的转译错误。该系统使用频谱图作为输入并生成频谱图,同样依赖于神经声码器和扬声器编码器,这意味着系统在翻译后保留说话者的声音特征。

       据我们所知,Translatotron是第一个能够将语言从一种语言直接翻译成另一种语言的语音的端到端模型。它还能够在翻译的语音中保留说话者的声音。谷歌希望这项工作可以作为未来端到端语音转语音翻译系统研究的起点。

新浪声明:新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。
精彩推荐
相关新闻

营收增长减缓 谷歌拟在移动应用主页投信息流广告

Alphabet周二表示,谷歌将于今年晚些时候开始在其全球智能手机应用程序的主页上投放广告,这将为这家搜索巨头提供大量新的广告位...

相关谷歌首席法务官:我们主要通过匿名搜索请求赚钱
2019-05-15 11:17:29 来自:厂商新闻

谷歌首席法务官:我们主要通过匿名搜索请求赚钱

谷歌首席法务官周二肯特·沃尔克(Kent Walker)表示,该公司的搜索业务主要通过匿名请求赚钱。沃尔克在德国慕尼黑启动一个安全中...

相关谷歌广告“羞辱”苹果 其实这并不是第一次了
2019-05-15 09:50:45 来自:热点新闻

谷歌广告“羞辱”苹果 其实这并不是第一次了

在苹果位于新卡内基图书馆的零售店附近,谷歌挂起了一个大大的广告牌,广告牌上有Pixel 3a和“Phone X”拍摄的两幅夜景照片,还有...

相关谷歌力推CameraX相机接口,华为开放多项相机能力助推安卓行业发展
2019-05-13 09:31:26 来自:热点新闻

谷歌力推CameraX相机接口,华为开放多项相机能力助推安卓行业发展

  北京时间5月8日凌晨,谷歌I/O 2019开发者大会如期举行。在本届大会上,谷歌带来了最新的安卓系统Android Q,以及两大硬件阵容...

相关: 暂无...
2019-05-09 17:51:09 来自:快讯专栏

热门推荐

HOT RECOMMEND

新浪VR简介 | 论坛社区 | 网站合作 | 广告服务 | 联系我们 | 免责声明 | 招聘信息

Copyright © 1996-2015 SINA Corporation, All Rights Reserved 京ICP证000007  京网文【2017】10231-1157号

北京幻世新科网络科技有限公司 版权所有