谷歌新研究：让计算机合成语音更加自然-香港商報

首页 > > 24

谷歌新研究：让计算机合成语音更加自然

2018-03-28

来源：香港商报网

　　北京时间3月28日早间消息，谷歌研究员正在探索让机器合成语音更加自然的方法。谷歌大脑和机器感知团队的成员周二在博客中公布了一些如何让语音更具表现力的范例。

　　周二早些时候，谷歌发布了“云端文本转语音”服务的测试版，提供了与谷歌助手同样的语音合成服务。该服务采用了DeepMind的WaveNet技术，而这个技术也可以被用于生成非常自然的声音。

　　谷歌此次发布的文本转语音服务和相关的研究方法可以给需要用到语音控制和语音计算的设备、应用和数字服务带来更自然的语音。

　　谷歌研究员近期发表了两篇论文，提出了新的发音方法，介绍了如何模仿语音中的重音或语调。这两篇论文的技术都基于Tacotron 2。这是个去年12月份亮相的人工智能系统，使用神经网络进行训练，模仿人类语音。

　　此前的Tacotron在大部分情况下都可以模拟真人声音，但却无法模仿说话中的重音和自然的语调。Tacotron的联合发明人Wang Yuxuan此次参与了其中一篇论文研究。通过将人类语音片段嵌入计算机语音风格，他们在合成语音中实现了重音等效果。

　　另一篇论文的研究则使用无监督训练来识别语音模式，并模仿某些语音风格。

　　竞争对手方面，苹果Siri去年获得了更具表现力的声音。去年4月，亚马逊Alexa面向语音应用开发者提供了SSML标签，在助手的语音中增加更丰富的表达，例如停顿、轻语，以及一些感叹语。

[责任编辑：李振阳]

网友评论