首页 > 资讯列表 > 科技资讯 >> 业界动态

有了谷歌DeepMind的这个黑科技 机器说话更像人了

业界动态 2016-09-09 22:15:06 转载来源: 网络整理/侵权必删

站长搜索讯 据外媒报道,Google的DeepMind研究实验室昨天公布了其在计算机语音合成领域的最新成果——WaveNet。该语音合成系统能够模仿人类的声音,生成的原始音频质量优于目前的文本转语音系统(text to speech,简称TTS)

有了谷歌DeepMind的这个黑科技 机器说话更像人了

站长搜索讯 据外媒报道,Google的DeepMind研究实验室昨天公布了其在计算机语音合成领域的最新成果——WaveNet。该语音合成系统能够模仿人类的声音,生成的原始音频质量优于目前的文本转语音系统(text to speech,简称TTS)。

DeepMind宣称,通过人耳测试,该技术使得模拟生成的语音与人类声音之间的差异缩小了一半。当然,这种测试不可避免地存在主观性。

WaveNet目前还没有被应用到谷歌(微博)的任何产品中,而且该系统需要强大的计算能力,近期也无法应用到真实世界场景。

让人类跟机器自由交谈是人机交互研究领域长久以来的梦想。在过去几年,深度神经网络的应用大幅度了提高计算机理解自然语音的能力。然而,运用计算机生成语音(语音合成,或者TTS系统)仍然主要依靠拼接式TTS——先录制单一说话者的大量语音片段,建立一个大型数据库,然后将语音片段合成完整的话语。这种语音合成方式很难对声音加以修饰,无法表达强调或者情感。

为了解决语音合成的这一难题,迫切需要运用一种参量改频式(Parametric)TTS。在这种TTS系统中,生成数据所需要的所有信息被存储于模型的参数中,语音所传达的内容及语音特征可以通过模型的输入信息得以控制。然而,目前参量改频式TTS生成的语音听起来还不如拼接式TTS模型生成的语音自然。现有的参量改频式模型通常将输出的信息交给信号处理算法处理,从而生成音频信号。

WaveNet改变了这种范式,直接用音频信号的原始波形建模,而且是一次处理一个样本。通过这种方式生成的语音不但听起来更加自然,而且使用原始波形还能为任何声音建模,包括模仿任何人的声音,还能生成音乐。在测试中,WaveNet通过分析古典音乐,生成了一段钢琴曲。

谷歌DeepMind的人工智能AlphaGo在今年早些时候打败了韩国围棋大师李世石九段,引起了世人的关注。谷歌一直对如何应用其人工智能技术守口如瓶,只是称其已经利用这些技术降低了冷却公司数据中心所需的电量,让从YouTube到谷歌广告产品的一系列服务得到了巨大改善。(综合/翼飞)

推荐:关注腾讯数码微信官号(ID:qqdigi)获取苹果iPhone 7动态,最新资讯、购买指南、详尽评测、一手视频、互动直播应有尽有。聊天聊点啥?看这儿。

有了谷歌DeepMind的这个黑科技 机器说话更像人了

标签: 有了 谷歌 DeepMind 这个 科技 机器 说话 像人


声明:本文内容来源自网络,文字、图片等素材版权属于原作者,平台转载素材出于传递更多信息,文章内容仅供参考与学习,切勿作为商业目的使用。如果侵害了您的合法权益,请您及时与我们联系,我们会在第一时间进行处理!我们尊重版权,也致力于保护版权,站搜网感谢您的分享!

站长搜索

http://www.adminso.com

Copyright @ 2007~2024 All Rights Reserved.

Powered By 站长搜索

打开手机扫描上面的二维码打开手机版


使用手机软件扫描微信二维码

关注我们可获取更多热点资讯

站长搜索目录系统技术支持