谷歌黑科技曝光:其AI语音合成系统几乎与真人声音无法区分
本篇文章382字,读完约1分钟
[tech web Report]12月28日,据国外媒体wccf tech报道,谷歌称其最新版本的人工智能语音合成系统tacotron 2几乎无法与真人的声音区分开来。
这个系统是谷歌的第二代语音到文本技术,它有两个深度神经网络来实现完美的输出。第一个深层神经网络负责将文本转换为声谱图(音频以可视方式呈现,通常为pdf格式),然后将该声谱图加载到第二个深层神经网络wavenet(来自人工智能研究实验室deepmind of alphabet),后者读取声谱图并生成类似的音频元素。
语音转文本不是一项新技术。对于mac用户来说,它已经存在了很长时间。然而,谷歌声称它的文本转换为语音技术优于大多数,而且它很难与人类的声音区分开来。
Tacotron 2可以根据上下文发音相同的单词。它也可以根据不同的标点符号来区分,也可以在阅读大写单词时强调。(小狐狸)
标题:谷歌黑科技曝光:其AI语音合成系统几乎与真人声音无法区分
地址:http://www.6st8.com/zbxw/11825.html
免责声明:联合早报中文网从世界各个维度报道世界经济新闻,时政新闻,突发新闻等,本篇的部分内容来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2018@163.com,联合早报中文网的小编将予以删除。
下一篇:没有了