AI精确复制声音 真假“比尔·盖茨”难辨
这里是标题一h1占位文字
发布时间:
2019-06-19
关键词:
人工智能,声音克隆

脸书的研究人员成功克隆了微软总裁比尔·盖茨的声音。
脸书人工智能研究中心的肖恩·瓦斯奎兹(SeanVasquez)和迈克·刘易斯(MikeLewis)于本周表示,他们已经努力模仿人类语言有一段时间了。然而,模仿人类语言显然是件难事,当人们听到斯蒂芬·霍金所使用的那套最著名的说话机器发声时,会发现它听起来仍然很不像人类。
但是现在,研究员们似乎已经取得了进展。如果你听了盖茨的克隆所发出的声音,我想你是会同意的。因为它听起来很像比尔·盖茨,你甚至很难分辨出它和他真实声音的区别。
研究人员展示了他们的研究。在这里,机器模仿着盖茨的腔调发声,“请给你珍爱的朋友发一封充满爱意的短信。”其中最不可思议的是,这台机器在说“珍爱(cherish)”时,准确无误地捕捉到盖茨不断上升的语调变化的。
这项技术被称为MelNet,可以用来复制人类的语调。到目前为止,盖茨和其他许多人的声音都被它完美地再现了。瓦斯奎兹和刘易斯说,克隆的音频取自各类Ted演讲。
两位研究人员还表示,直到最近,文本到语音转换软件还不能很好地工作的原因是它使用了波形图记录声音。这些图显示了声音在几秒钟内的音阶变化。如果你听到过盖茨说“珍爱”这个词,就知道他的语气是变化剧烈的。在试图模仿一个人的时候,深度学习机器必须预测到所有这些细微的变化,这很不容易。
瓦斯奎兹和刘易斯说,他们通过使用一种叫做光谱图的东西来训练机器,成功地克隆了声音。
来源:网易科技
相关下载
相关新闻
澳门大阳城集团2138网站首页
电话:029-61252307(销售咨询)
电话:029-61206811(售后服务)
地址:陕西省西安市高新区毕原二路国家新一代人工智能产业园B7号楼
传真:029-68590516
地址:陕西省西安市⾼新区丈⼋五路2号 现代企业中⼼东区3号楼
问
仝人智能科技(江苏)有限公司
2011-12-12 12:15:59
电话:0515-88558952
电话:18165219150(杨先生)
地址:江苏省盐城市盐南高新区新园路76号C-2幢
问
仝人智能科技(成都)有限公司
2011-12-12 12:15:59
电话:159828985760(李先生)
地址:四川省成都市高新西区尚锦路52号桂祥大厦B座1315室
问
湖南仝人智能科技有限公司
2011-12-12 12:15:59
电话:13910828126(李先生)
地址:湖南省常德市高新区中联大道四期标准化厂房一楼