新加坡联合早报中文网即时报道亚洲和国际的评论、商业、体育、生活、科技与多媒体新闻,从世界各个维度报道世界经济新闻,时政新闻,突发新闻等。

当前位置:主页 > 新闻 > 《经济学人》:GAN能伪造音视频文件,眼见不再为实

《经济学人》:GAN能伪造音视频文件,眼见不再为实

来源:联合早报中文网作者:邵湖心更新时间:2020-08-30 07:56:08阅读:

本篇文章1865字,读完约5分钟

今年早些时候,一篇关于法国音乐家弗兰的文章?瓦兹·哈代的youtube视频在互联网上流传。在视频中,观众问她为什么唐纳德·特朗普让他的新闻秘书肖恩·斯派塞谎报就职典礼的人数。哈迪回答说,这件事极具争议性,而斯派塞先生给出了“各种事实”。

《经济学人》:GAN能伪造音视频文件,眼见不再为实

这段视频的内容很奇怪,尤其是弗兰?瓦兹·哈代女士本人。虽然她现在已经73岁了,但视频看起来只有20岁,她的声音就像特朗普的顾问凯丽亚娜·康威(kellyanne conway)的声音。

实际上,这段视频是德国艺术家马里奥·克林曼的杰作,“另类面孔1.1”,它使用一个人的面孔来构建一个生成性对抗网络,并生成新的面孔。这是一段基于nbc采访康威女士的假视频。这原本是一个关于康威女士的臭名昭著的对话,但却是通过哈迪女士的口说出来的。马里奥克林曼使用不同的声音片段作为基于弗兰的输入数据?瓦兹·哈代女士的脸在训练。视频看起来有点摇晃,像素已经调整过了。事实上,通过视频软件制作可能的图片会更好,但是克林曼没有使用编辑软件来完成视频。相反,他只用了几天时间就在台式电脑上用一种机器学习算法——创成对抗网络(创成对抗网络)制作了一段视频。在电脑被迫输入哈迪女士的音乐视频后,它会自动生成克林格兰人想要的声音片段。在这个假视频中发布的声音剪辑实际上并不存在。哈迪女士从不。

《经济学人》:GAN能伪造音视频文件,眼见不再为实

克林曼先生的实验让虚假视频进入了公众的视野,这表明未来可能会有一场关于真假视频的战争。原始文字信息很容易伪造,但是图像和声音很难伪造,所以图像和声音的证据本来就很可信。然而,甘的存在可能会改变这种情况,它可能会使图像和声音不太可信。

《经济学人》:GAN能伪造音视频文件,眼见不再为实

事实上,音频更容易伪造。通常,计算机通过连接大量的短录音片段来创建一个句子,这也是siri声音生成的原理。然而,这种数字声音受到他们记忆片段范围的限制,所以数字声音只有在谈论某些短语时听起来才是真实的。

甘以不同的方式制作音频。它使用神经网络算法来学习音频源的统计属性,然后在任何其他环境中再现这些属性,并以毫秒而不是秒为单位对它们进行建模。如果我们想让特朗普或任何其他公众人物说出指定的单词,我们实际上会将相应人物的语音材料作为输入,并告诉算法您想要输出什么声音。在过去的几年里,谷歌在英国的深度思维团队、百度在硅谷的深度学习研究所和蒙特利尔研究所已经发布了从文本到语音的高性能算法。目前,这些算法只能通过大公司的计算能力来实现,但这种情况最终会改变。

《经济学人》:GAN能伪造音视频文件,眼见不再为实

与音频相比,机器生成的图像更难实现。2014年,伊恩古德费勒(ian goodfellow)创办了gans,当时他是米兰yoshua bengio的学生。尽管深度学习允许机器容易地完成图像识别的任务并区分不同种类的数据,例如,机器可以容易地区分猫和狗的图片,但是机器自动生成猫和狗的图片并不容易,并且计算机通过数据库中的大量训练图像自动生成有意义的图片也是困难的。

《经济学人》:GAN能伪造音视频文件,眼见不再为实

古德费勒转向了另一种实现图像生成的方法:竞争。不是要求软件与空一起生成有用的东西,而是提供另一个软件作为原始软件的反对者来促进图像生成。对手将识别原始软件生成的图像,并判断它们是否“真实”。通过试图愚弄对手,创成式软件学会创建看起来真实的生成图像。反软件“知道”真实世界是什么样子,所以它赋予了生成图片的意义和限制。

《经济学人》:GAN能伪造音视频文件,眼见不再为实

目前,gans可以根据语言描述生成小邮票大小的图像。当你告诉甘斯,“这只鸟是白色的,有一些黑色的头和翅膀,有一个长长的橙色喙”,它会为你画出来。也许这幅画并不完美,但乍一看它是真实的。

当时,这种算法的效果并不令人惊讶,但gan的发展非常迅速。在过去的五年里,由相似算法驱动的照片分类软件的错误率从25%下降到了几个百分点。人们期望在图像生成领域取得同样的进步。谷歌的机器学习艺术家迈克·泰卡(Mike Tekka)训练了gans算法,生成了一幅分辨率为768像素的人脸图像,这是此前类似研究实验中像素的两倍多。

《经济学人》:GAN能伪造音视频文件,眼见不再为实

古德费勒现在在谷歌大脑工作,这是搜索巨头谷歌的内部人工智能研究所。如果我们必须估计这个算法的实现时间,他认为有可能在三年内生成youtube假视频。其他人认为可能需要更长时间。但是每个人都同意这只是时间问题,而不是能否实现。古德费勒说:“我们认为人工智能将改变我们所信任的证据——图像和音频。”

《经济学人》:GAN能伪造音视频文件,眼见不再为实

这篇文章是由雷锋编辑的。(公开号码:雷锋。未经雷锋允许,不得转载。

原创链接:学人/新闻/科技/21724370-假新闻-你什么也没看到-还没产生-令人信服-音频-视频-假,由雷锋编辑。

雷锋文章版权所有。严禁擅自转载。详情请参考转载说明。

标题:《经济学人》:GAN能伪造音视频文件,眼见不再为实

地址:http://www.6st8.com/zbxw/4192.html

免责声明:联合早报中文网从世界各个维度报道世界经济新闻,时政新闻,突发新闻等,本篇的部分内容来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2018@163.com,联合早报中文网的小编将予以删除。

返回顶部