微软的这些研究让你瞬间变成艺术家
本篇文章1482字,读完约4分钟
雷锋的人工智能技术评论:在当今时代,你可能根本没有艺术细胞,但这并不重要,人工智能机器学习的最新研究将帮助你立即成为一名艺术家——你上传照片或视频,这可以迅速将它们转化为可以展示的创造性艺术品。
据雷锋说。微软在雷德蒙和北京的研究人员目前正在开发这样一种使用人工智能的计算机视觉技术,它可以将艺术风格应用到你上传的照片或视频中,甚至可以交换两张照片的视觉风格,例如将《阿凡达》和《蒙娜丽莎》混合在一起。
这种被称为stylebank的图像风格交换技术已经应用于微软Pix,这是一款今年6月更新的手机软件。微软pix是一款软件,集成了微软智能算法的20多项研究成果。它允许用户按下快门来获得美丽的照片。
风格交流的研究主要探索如何将艺术风格从一幅画转移到另一幅画,例如,将后印象主义风格运用到你的后花园的照片中。对于像微软pix这样的应用程序来说,挑战在于如何为用户提供更多的可选样式,并快速有效地将样式应用到图像中。
风格库研究人员解决这个问题的方法是将视觉风格明确地表达为一组卷积滤波器组,每个卷积滤波器组代表一种风格。当图像被转换成特定样式时,自动编码器将输入图像分解成独立于任何一种样式的多层特征图像。然后将与所选样式对应的滤波器组与多层特征图进行卷积,最后由解码器渲染卷积后的图像。这里,神经网络将风格和内容完全分开。与该领域的其他方法相比,该方法可以更有效地训练新的风格,更快地渲染风格化图像,因为它被显式地表示为卷积滤波器组集。这解决了微软pix的上述两个问题。
stylebank的主要研究成员是微软北京实验室的研究员华刚、陆源、廖婧和实习生陈冬冬。其中,华刚是微软亚洲研究院视觉计算组的首席研究经理和史蒂芬理工学院的客座教授;陆源是微软亚洲研究院视觉计算组的首席研究员。他们与微软研究院的微软pix团队紧密合作,并将这种风格交换功能集成到微软pix软件中。华刚的团队在2017年7月21日至26日于夏威夷火奴鲁鲁举行的2017年计算机视觉和模式识别会议(cvpr 2017)上介绍了他们的工作。
不仅如此,他们还扩展了stylebank的技术,在线呈现稳定的风格化视频。它们使用与连续帧之间的特征相对应的瞬时信息来实时获得一致且稳定的风格化视频序列。该技术自适应地混合来自前一帧和当前帧的特征图像,并且有效地避免了在逐帧视频渲染中常见的重影错觉。他们的技术将在今年10月22日至29日在意大利威尼斯举行的2017年国际计算机视觉会议上展示。
此外,在7月30日至8月2日于洛杉矶举行的siggraph 2017上,他们(除了陆源和廖婧,还有来自美国雷德蒙微软研究院认知组的歌手康冰)也报告了他们的其他研究工作。这项工作描述了一种图片之间的视觉属性转换技术,即两个明显不同但具有视觉上相似的语义结构(图片包含相似的视觉内容,例如两者都有一张脸)的图片可以相互交换属性。
例如,使用他们的技术,你可以把《阿凡达》中的一个角色的脸放到达芬奇的《蒙娜丽莎》中,反之亦然。这种技术主要是在两个输入图像之间找到很强的语义对应,就像语言中的类比一样,所以他们称这种技术为“深层图像类比”。
雷(公开号:雷)表示,预计他们将在今年的这三次会议上与我们分享这三项技术的更多细节,至少他们在未来不会被“接受”为艺术家。
雷锋网注-
原始链接:
艾用创造性的眼光放大了每个人的艺术感。
相关文献链接:
1.连贯在线视频风格转换
2.stylebank:神经图像风格转换的显式表示
3.通过深层图像类比进行视觉属性转换
雷锋原创文章。严禁擅自转载。详情请参考转载说明。
标题:微软的这些研究让你瞬间变成艺术家
地址:http://www.6st8.com/zbxw/4604.html
免责声明:联合早报中文网从世界各个维度报道世界经济新闻,时政新闻,突发新闻等,本篇的部分内容来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2018@163.com,联合早报中文网的小编将予以删除。