项目分类

艺术

人机交互

机器人

人文

交通

3D打印

设计

无人机

可穿戴

三星研究如何让蒙娜丽莎爱因斯坦变成表情包

来源：3XMaker　　　发布时间：2019年05月28日

最近位于莫斯科的三星人工智能研究中心(Samsung AI Center)的机器学习研究人员在一篇论文中指出，想要制作出一个会动的视频，可能一张照片就已足够。虽然并不是总能够到非常完美，但还是可以轻易地以假乱真。他们成功地开发这套系统，仅需一张静态图片就能制作成会说会动的影视片。

你有没有想过，有一天蒙娜丽莎不只会神秘微笑，还会对你挑眉眨眼、娓娓而谈？

三星新技术：让蒙娜丽莎开口「说话」

不止蒙娜丽莎，玛丽莲梦露也「活」过来了，红唇一张就开始说话，眼角眉梢风情万种。

三星新技术：让蒙娜丽莎开口「说话」

还有只在物理书里面看到过的爱因斯坦，你现在甚至能感受到科学道理正从他口中倾泻而出……

三星新技术：让蒙娜丽莎开口「说话」

现在，你可能会以为这是什么特效视频里截取的画面，但事实上，这些人物的动态视频，都仅源于旁边那一张照片。

会说话的蒙娜丽莎，三星AI新技术，让图片人物动起来！

利用面部数据生成视频

早在2016年，人们就见识了AI模拟制作技术的强大，当时台湾导演廖人帅与张靓颖合作的作品《Dust My Shoulders Off》便将画里面的人物全部活了起来，创造性地把这想法拍摄成MV，并成功获得美国电视节目界奥斯卡之称的泰利奖及德国红点设计奖的殊荣。如今三星新技术可以让画里面的人物就跟真人一样活起来，实现Deepfakes深度伪造。

早先，三星的AI系统便已可在一段视频中生成一张面孔，让它模仿另一张面孔在说话或观望时的神情。但为了做到这点，系统必须预先使用大量数据，例如对一两分钟的视频数据进行解析，才能让模型能够非常高效地在目标面孔中找到对应于源面孔的部分。随着技术突破，三星所发布的论文提及，这个新的人工智能模拟系统只需要一个人脸模型和脸部资料。

通过把一个人的脸部框架建构并套用在照片或图画上，实现让图像展现出普通说话和表情，并生成流畅的影片。当然，如果有越多的表情数据，就能够展现更多的表情及动作来达到更逼真的效果。甚至是让蒙娜丽莎开口说话也不是一件太难实现的事情。研究人员也尝试利用人脸生成的图像来使用生成对抗网路，让两个图像来互相对立，让他们分辨他们对于真实的定义。透过这样的方式来满足研究人员在创造的过程中所需要更精确的数据。

最近，他们透过收集YouTube上高达7000张名人的画面，从中获得标志性的脸部特征，像是眼睛、嘴巴等，并透过演算法的训练，进而达成以假乱真的Deepfakes深度伪造效果。

研究人员利用了名画蒙娜丽莎作示范，可以看到虽然未达到完美的效果，但已经几何乱真，甚至比以前人工制作的类似影片更像真。

三星新技术：让蒙娜丽莎开口「说话」

前阵子闹得沸沸扬扬的「色情换脸」，需要大量人物的图像信息再加原生视频，才能生产出一个新的合成视频，而这次三星 AI 只需基于一张肖像照片或一张画像，就能让里面人物的面部表情都动得栩栩如生。

虽然并非完美无瑕，但足以让人产生信以为真的错觉。

深度伪造技术可以制作出使人难辨真假的动态人脸画面和声音，AI换脸可以随意替换视频的角色面部。这种信息技术日新月异，也引发了人们对相关技术可能侵犯肖像权、危害社会公共利益乃至国家安全的更多担忧。目前的技术如果没有足够的脸部数据，所生成的影片需要使用太多乱码填充不足的地方，结果会变得不太自然，但也已经相当厉害。

会说话的蒙娜丽莎，三星AI新技术，让图片人物动起来！

深度伪造技术越发难辨真假

三星新技术：让蒙娜丽莎开口「说话」

「让照片动起来」的学习架构图

之后，人工智能系统就能将学到的内容应用到单张照片或多张照片上，高效地找到与系统学习的脸部相对应的部分，然后因人而异地针对新面部里各个的关键点，特别是眼睛、鼻子和嘴巴进行调整，最后达到最自然的动态效果。

当可以使用的照片越多，视频就会越加逼真，32 个图像，就足以让视频以假乱真。

三星新技术：让蒙娜丽莎开口「说话」

虽然仔细看，人物边缘的地方依然有模糊的部分，不能识别的地方也只能用背景画面粗糙填充，玛丽莲梦露的视频还少了那颗标志性的痣。而且，视频也没有声音，动态只能呈现在面部，一张一合的嘴角就像一个练习生在唱 Rap，但它依然是一个颠覆式的创新，简单点说，实现了一键把 JPG 变 GIF。

研究人员表示，未来，这个 AI 系统将会被广泛应用在视频、游戏、电视、电影，以及特效行业中，估计现在，它就已经被 B 站上的鬼畜艺术家盯上了。而单张或少量照片就能完成动态人像的速度和效率，也让该模型更利于推广。

三星新技术：让蒙娜丽莎开口「说话」

不过同时，这也意味着很快会有图谋不轨之人利用临时拼凑的工具来模仿它，进行群众误导或虚假诈骗，还有可能把一个人的人像照片制作出不可描述的动态表情，放在不可描述的身体上做不可描述的事情。

尽管它还不足以引起 Deepfakes「色情换脸」那样的风波，但它比起「色情换脸」使用起来更简易便捷，在人人都暴露无遗的互联网时代，担忧也并非没有必要，只是现在还为时尚早。

三星新技术：让蒙娜丽莎开口「说话」

目前，该研究还处于简单测试阶段，复杂的神经网络模型要变得轻量化也有重担在后。不过就像哈利波特第一次去霍格沃茨魔法学校，看到那活了的石墙肖像而惊诧不已一样，现在，它在现实里也成真了。

当AI遇上艺术，科技的碰撞，让艺术生动起来，也许会让更多的人从此爱上艺术。同时这引发了人们对相关技术可能侵犯肖像权、危害社会公共利益乃至国家安全的更多担忧，虽然目前这种技术主要用于网络恶搞，但一旦利用不当，将造成很强的负面效应，就长远来看，技术的发展还应纳入政府合规监管之下。

上一篇：让艺术和环保同时插上翅膀共同飞舞，DIY自己的电子田园飞虫

下一篇：没有了

机器人+

传感器+

柔性/印刷电子+

增强现实+

人机交互感知+

全部

艺术

人机交互

机器人

医疗健康

交通

3D打印

智造

无人机

可穿戴

热门资讯

项目分类

艺术

人机交互

机器人

人文

交通

3D打印

设计

无人机

可穿戴

三星研究如何让蒙娜丽莎爱因斯坦变成表情包

南京合越智能，增强智造，增强感知，增强交互！

业务合作

网站导航

联系方式

机器人+

传感器+

柔性/印刷电子+

增强现实+

人机交互感知+

创客分享

全部

艺术

人机交互

机器人

医疗健康

交通

3D打印

智造

无人机

可穿戴

热门资讯

项目分类

艺术

人机交互

机器人

人文

交通

3D打印

设计

无人机

可穿戴

三星研究如何让蒙娜丽莎爱因斯坦变成表情包

南京合越智能，增强智造，增强感知，增强交互！

业务合作

网站导航

联系方式