cvpr 深度估计_CVPR再现黑科技!你还在相信“眼见为实”?

全文共2634字,预计学习时长7分钟

经常听到有人说,我除了自己的眼睛,什么也不信。

自从09年阿凡达(Avatar)电影上映以来,3D渲染、虚拟现实的逼真度总是让人叹为观止。

而今,10年过去,最近计算机视觉领域顶级会议CVPR上一组研究人员提出一款神经阿凡达模型(Neural Avatars),充分向我们证明:

当魔幻现实照进生活日常,AI黑科技让你不再相信“眼见为实”。

694046124156d00892a821acd69bba7e.gif

图片来源:《Avatar》剧照

11111d2f3c0a1727994c3596a71b4bc1.png

本届CVPR黑科技之一:造动态表情包

上周的CVPR会议上,来自三星AI中心和莫斯科Skolkovo研究所的研发团队就用实验结果告诉我们:你眼所见,未必都是真的。

该团队先是提出了一个能让JPG变动图的AI系统,研究人员称其为“Few-shot”模型。

f7e8360aea77bfd650724d73e04826be.png

“Few-shot”模型

通过该模型,你只需要少量甚至一张静态图片,就可以生成表情丰富的动态表情包。让历史人物“活”起来,甚至变得像话痨一样絮絮叨叨,都是so easy~

跟你讲相对论原理的爱因斯坦、除了微笑还能朝你眨眼的蒙娜丽莎,甚至还有媚眼如丝的玛丽莲梦露。

77b697cd98fd513fabac5e174ec3a828.gif
a516e3bd1816446a7416744363b3175f.gif
684bebe1d695223e09d4f0ece465a12a.gif

这些都将不再只是存在于霍格沃茨魔法学院的魔幻场景。

尽管这项技术对于高分辨率的图片还是有一些处理瑕疵,但在低分辨率动图上,几乎可以以假乱真。

就在这篇论文发布的第二天,该团队成员又紧接着发布了第二项黑科技,这下不仅你的表情包,就连你的整个身体都可能是“假”的。

11111d2f3c0a1727994c3596a71b4bc1.png

本届CVPR黑科技之二:不止可以造脸,全身也行

比方说,给你一张全身照,通常的技术方案生成的人体渲染可能只是固定的摄像角度和有限的身体姿势。这样造出来的人像,就很假。

然而三星提出的这个新的神经渲染模型,可以在有限的摄像头视角和数据集基础上,泛化出多角度的图像视角和丰富的人体姿态。

团队成员通过建立人体姿态神经网络渲染模型来训练单个人的身体姿态数据,从而获得原输入姿势的新视角和新姿态。

通过将经典的计算机图形(Computer Graphics)方法与深度神经网络进行结合,从而估计模型表面的2D纹理映射。其研究结果表明,与直接从图像到图像的转化(Image-to-Image translation)方法相比,保留个性化的纹理映射可以实现更好的泛化。

3aab19f52cbd0fde5fc56cd6ab9597ae.png

“Textured Neural Avatars”模型基于对关节点的位置提取从而实现姿态估计

对于图像到图像的风格转换问题,一般都是先通过训练来学习输入图片的风格,然后将其“学”来的特征映射到输出图片中,让输出图片和输入图片尽可能保证风格一致。

0167b7f289ae5276c21d2cbf2df11ae3.png

但由于风格一致的可配对训练图片实在是少见,很多研究人员不得不另辟蹊径。包括模型的泛化问题也必须给予考虑。

事实上,目前很多Image-to-Image translation模型在图片的纹理、颜色的图片风格转换任务中的表现已经相当优秀,比如把马变成斑马,或者把橘子变成苹果,但要是想把猫变成狗就有点困难了。

这也是为什么咱们要反复强调泛化能力的原因所在。一个模型真正强大的地方在于其可以通用,也就是我们常说的良好的泛化能力。

b96cfdda2da4e73b4a5f1c295f46621f.png

学习图像纹理特征的重要性:显著增强图像细节(左:未经纹理特征学习;右:经过纹理特征学习后)

目前的一些模型虽然可以改变人的面部表情或是修饰人的身体姿态,但真实性和模型的变化量都非常有限。本文中的该模型不仅可以通过视频进行训练,还可以从表面几何或是运动建模中分离纹理,因此可以处理更复杂的任务(比如多视角的全身视图)以及生成更逼真的图像渲染。

咱们具体来看看这个被称为神经阿凡达的“Textured Neural Avatars”模型

d02710d0e66b0e73b51dff4ef79600c7.png

“Textured Neural Avatars”模型

不难看出,模型输入的是一组身体关节的位置点,通过一个全卷积网络(图中的Generator)来生成身体部位坐标和身体部位分配的映射堆栈。然后使用这些堆栈在坐标堆栈指定的位置处对身体纹理进行采样映射,并使用身体部位分配的堆栈所指定的权重来生成RGB图像。

在学习过程中,将图像掩膜和RGB图像与真实图像(Ground truth)进行比较,并通过采样操作将产生的损失反向传播到全卷积网络及纹理上来更新权重。

68eaea3a4738473148179bc5ea5300e2.png

对Youtube上的一段视频的人体渲染效果

简单来说,就是只要给系统输入一个姿态骨架(Bone)图片,你就可以生成真人JPG彩图,还是带动作的全身360度无死角图。

科幻大片里抬起手腕就能弹出真人影像的场景,指日可待。

11111d2f3c0a1727994c3596a71b4bc1.png

黑科技背后:须警惕,但不必恐慌

事实上,除了三星,目前全世界各地有多家公司和研究中心都在研发此类黑科技,其中不乏有来自德国慕尼黑工业大学、斯坦福大学的团队研发的曾一度饱受争议的“换头”AI:HeadOn。

c3601f28af7d9c43a337066bfbdd58fc.gif

“换头”黑科技:HeadOn

还有德国纽伦堡大学实验室研发的让普京跟你对口型的脸部追踪AI:Face2Face。

8aa41e5bc3c07b90c63e89ca4e0ba1e6.gif

“对口型”AI:Face2Face

也包括日本用来自动生成身体和动作的服装广告界新宠:AI Model。

d27615e46a3c00776fb03127e455a51d.gif

日本服装广告界新宠:AI模特

甚至还有英伟达公司用来一键改变时间和天气的换景AI。

3e3ef73de3b40fe41d5fc8ec9f9d755a.gif

英伟达换景AI(左:真实白天场景;右:处理后秒变夜景)

拥有了这些黑科技,未来通过动图or视频去判断事件真伪的可信度也将大打折扣,尤其对于公众人物来说,可能不仅仅是被“换脸”,连各种囧事和花边新闻都可以被生造了。

对于普通人来说,万一不小心得罪了谁,被捏造一些不雅的动图or视频上传到社交平台,甚至是被某些不法分子用来要挟勒索家人,那就很恐怖了。

技术本身无分善恶,但是技术的使用者有好有坏。

未来技术能够发展到什么程度我们无法想象,我们必须对技术可能会产生的恶果予以警惕。

c814dec9a81bd55813f6d72d1582605d.png

图片来源:pixabay

但事实上,就目前而言大可不必过于担忧。诚如三星AI中心所言,其模型的泛化能力可能相较于其他方法来说表现略佳,但还是存在诸多限制。

比如,当一个身材比例与训练数据集有显著差别的人出现时,模型就表现堪忧了。当光照显著影响表面颜色时,渲染效果也会大打折扣。

另外,在手和面部姿态估计错误的情况下,渲染出的人像就会显得极其不自然。

就算未来人像渲染会更加逼真,但总归来说,人的个性和特质是很难被模仿和复制的。

想象一下,你平时笑的时候都习惯了露十八颗牙,动图里的你笑起来只露八颗是不是一秒就露馅了?

(手动滑稽)

f313cb59c961b432315bd5322f48ad2e.png

图片来源:SOOGIF网站

419c439d5ad026fe55b2d4e9c9347d71.png

留言 点赞 关注

我们一起分享AI学习与发展的干货

欢迎关注全平台AI垂类自媒体 “读芯术”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/573148.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

360浏览器查看服务器响应内容,360浏览器怎么看3个月以前的浏览记录?

360浏览器怎么看3个月以前的浏览记录?有时候我们想查找浏览器的浏览记录,这个比较简单,Ctrlh直接查看,或者如图直接查看。然而有些记录在3个月之前就坑爹了,浏览器是看不到的怎么办呢?比如几天是10月1号&am…

【Electron】Electron开发入门(一):开发环境搭建

刚接触Electronjs开发PC端桌面应用程序的时候,简直一头雾水,搜了网上很多教程,有的要么讲的零零碎碎,要么就是版本太低,很多API语法都不能用了;现在我把一些有用的教程归纳一下,并把目前最新Ele…

方差为什么用平方不用绝对值_为什么戚风蛋糕用玉米油而不用黄油?

刚开始做蛋糕的时候是最喜欢改配方的,认为糖太多了把糖减点,油太多了把油减点,黄油更香能不能把玉米油换成黄油,西点不是大都用黄油的?来,来!我们来讨论下为什么戚风蛋糕要用玉米油而不用黄油&a…

中国服务器销售排名,IDC Q3:华为FusionServer Pro智能服务器发货量、销售额荣登中国区x86标准服务器排名双冠王...

据IDC发布的《中国区服务器季度跟踪报告》显示,2020年第三季度中国区x86标准服务器市场(标注1),华为FusionServer pro智能服务器发货量及销售额双居中国区第一(标注2),其中机架、高密型号服务器,均列单品类发货量、销售额第一&…

旅游流的概念_2020年去张家界凤凰古城旅游亲身体验经历分享——实用攻略(图文)...

张家界冬暖夏凉,一年四季都适合游玩,是国内旅游首选的休闲度假胜地,作为到过张家界几次的我,写了一份比较详细的旅游攻略,仅供参考!不喜勿喷。我是靖宇,喜欢旅行和记录,每去一个地方…

服务器虚拟光驱无法加载,Proxmox/创建PVE/安装windows 2012r2系统无法识别硬盘/如何添加virtio驱动/...

前面一遍文章写了proxmox如何创建centos7系统的小鸡儿,那proxmox如何创建windows系统的小鸡儿呢?尤其是当我们小鸡的硬盘设置成virtio SCSI的时候,这时候windows ISO如果不包含virtio驱动,是无法识别硬盘,是无法装机的…

sudo: Cannot execute /usr/local/bin/zsh: No such file or directory 问题

参考:sudo: Cannot execute /usr/local/bin/zsh: No such file or directory 之前在美化Ubuntu的时候,下了个zsh,但是忘记改配置文件中的路径了,于是在su root的时候出现该情况。 解决方法: sudo vim /etc/passwd 将 r…

如何给对方邮箱发照片_朋友圈如何发心形拼图九宫格照片?

导读:经常会看到朋友圈里别人秀恩爱的爱心九宫格照片,此篇文章教你如何不用ps也可以制作心形拼图!找了很多制作心形拼图的app,但都不是我在朋友圈看到别人发的那种心形制作的图,阅尽千帆,终于让我找到这种心…

触发起名字使用正则_好名字一定在字音、字形、字意上比较吉利

专注宝宝起名20年!擅长结合生辰八字五行周易等综合起名,免费起名加专家微信 bbqm8888 (长按复制)起名字要说简单也简单,要说难确实也很难,主要取决于想如何起名字了。如果觉得名字只是一个代称,找几个自己喜欢的…

fanuc机器人四边形编程_中国工控 | FANUC 机器人码垛编程详解

(关注ID:chinak958888)(工控技术自媒体领导者)关注我们,结交自动化技术人中国工控技术学习媒体1. 码垛功能的定义对几个具有代表性的点进行示教,即可以从下层到上层按照顺序堆叠工件。2. 码垛的种类码垛 B:包括码垛B(单路径模式)和码垛BX(多路…

使用缓存的9大误区(上)(转)

如果说要对一个站点或者应用程序经常优化,可以说缓存的使用是最快也是效果最明显的方式。一般而言,我们会把一些常用的,或者需要花费大量的资源或时间而产生的数据缓存起来,使得后续的使用更加快速。 如果真要细说缓存的好处&…

cmake取消宏定义_Excel基础丨取消excel中宏安全提示框

很多高手都喜欢使用“宏”命令来提高办公工作效率。但在 Microsoft Office 程序中使用宏时,总会弹出宏安全警告,这让使用者倍感麻烦。而如果把宏的安全级设置为“低”,就可以取消excel中宏安全提示框了,又增加了恶意代码和病毒攻击…

5b计算机联锁系统_力控科技油库调度管理系统应用案例

一 、 项目概述"油库储油罐区具有分布空间范围广、安全防爆要求高、监控点多、布线复杂,自动化系统的水平和垂直集成难度大等特点。系统采用先进测控与管理技术,围绕储油罐区自动计量、监测与管理,进行储油罐区监测控制与数据采集系统的…

集合框架(九)----Map

从这篇开始就要学习Map了! 先来看一下Map的继承体系: 如君所见,Maps的体系没有像Collections那么庞大 在接下来的两篇博文中将分别介绍HashMap和TreeMap 至于WeakHashMap,个人感觉文档中说的相当含糊,理解起来很有难度&#xff0c…

cpu java poi 导出_让 Java 开发更简单,提高工作效率 | Gitee 项目推荐

1、项目名称:基于 Spring Boot 的权限管理系统项目简介:Good 权限管理系统是作者学习 springBoot 时基于 springBoot 开发的一套轻量级的权限系统,其目的是形成一套属于自己的通用的开发框架 以后来项目的时候就可以直接基于此平台进行开发&a…

给图片下方加水印_别再看不起美图秀秀啦,想要做长图,批量加水印,用它超级方便...

Hello大家好,我是撒娇的小肉片。时隔超长时间的更新,不知道还有多少人记得我哈哈。今天想要和大家分享的是如何批量加水印,如何拼成长图,操作简单,你值得拥有哦~最重要的是免费!免费!完全免费&a…

加载顺序_Java的web.xml组件加载顺序

在配置项目组件的过程中, 了解Tomcat加载组件顺序很有必要。 例如某些框架如Quartz的集群功能需要数据库的支持, 数据库的加载肯定要在框架组件加载之前。经过查阅和Debug发现, web.xm组件加载顺序为:context-param -> listene…

20145326蔡馨熠《信息安全系统设计》第2周学习总结

20145326蔡馨熠《信息安全系统设计》第2周学习总结 教材学习内容总结 一、计算机系统与链接 信息就是位上下文,都是由一串位表示的,区分不同数据对象的唯一方法是我们读到这些数据对象时的上下文。ASCII字符构成的文件是文本文件,所有其他文件…

存放在外存上的数据关机后_小鑫话题 | 惊了!关机后SSD会丢数据?

今天小鑫在群里看到一个很有趣的话题,是关于SSD和HDD哪个更好的讨论。这个话题小鑫都已经见过不下十次了,但是今天小鑫看到了一句以前从没有看到的言论。(某交流群截图)看到这里,小鑫觉得网络上的“标题党”,可能已经在大做文章了…

2、Redis入门介绍

1、什么是Redis Redis:REmote DIctionary Server(远程字典服务器) 是完全开源免费的,用C语言编写的,遵守BSD协议,是一个高性能的(key/value)分布式内存数据库,基于内存运行。并支持持久化的NoSQL数据库,是当…