生成式AI,引领AI从“换脸”到“造脸”

7d7967d09ec687c13413841754afd8e9.png

来源:中智观察

头图来源:界面新闻

记者:木易

编辑:豆芽

日前,Gartner发布了2022年重要战略技术趋势。其中,生成式人工智能(Generative Artificial Intelligence)位列12项重要战略之首。

同时Gartner预计,到2025年,生成式人工智能将占所有生成数据的10%,而目前这一比例还不到1%。

也能看到,在2020年Gartner发布人工智能技术成熟度曲线报告2020时(Hype Cycle for Artificial Intelligence,2020),生成式人工智能便作为新增技术热点首次被提出。

74ce6abb8c522d87b5748139c5ab8084.png

今年的(Hype Cycle for Artificial Intelligence,2021)报告中,生成式人工智能同样位列其中。

以上种种迹象表明,Gartner对生成式AI是多么看重。那么,生成式AI究竟是什么?生成式AI又能给智能时代带来什么?

0d1b9baab3722d2e7d29fdba31009880.png训练后的再创造

789f589aecf7404afb5138a51b5acfb0.png

先来看一张图。您觉得下图中这个金发碧眼、带着婴儿肥的小男孩是真实存在的吗?

370149363136f6f8aa2cf7653197a22a.png

AI合成小男孩

ZHONGZHIGUANCHA

答案是No。这是由人工智能合成的。

再看一张图。您觉得下图中这位女士像是人工智能合成的吗?

7e07ca0a2827f201c892a2193aa399fd.png

AI合成的女士

ZHONGZHIGUANCHA

答案是Yes。

上述这两张图均来自“ThisPersonDoesNotExist.com”网站。

也不止这两个,“ThisPersonDoesNotExist.com”网站中,每次刷新出来的人物,都是现实中根本不存在的。

如果不知道真相,是否你根本无法判断出真假?

这便是生成式AI的一种应用。

对于生成式AI,Gartner这样定义:通过各种机器学习(ML)方法从数据中学习工件的组件(要素),进而生成全新的、完全原创的、真实的工件(一个产品或物品或任务),这些工件与训练数据保持相似,而不是复制。

简单理解。生成式AI是利用现有文本、音频文件或图像创建新内容的技术。使用生成 AI,计算机检测与输入相关的基本模式并生成类似内容。

c9252a25b674feee9187c5f079b30ef7.pngGANs,生成式AI的核心技术

850fa65c6f6a26401347943ffddc068a.png

在此必须看下生成式对抗网络(GANs, Generative Adversarial Networks ),这是生成式AI的关键技术。其本质是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。

2014年,研究人员首次使用计算机,利用生成对抗网络GANs,创造出了逼真的人脸。

在原理上,生成式对抗网络使用两个神经网络相互对立,一个生成器和一个判别器。生成器或生成网络是一个神经网络,负责生成类似于源数据的新数据或内容。判别器或判别网络是负责区分源数据和生成数据之间的神经网络。

102819b14ef51d2032c13d5f3c937a26.png

这两个神经网络都经过交替周期训练,生成器不断学习生成更逼真的数据,判别器则更善于区分假数据和真实数据。

可以把GANs想象成一个造假者,一个在猫捉老鼠游戏中的警察,造假者正在学习传递假币,而警察正在学习检测假币。渐渐地,双方在对抗中都不断完善。

60055d3c685d361b4f2b362b7a164c1c.pngAI生“万物”

716ae0b1036f9c962a26df921815dccc.png

当下,生成式AI已在研究和商业的多种场景得到应用,如创建软件代码、促进药物研发和有针对性的营销等。具体而言:

生成图形:AI可以从艺术品中抽象视觉图案,然后将这些图案应用到具有该艺术品特征的虚拟图像再现中。这些算法还可以将任何粗糙的涂鸦转换为令人印象深刻的绘图,该图像似乎是由描绘真实世界的专业人类艺术家创作的。

生成式AI可以手绘人脸草图,并以算法将其转换为逼真图像,也可以指示计算机呈现任何图像,以便看起来好像是由特定的人类艺术家以特定的风格创作的。

b377eefb911ce7f573b4f352d1dee799.png

生成照片:生成式AI可以通过生成并叠加到原始任何缺失、模糊或误导性的视觉元素上来自动更正照片,还可以将任何低分辨率原始图像转换为高分辨率版本,也可以通过混合现有的肖像或从任何特定的肖像中抽象特征来产生自然的外观,或者从语义标签中生成逼真的图像。

f149e31697078e2b2ec0ac4ee5fa15ac.png

8235599a4f1ddbbe98f455fbba715495.png

生成音频:生成式AI可以将任何计算机生成的声音渲染成一个真正听起来像是在人类声带中自然产生的声音,也可以将文本翻译成语音、可以组成音乐。

同样,生成式AI也可以生成视频、文本、字幕等。

生成材料:生成式AI甚至可以通过3D打印、CRISPR和其他技术从零开始呈现假肢、有机分子和其他物品。

这也意味着,该技术也会被滥用于诈骗、欺诈、造谣、伪造身份等违法场景。

8cc0a8c9976f7f4d6ce3f7e9d4550162.png率先发力的迪斯尼、Netflix、影谱科技

8fda3db968c96438fb042a673eb49867.png

那么,如今哪些公司在发力生成式AI呢。通过其能生成音视频、字幕等很容易联想到,传媒娱乐公司一定在使用。

的确,包括迪士尼、Netflix等娱乐传媒巨头均在尝试用生成式AI代替标准内容制作。例如迪士尼借助生成式AI生成动画,只需通过文本描述某些活动,而不是注释数据和大量训练就能创建动画、电影剧本视频。

Netflix会借助生成式AI抽取符合观影习惯和需求的画面,然后把这些图片制作成内容封面,以降低内容搜寻难度,提升视频制作效率。

去年9月上市的Unity是3D生成型AI的推动者。全球有超过一半的移动、PC 和主机游戏采用了其生成引擎来制作,其3D-AI技术也广泛应用于工业设计的3D模型搭建,VR/AR设备内容创作以及影视特效制作。

一家名为Insilico Medicine(英科智能)的AI药物研发公司也是生成式AI的应用者。该公司于2014年1月在美国成立(2019年将总部迁到香港),是一家抗衰老及癌症治疗药物研发商,依托基因组学、医疗大数据及AI技术等技术手段,专注于癌症治疗、抗衰老药物的研发、生产及销售,同时面向用户提供健康管理、癌症预防等服务。

160daa4c0dddfa45950d3f2666f342c8.png

2015年,Insilico Medicine在全球范围内率先利用生成对抗网络(GANs)和强化学习(RL)技术,生成具有特定性质的药物分子结构。

同时,Insilico Medicine也是全球第一家应用GANs,以生成具有特定参数的新分子结构在 Oncotarget 及 Molecular Pharmaceutics上发表开创性论文的公司,该公司也在研究癌症、帕金森病、老年性痴呆、渐冻人、糖尿病、肌肉减少症和衰老等新药开发计划。

不止国外。国内的影谱科技在2018年底便发布AGC智能影像生产引擎,这也是国内最早一批借助生成式AI开发的技术框架。

影谱科技的智能影像生成引擎MAGC已率先应用在传媒娱乐领域,被知名电视台、电信运营商、短视频平台广泛采纳。除此之外,MAGC还广泛应用于数字人的3D成像,影视特效制作及数字孪生、虚拟主播、虚拟课堂等数字产权场景。

7cc6213d52bf9cbdb445cee6bb238f04.png

智能影像生成模拟

ZHONGZHIGUANCHA

面向文娱领域,影谱科技打造的智能文娱解决方案可以帮助产业推动视频自动化生产,提高内容生产效率,在视频帧审校、视频过滤、内容推荐到视频审核、视频深度预测、流媒体视频及短视频内容生产、故事可视化等产业环节应用。

面向传媒领域,影谱科技推出的智慧传媒平台服务,从内容创建到分发,形成以元数据为基本单位的一站式智能影像技术服务,提供包括批量化创建智能影像、视频资产管理与分析、智能影像运营、再到智能视频商业化的全过程。

基于影谱科技智能影像技术的AI方案,可在处理新闻、体育赛事等内容发挥作用。例如,实时自动绘制虚拟越位线,包括徽标,识别名人,提取字幕、人物图像等。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

277190cfe7603e8bce95c49f2524ae2e.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/483377.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux的基础知识——IP,UDP和TCP

1.IP协议 IP协议处于网络层,格式如下: 2.UDP UDP协议处于传输层,传输层常用的协议有两种,一个就是UDP,另外一个就是TCP。

从世界数字大脑形成看元宇宙未来趋势

来源:腾云中国科学院虚拟经济与数据科学研究中心研究组成员、远望智库数字大脑研究院院长、腾云智库专家 刘 锋前言:21世纪,科技生态呈现出越来越多的类脑特征,各种前沿科技概念和技术正在形成一个世界规模的数字大脑&#xff0c…

项目:如何快速实现电脑间大文件(lichee.tar.gz)互传?

1.电脑间大文件互传遇到问题 最简单是使用U盘进行大文件互传,但是可能会遇到这种问题,只能取消。 一般我们也可以借助云盘,进行互传。A电脑把电脑上传到百度云盘上,B电脑再下载,但是可能会遇到这种问题。 2.利用IP地…

《复杂》作者梅拉妮·米歇尔发文直指AI四大谬论,探究AI几度兴衰背后的根源...

来源:AI科技评论 作者:梅拉妮米歇尔 论文题目:Why AI is Harder Than We Think论文地址:https://arxiv.org/pdf/2104.12871.pdf关于作者:梅拉妮米歇尔,圣塔菲研究所客座教授,畅销书《复杂》作者…

今天的 IBM —— 一封来自 IBM 董事长、首席执行官 Arvind Krishna 的公开信

来源:IBM中国作者:Arvind Krishna(IBM 董事长、首席执行官)IBM 始终坚信科技的初心——我们将创新用来应对现实世界最具有挑战性的问题,推动商业和社会的双重进步。随着时代的演进,这些现实问题的本质发生了…

近代数学学派知多少?

来源:数学与人工智能1格丁根学派德国19世纪20年代到20世纪20年代,由高斯(Gauss)创始,黎曼(Georg Friedrich Bernhard Riemann)、克莱因(Felix Christian Klein)、希尔伯特&#xff0…

Java学习--内部类

以下复制于 https://www.cnblogs.com/dolphin0520/p/3811445.html 作者:Matrix海子出处:http://www.cnblogs.com/dolphin0520/本博客中未标明转载的文章归作者Matrix海子和博客园共有,欢迎转载,但未经作者同意必须保留此段声明&a…

linux的基础知识——CS模型流程图

1.典型的CS模型流程图 2.服务端需要做的事情 (1)socket():建立服务端套接字; (2)bind():绑定IP和端口号,初始化struct sockaddr_in addr; (3)lis…

Facebook更名“元宇宙”遭质疑,外媒提出三大现实问题

来源:智东西(zhidxcom)整理自彭博社、CNBC、悉尼先驱晨报作者:程茜Meta是拯救Facebook的良方吗?11月5日消息,上周四,Facebook创始人马克扎克伯格宣布更换新品牌,取元宇宙Metaverse的…

JVM核心——JVM运行和类加载全过程

1.类加载全过程 (1)类加载机制 JVM把class文件加载到内存,并对数据进行校验、解析和初始化,最终形成JVM可以直接使用的Java类型的过程。 加载将class文件字节码内容加载到内存中,并将这些静态数据转换成方法区中的运行…

linux网络编程——boa移植

1.boa的介绍 boa webserver 是一个小巧高效的 web 服务器,可运行在 Unix 或 Linux 平台,支持 CGI ,源代码开放;是一个非常适合于嵌入式系统的单任务 http 服务器。 2.boa的下载和安装 2.1 下载 下载地址:boa下载地…

小数据,大前景 !美国智库最新报告:长期被忽略的小数据人工智能潜力不可估量...

编译:莓酊编辑:青暮2021年9月,美国网络安全和新兴技术局(Center for Security and Emerging Technology,简称CSET)发布了研究报告《小数据人工智能的巨大潜力》(Small Data’s Big AI Potential…

Science:穿梭于个体大脑与群体大脑之间探索社会智能

来源:集智俱乐部作者:Julia Sliwa译者:赵雨亭审校:梁金编辑:邓一雪从人类到鱼再到蚂蚁,群居动物在群体中会协调它们的行为,同时,它们的神经系统也可能这么做。然而,迄今为…

linux网络编程——webserver服务器编写

1.HTTP协议 超文本传输协议 2.http请求报文协议 在浏览器上输入http://192.168.0.2:80/hello.txt,浏览器会给服务器发送一个http请求报文,其报文如下。 请求行:GET /hello.txt HTTP/1.1\r\n:GET /请求的文件 协议版本\r\n 请求…

方向对了?MIT新研究:GPT-3和人类大脑处理语言的方式惊人相似

来源:机器之心「人工智能网络并没有试图直接模仿大脑,然而最终看起来像大脑一样,这在某种意义上表明,人工智能和自然之间发生了某种趋同演化。」计算机擅长理解结构化数据,让计算机去理解主要以文化习惯沉淀下来的人类…

linux的基础知识——signal信号捕捉,信号集操作函数

文章目录1.signal捕捉信号2.信号集操作函数3.sigprocmask函数4.sigpending函数5.例子1&#xff1a;打印某个进程未决信号集6.例子2&#xff1a;signal函数的注册捕捉执行函数7.sigaction函数8.信号捕捉特性9.内核实现信号捕捉过程1.signal捕捉信号 #include <signal.h> …

MIT诺奖大牛2万字雄文:记忆的本质

来源&#xff1a;知乎&#xff1a;连玉君Stata专栏-连享会文&#xff1a;Sheena A. Josselyn & Susumu Tonegawa译&#xff1a;C57记忆的神经基础形成记忆的能力是学习和知识积累的关键。然而什么是记忆&#xff1f;长久以来&#xff0c;人们都渴望找到大脑中形成记忆的神经…

如何判断两个IP地址是不是处于同一网段?

个人理解&#xff0c;欢迎指正。 一、要判断两个IP地址是不是在同一个网段&#xff0c;就将它们的IP地址分别与子网掩码做与运算&#xff0c;得到的结果-->网络号&#xff0c;如果网络号相同&#xff0c; 就在同一子网&#xff0c;否则&#xff0c;不在同一子网。 例&#x…

linux的基础知识——时序竞态

文章目录1.pause函数1.1 pause函数例子2.时序问题3.解决时序问题4.例子&#xff1a;sigsuspend函数的举例5.总结1.pause函数 1.1 pause函数例子 \qquad程序依次从1到无穷输出数字&#xff0c;当遇到100的整数倍时就暂停&#xff0c;键盘输入ctrlc&#xff0c;就继续输出。 #in…

深夜文献:2021腾讯科技WE大会硬核复习资料,看看如何烧脑?

来源&#xff1a;腾讯今年的腾讯科学WE大会&#xff0c;再次带着全球顶尖的科学家们&#xff0c;为你贡献了能吃三个多小时的科学盛宴&#xff1a;宇宙起源、黑洞观测、脑机接口、电子皮肤、软体机器鱼、快充电池......听了就很下饭的那种看了直播的同学更赚&#xff1a;这是微…