人工智能艺术的简要时间表

一、简述

        技术在任何形式的艺术发展中始终发挥着关键作用。从通过化学发明颜色到通过数学发现分形:艺术、文化和技术是无法完全分开的三个维度。

        计算机也不例外,它们从一开始就被用来帮助艺术家,常常揭示出我们无法看到的美丽的复杂性。数字和计算艺术领域既复杂又令人着迷,正如它们所使用的技巧和技术一样复杂而令人着迷。

        每一项新的尖端技术一旦成为我们日常生活的一部分,就会很快失去这种地位。我们现在认为调色板是理所当然的,常常忽略了我们需要数千人数千年的努力才能确保我们能够拥有今天所拥有的颜料选择。

        对于人工智能来说,这也不例外。艺术家每天使用许多人工智能驱动的工具和技术,这些工具和技术已经无缝集成到他们的工作流程中。这就是为什么人工智能艺术这个术语——就像人工智能这个术语本身一样——有些误导性。人工智能现在并将永远成为每个依靠现代技术来创作作品的艺术家作品中不可或缺的一部分。改变的往往是我们愿意考虑的“人工智能”,而不是简单的工艺或工程。

        然而,“人工智能艺术”一词目前与一组依赖深度神经网络机器学习来处理图像和视频的特定技术相关。

二、Deep Dreams (2015)

        毫无疑问,人工智能艺术的第一个现代例子就是深度梦想。得益于一篇题为《Inceptionism:深入神经网络》的文章,它们在 2015 年开始流行。他们最初的目的是研究神经网络如何检测图像中的模式。虽然设计了神经网络的架构,但其许多内部工作原理有时很难解读,因为它是称为训练的优化过程的结果。

        深梦之所以如此有趣,是因为他们创造了一种新颖而独特的艺术风格,揭示了神经网络(通常被认为是深不可测的“黑匣子”)实际上是如何工作的。

三、神经风格迁移 (2015)

        第一个深度梦境的发布使许多研究人员能够研究新技术,借助神经网络,这些技术可以将图像不仅仅是像素的集合。艺术风格的神经算法(A Neural Algorithm of Artistic Style)中描述了一种这样的技术,这篇 2015 年的论文使用卷积神经网络以给定绘画的风格重新绘制图像。这种技术以及所有能够使用神经网络“转移”风格的类似技术现在通常被称为神经风格转移

        该技术的工作原理是找到具有与输入相似的大尺度特征,但具有与我们想要复制的样式相似的小尺度特征的图像。在此过程中,该论文的原作者表达了他们对了解人类创造性过程如何运作的兴趣:“鉴于性能优化的人工神经网络和生物视觉之间的惊人相似之处,我们的工作为通过算法理解人类如何创造和感知艺术图像提供了一条道路。”

        原始神经风格迁移技术的一个有趣之处在于,为了“迁移”一种风格,不需要使用相同风格的图像进行训练。这意味着它甚至可以操作从未受过训练或从未见过的绘画。这被称为一次性学习,当人工智能模型达到一定程度的复杂性时,这是可能的。

四、Deepfakes(2017)

        2017 年,当所谓的Deepfakes在互联网上流行起来时,围绕人工智能照片编辑的讨论出现了黑暗的转折。虽然该术语最初指的是特定的深度学习技术,但现在它通常用来指代由深度学习和神经网络支持的任何换脸算法。

        简而言之,深度换脸能够替换视频中某人的脸部,保留原始表情和语音。第一个发布的逼真示例用于制作名人的成人视频。这引发了有关该技术使用的非常激烈且常常是不诚实的讨论。结果,“deepfake”这个词现在似乎永远被玷污了,并且很少在任何积极的背景下使用。

        尽管如此,深度造假以及相关技术在娱乐行业仍具有令人难以置信的潜力。例如,它们可以用来取代演员和替身使用的昂贵的化妆品和假肢,甚至可以自动为其他语言的电影配音。

        而且,以一种颇具争议的方式,它甚至可以用来“数字复活”已故演员,以在死后客串。后者在电影行业已经发生过多次——即使没有深度造假——引发了道德和法律方面的担忧。

五、StyleGAN (2018)

        另一种在深度学习领域变得越来越流行的技术是生成对抗网络(GAN)。在这种架构中,两个神经网络相互训练:一个神经网络学习生成与训练时相似的图像,另一个学习检测哪些图像是原始图像。经过适当训练后,GAN 会学习创建几乎无法区分的新图像

        其中引起媒体关注的第一个用途是StyleGAN ,该技术首次在 2018 年题为“生成对抗网络的基于样式的生成器架构”的论文中提出。StyleGAN 成为头条新闻还得益于出色的“这个人不存在”,该网站每次刷新都会生成一张新人的图片。顾名思义,所有这些高度真实的图像都是使用神经网络生成的,而这些人都不真实存在。

        该网站非常成功(而且其性能很容易复制),以至于在短短几周内就出现了许多类似的网站,生成了猫、马、化学品、房屋、兽等等等等。 这些架构中的微小变化允许对各个功能进行精细控制。例如,可以转移发型、种族背景,甚至可以将两个人“融合”在一起,如 2019 年题为Image2StyleGAN的论文所示:

        传统的视频和图像编辑工具只能将图像视为像素的集合。神经网络具有学习分层语义特征的能力。这使他们能够以传统工具无法做到的方式了解语义结构。简而言之,人工智能工具了解图像内部的内容,并可用于匹配和编辑特征,而不仅仅是像素。

        类似的技术也可以应用于肖像以外的主题。例如,CycleGAN 展示了如何执行所谓的图像到图像转换,以交换图像的特定方面。比如把斑马变成马,或者把风景从夏天变成冬天。

六、文本到图像 (2021)

        大多数读者可能感兴趣的一项技术是所谓的文本到图像(有时是text2image ):从简短描述(称为提示)生成图像的可能性。在撰写本文时,公众可以使用多种不同的产品,其中最受欢迎的是:

  • DALL·E (2021) and DALL·E 2 (2022) by Open.ai
  • Midjourney (2022)
  • Stable Diffusion 2 (2022)

        其中包括Craiyon(以前称为DALL-E mini)。

        这些产品中的每一种都以不同的方式工作,但它们都具有相同的目的:在几秒钟内变出图像:

        毫不奇怪,这项新技术的到来有效地划分了受众。一方面,许多人对这些工具提供的新可能性感到欣喜若狂。另一方面,许多艺术家表达了他们对这项技术可能会对他们找到工作的能力产生负面影响的深切担忧。

        问题变得更加严重,因为为这些工具提供支持的人工智能模型都是基于从互联网上抓取的大量图像进行训练的。虽然所有使用的数据都可以在互联网上公开获取,但并非全部属于公共领域。事实上,人工智能模型也接受了受版权保护的材料的训练,这引发了一些道德和法律挑战。这是一个非常复杂的主题,将在本文后面进行扩展。

        一些人还担心艺术可能会变得只不过是在文本框中写入提示而已。老实说,这是对这项技术的相当幼稚的看法。鉴于目前的方向,人工智能很可能会逐渐在大多数艺术家的工作流程中变得更加重要。但这并不是什么新鲜事,因为技术始终会影响艺术的创作方式。

        实际上,当前可用的所有文本到图像工具都基于以下技术之一:变压器扩散模型。前者用于DALL·E,后者用于DALL·E 2、Midjourney 和Stable Diffusion。

七、ChatGPT (2022)

        然而,过去几年最大的革命之一既不是 DALL·E 2,也不是 Midjourney:而是 ChatGPT。名称中的 GPT 代表Generative Pre-training Transformer,是对该应用程序背后的架构和技术类型的回调。ChatGPT 经过不同主题的大量文本训练,并已被证明具有令人难以置信的理解人类语言的能力,在各种不同的任务中表现出色。ChatGPT 有效地通过了图灵测试,这意味着它(通常)与人类几乎没有区别。

        聊天 GPT 可以理解复杂的序列,无论其上下文如何。这意味着它不仅可以有效地创建文本,还可以有效地创建音乐和代码。尽管大多数人都在考虑图像,但当提到 AI 艺术时,ChatGPT 提出了与其他基于图像的模型相同的道德挑战和问题。出于这个原因,它值得在本文中提及。

        与文本到图像技术相比,ChatGPT(及其竞争对手)可能会改变我们大多数人的工作方式。这是因为它们可以为大多数需要专业知识的流程提供人性化的界面。

        OpenAI 首席执行官 Sam Altman 认为 ChatGPT 等工具将对我们的工作方式产生重大影响:这是一个不断发展的世界。我们都会适应,我认为这样会更好。我们不想回去。

八、不断涌现的大模型

        似乎每周都有一个新的大型机器学习模型成为头条新闻。

        让我们拭目以待。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/723078.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

It is also possible that a host key has just been changed

问题:ssh失败,提示如上图 分析: ssh的key存在上图里的路径里。 解决:win10删这个文件C:\Users\admin\.ssh\known_hosts , linux删这个文件.ssh\known_hosts ,或者删除这个文件里的制定ip的那一行,例如“106.1.1.22 ecdsa-sha2-…

JavaWeb - 2 - HTML、CSS

什么是HTML、CSS? HTML(HyperText Markup Language):超文本标记语言 超文本:超越了文本的限制,比普通文本更强大,除了文字信息,还可以定义图片、音频、视频等内容 标记语言&…

multiprocessing Event实现中断进程或程序

参考:https://www.cnblogs.com/MoKinLi/p/17931515.html import multiprocessing import timedef worker(event, value):while True:# 检查事件是否被设置if event.is_set():# 事件被设置,中断程序break# 模拟工作time.sleep(1)print(f"Working: {…

Excel小技巧 (2) - 如何去除和增加前导0

1. 如何去除前导0 公式:SUBSTITUTE(A2,0,""),然后拖动十字架,同步所有列数据,轻松搞定。 2. 如何补充前导0 公式:TEXT(D2,"0000000") ,0的个数是数字的完整位数。然后拖动十字架&a…

【概要】软件测试

🍉CSDN小墨&晓末:https://blog.csdn.net/jd1813346972 个人介绍: 研一|统计学|干货分享          擅长Python、Matlab、R等主流编程软件          累计十余项国家级比赛奖项,参与研究经费10w、40w级横向 文…

Docker网络配置

目录 一.Docker网络模式 1.1bridge模式(默认模式) 1.2host模式(仅主机模式) 1.3初识网络模式 1.4查看桥接模式的特点 1.5查看仅主机模式的特点 二.Docker桥接模式 三.host模式 四.自定义网络 一.Docker网络模式 Docker在创建容器时有四种网络模式&am…

结合大象机器人六轴协作机械臂myCobot 280 ,解决特定的自动化任务和挑战!(下)

Limo Pro 小车建图导航 引言 前景提要:我们在上文介绍了使用LIMO cobot 实现一个能够执行复杂任务的复合机器人系统的应用场景的项目,从以下三个方面:概念设计、系统架构以及关键组件。 本文主要深入项目内核的主要部分,同样也主要…

四桥臂三相逆变器动态电压恢复器(DVR)MATLAB仿真

微❤关注“电气仔推送”获得资料(专享优惠) 简介 四桥臂三相逆变器 电路 的一般形式如图 1,为 便于分析 ,将其等效成图所示的电路 。以直流母线电压Ud的 1/2处为参考点 ,逆变器三相和零线相 输 出可等效成…

[数据结构]队列

1.队列的概念及结构 队列:只允许在一端进行插入数据操作,在另一端进行删除数据操作的特殊线性表,队列具有先进先出 FIFO(First In First Out) 入队列:进行插入操作的一端称为队尾 出队列:进行删除操作的一端称为队头 2…

基于 HBase Phoenix 构建实时数仓(1)—— Hadoop HA 安装部署

目录 一、主机规划 二、环境准备 1. 启动 NTP 时钟同步 2. 修改 hosts 文件 3. 配置所有主机间 ssh 免密 4. 修改用户可打开文件数与进程数(可选) 三、安装 JDK 四、安装部署 Zookeeper 集群 1. 解压、配置环境变量 2. 创建配置文件 3. 创建新…

mac电脑版MATLAB R2023b for Mac中文激活版

MATLAB R2023b for Mac:科学计算的终极工具 软件下载:MATLAB R2023b for Mac中文激活版下载 🔬 探索科学,无限可能 MATLAB R2023b for Mac,助您深入挖掘科学计算的奥秘。从数据分析、算法设计到可视化展示,…

基于GitBucket的Hook构建ES检索PDF等文档全栈方案

背景 之前已简单使用ES及Kibana和在线转Base64工具实现了检索文档的demo,预期建设方案是使用触发器类型从公共的文档源拉取最新的文件,然后调用Java将文件转Base64后入ES建索引,再提供封装接口给前端做查询之用。 由于全部内容过长&#xff…

YOLO算法改进Backbone系列之:RepViT

摘要:近年来,与轻量级卷积神经网络(cnn)相比,轻量级视觉变压器(ViTs)在资源受限的移动设备上表现出了更高的性能和更低的延迟。这种改进通常归功于多头自注意模块,它使模型能够学习全局表示。然而,轻量级vit和轻量级cn…

《操作系统真相还原》读书笔记四:安装nasm

下载链接:https://www.nasm.us/pub/nasm/releasebuilds/2.13.03/ 下载-解压-安装 tar zxvf nasm-2.13.03.tar.gz ./configure --prefix/home/truthos/nasm/toolchain/make && makeinstall执行make install export PATH/home/truthos/nasm/toolchain/bin:…

微信小程序云开发教程——墨刀原型工具入门(编辑页面)

引言 作为一个小白,小北要怎么在短时间内快速学会微信小程序原型设计? “时间紧,任务重”,这意味着学习时必须把握微信小程序原型设计中的重点、难点,而非面面俱到。 要在短时间内理解、掌握一个工具的使用&#xf…

html标签之表格标签,资料分享

二.准备工作 与中国大部分在校生一样,从不考虑多多参加社会活动为自己铺路,直到找工作时才发现自己一无所有。 是的,一无所有。对于求职来说,如果不找对口工作,那么你的专业知识已经无用武之地。能证明你能力的实践活…

Windows上websocket客户端连接定时存储消息到文件并加载文件定时发送服务端工具实现

场景 在业务开发中,需要对接三方websocket协议数据或者连接并存储线上websocket协议数据,需要使用websocket客户端 连接线上的websocket服务端获取并存储数据,然后将数据存储成文件格式可移植,并将数据复制 到本地,…

MATLAB知识点:while循环的注意事项

​讲解视频:可以在bilibili搜索《MATLAB教程新手入门篇——数学建模清风主讲》。​ MATLAB教程新手入门篇(数学建模清风主讲,适合零基础同学观看)_哔哩哔哩_bilibili 节选自​第4章:MATLAB程序流程控制 在使用while循…

docker 安装rabbitmq并配置hyperf使用

这里我想完成的是 制作消息(多个协程制造)——》推送到rabbitmq——》订阅消息队列——》消费消息(ws协程客户端【一次消费多条】/ws前端) 利用 WebSocket 协议让客户端和服务器端保持有状态的长链接,保存链接上来的客…

阿里云2核4G服务器支持多少人同时在线?

2核4G服务器支持多少人在线?阿里云服务器网账号下的2核4G服务器支持20人同时在线访问,然而应用不同、类型不同、程序效率不同实际并发数也不同,2核4G服务器的在线访问人数取决于多个变量因素: 2核4G:2核CPU和4G内存对…