AIGC技术带给我们什么?基于AIGC原理及其技术更迭的思考

AIGC技术带给我们什么?基于AIGC原理以及技术更迭的思考

前言

AI,这个词在如今人们的视野中出现频率几乎超过了所有一切其他的事物,更有意思的是,出现频率仅次于这个词的,几乎都会加上一个修饰亦或是前缀——AI,没错,还是它。

正值五一假期,我们试着在网上搜索关键词的相应指数,分别对“ai”和“五一”两个词进行对比,我们发现:顶峰时期的”五一“一词也几乎只是达到”ai“的日常水平。(数据仅供参考,具有极强的范围局限性——尽管如此,我相信人们如今对于ai的讨论已作为家常便饭)

在这里插入图片描述

也许在五年前,不,三年前,AIGC这门技术还并没有起色,甚至可以说在所有技术领域之中并没有得到实际性的应用和实践。但是仅仅过了一两年——也就是在2022年11月30日,ChatGPT的发布彻底改变了人们对AI,对AIGC的看法,甚至可以说它改变了AIGC这门技术的基本含义以及实际意义。
在这里插入图片描述

AI是什么?这个对于我们这些臭写代码的来说并不陌生,其实它的英文本意就已经很好地解释了其功能和意义:Artificial Intelligence,人工智能,即研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。也就是说它是有助于的。

而AIGC就是由AI自动创作生成的内容AI Generated Content)。它即是AI的衍生学科,由AI技术赋能,为了更好地对AI进行探索和发展,人们创造了这门学科。

像我们如今使用的ai工具例如ChatGPT、文心一言、Sora等等,都是基于AIGC技术而产生的应用和服务。可见它致力于为人类提供更好的创造。

如今网络上随处可见的AI生成图片、视频、音乐,AI合成虚拟人,前段日子火爆全球的游戏《幻兽帕鲁》等等,无疑是AIGC所带给人们关注效果最为显著的杰作,也无疑是人们收益颇丰的技术支持,无论是针对开发者还是消费者。它带来了原本应是人类自身所该带来的情绪价值:歌曲的创作,某张历史图片的复原;同时也带来了无限的物质价值:开发者大赚一笔,关注者进行着无意间的流量消费以及资金开销。毫无疑问,AIGC技术给人类社会带来了众多方面的改革和变化,也实实在在地改变了人们看待周遭事物的想法。

但是,随之而来的争议也是滔滔不绝,引发的思考也是源源不断。

”AI生成的艺术作品无法取代人类情绪价值的付出“,”AI并不能取代人类千万年来在社会各个方面的创作以及思考“。人们对于AIGC技术的”入侵“,很难不表现出不适应或者说是不习惯,并且针对其引发的思考也是各执一言,各有看法。那么针对AIGC对于人类社会的浸入,我们究竟该如何看待呢?


AIGC的前世今生:历史变革与技术发展

下图很好地概括了AIGC的前世今生:

在这里插入图片描述

AIGC的发展理论上可以分为三个阶段:早期萌芽阶段(1950s-1990s)沉淀积累阶段(1990s-2010s)快速发展阶段(2010s-至今),但我认为快速发展阶段实际上可以又分为2022年前后两个阶段(ChatGPT的问世带来了新的AIGC)。

总的来说,AIGC的发展历史是随着科技水平和研究技术的改变而改变的,早期的AIGC仅仅只是局限于计算机自主创作以及简单的人机对话,但是并不成熟;后来我认为的一个里程碑事件就是手机的出现带动了语音助手的发展,例如Siri、小米的小爱同学,这些都是基于AIGC技术面向对话的成果,这很大程度表明了AIGC对于人类生活的帮助是不可忽视的,毕竟涉及到物联网、大数据、云等等,都可以与之良好结合。直到后来的ChatGPT,实际上针对这类文本创作助手,早已有相应研究和科研成果,但真正具有跨时代、开辟意义的只在OpenAI的GPT问世,它带来了一个新的变革,一个新的人机对话方式,新的AIGC。

AIGC以其多元化的应用场景、并联使用的技术融合、迎合生活的操控方式,在未来的发展必将不可限量,未来的历史也是历史,将会有更多历史性的事件等待着我们。

AIGC三把斧:AI核心技术

AI的三项核心技术包括:深度学习、神经网络生成式对抗网络(GAN)。而由于AIGC本身就是基于AI的,所以说这三项核心技术同属于AIGC也不为过。当然,更严谨的说法包括基础模型和预训练大模型两个模块,但这是针对模型来进行分类,在此我们介绍的是技术层面。

神经网络

人工神经网络(Artificial Neural Network,即ANN ),是20世纪80 年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象, 建立某种简单模型,按不同的连接方式组成不同的网络。结构类似于像数据结构中的星图。

神经网络模拟的就是人类的神经网络,它的不同点犹如神经元,可以接受和传递信息,它的不同线由于神经纤维,可以控制信息的流动。

深度学习

深度学习(DL,Deep Learning)是机器学习(ML,Machine Learning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(AI,Artificial Intelligence)。

为了完善和加强神经网络,深度学习将其分为多层从而进行分工合作,犹如大脑中的不同区域负责不同的功能。这样做的目的是使机器能够更加有规律和高效地处理和理解问题。

在这里插入图片描述

生成式对抗网络(GAN)

近年来,深度学习在很多领域的都取得了突破性进展,但大家似乎发现了这样的一个现实,即深度学习取得突破性进展的工作基本都是判别模型相关的。2014年Goodfellow 等人启发自博弈论中的二人零和博弈,开创性地提出了生成对抗网络(GAN)。

GAN包括了一个生成模型(Generator)和一个判别模型(Discriminator),前者的作用是创造,例如文本作品、歌曲等;后者的而作用是判断,用于判断这些作品是否是真实存在的(否则是生成模型所产生的)。

可以这么理解:生成器和判别器互相对抗和挑战,从而更好地完善自己,在努力朝着生成器不被判断器识别出、判断器总是能识破生成器的方向前进——这似乎在趋于一个中间的平衡,但二者实际上是互相矛盾的。

在这里插入图片描述

AIGC技术在各领域的应用

我们先来探讨一下AIGC的技术应用
人工智能生成内容技术AIGC)作为人工智能领域的重要分支,其在各个领域的广泛应用潜力难以估量。其主要的应用在于以下几个方面:

  1. 内容创作:AIGC技术被广泛应用于新闻报道、广告文案、电商商品描述等领域,能够快速生成大量高质量的内容,提高创作效率。
  2. 营销推广:在商业领域,AIGC技术被用于生成个性化的营销内容,根据用户数据和行为进行精准定制,提升品牌曝光和用户参与度。
  3. 客户服务:许多企业利用AIGC技术开发智能客服系统,能够自动回复用户问题、提供产品信息和解决常见问题,提升客户服务效率。
  4. 教育领域:AIGC技术被应用于智能辅导系统,能够根据学生的学习情况生成个性化的学习内容,提高学习效果。
  5. 医疗领域:在医疗影像诊断和疾病预测方面,AIGC技术也发挥着重要作用,能够帮助医生更准确地诊断疾病和制定治疗方案。

不知道你是否能够看出来,对于应用的介绍是使用ChatGPT写出来的。不夸张地说,它确实将AIGC的应用进行了大致的概括,并且较为全面——这也基于我给它提供的几个提示词:简短以序号形式——是的,仅仅是如此简单的几个词,我们就可以对其语言风格以及输出内容进行控制和管理。而这,实际上就是AIGC的最为核心的应用,可以说AIGC技术就是围绕它来展开的——内容创作

1.内容创作

像例如ChatGPT这类的文字创作工具,它们被用于内容创作,服务的对象是整个人类群体——因为人类社会离不开文字。音乐、影像同样是这样。

在生成式AI技术的使用中,又包括以下几个方面:

1) 文本生成

不可否认的是,AI生成的速度相较于人类作者更快、更高效,而生成内容的质量也是基于已有的数据支持,具有一定的权威性和真实性。在文本上的使用通常会有益于作家、博客、代码编写者等等。对于他们来说,AIGC助手的帮助让他们写作的效率大大提高,避免了冗长不必要的内容书写,并且还能帮助他们润色自己的文章,提高代码的可读性和健壮性等。除此之外,由于AI对于数据的收集范围之广,甚至能够轻松地通过各种面向人类的考试,例如心理类,法律类等等,所以它同样也可以勉强担当一个心理治疗师、律师甚至是朋友(当然,只要你可以接受你的朋友只是一个对话框)。

2) 音频生成

包括语音合成、音乐创作和声音设计等等,Suno等音乐创作 AI 程序允许用户使用 AI 创建原创音乐曲目。经过观察,我们会发现AI赋能音乐创作确实能够出现某些效果超群、技术高超的编曲,例如这首原本传统的《春天在哪里》,作为音乐爱好者,不得不说它的爵士乐味道十足,并且似乎还有自己独到的见解。

【suno ai】春天在哪里,但是ai版_哔哩哔哩_bilibili

除了音乐创作之外,语音合成和声音设计等等,也是AIGC技术在音频方面不可忽视的应用。

3) 图像生成

将草图转换为数字绘制的图像,其实本质上起到修饰的作用,但是延伸出了包括视觉艺术、广告设计、游戏场景等等方面的创作协助,这无疑给众多行业带来一个巨大的Pandora’s box,毕竟还有那么多的美术创作者,或许还在为如何塑造好的线条美感而烦恼,而如今AIGC已经较好地解决了这个问题。

4) 视频生成

人工智能生成的视频同样不能忽视,虽然目前仅仅支持无声视频,这实际上并不等同于完整的视频;如今市面上出现的许多由AI独立生成的具有指定风格的视频,让人难以辨认其真假(指是否为人创作);而事实上,这个问题在整个AIGC的应用中都频频出现,这是难以避免的。

5) 跨模式生成

AIGC中的跨模态内容生成是指使用基础AIGC模型跨多种模态生成新内容。它包括文本到图像、图像到文本、文本到代码、文本到视频、文本到音频等。像ChatGPT提供的语音对话助手,它基于文本创作,再结合了人类说话的特点,可以模仿人类的口吻完成对话,甚至连话语之间的吸气声也不会漏掉,这就是文本到音频的跨模式生成的典型例子。

6)虚拟人的诞生

AIGC可以生成具有逼真表情或者动作的虚拟人,而这实际上是集合了上述几乎所有应用综合生成的一大产物,可以想象《银翼杀手2049》中的场景离自己如此之近(相对从前)。

2.其他应用

基于内容创作,衍生出的其他应用实际上可以认为是覆盖到人类生活的各个方面。在医疗方面,通过大数据广泛吸纳各个方面的医学知识,医生可以仅仅通过一句提问就得到专业性的回答,对症下药,当然这只是最浅显的应用。像病情分析,患者医疗方案制定等,更是有分化的不同使用,例如:利用生成式人工智能(AIGC)解决『医疗领域』的痛点和难题 - 知乎 (zhihu.com),这篇文章很好地展示了临床医生和患者之间互动记录的全过程,解决了原本需要消费巨大人工成本的难题以及记录的准确性和完整性。在营销推广方面,广告版面的设计,广告语的修饰,针对用户群体生成个性化的营销方案,博人眼球、吸引用户,颇有成效。
在这里插入图片描述

在教育和服务业方面,AI的赋能可以帮助教师和服务业人员优化他们的教案和服务制定方案,同时像一众的AI软件也是服务业面向AI创作的产物,毕竟,AIGC本身就是为了更好地服务于人,优化人的工作的技术。值得一提的是,随着网购行业和直播流的发展,客服实际上是一个十分重要且需要精确度的岗位,而AI恰好能够较好地解决大部分繁琐、常见、无需人工的问题,这也给服务业带来了巨大的发展。

这仅仅只是AIGC应用的冰山一角,实际上我们人类目前对于AI的探索也仅仅只是管中窥豹,毕竟AI的处理中枢就是由各种数据和算法构成的一个近似人类大脑的集成系统,而我们甚至对自己的大脑都没有彻底探索清楚,那么对于AI的开发之路也就道阻且长了。

AIGC的舆论危机

其实不难看出,AI技术的发展一直都在遭受着舆论的危机,而这也将是决定其发展方向的一重要因素——这是不可避免的。既然我们创造了它,那么我们也可以操控它。这或许是我们创造这门技术的理想方向,也是我们需要努力在其飞速发展的过程中渴望一直秉持的操作。

知识产权的侵犯,无休止的侵权风波

由于AI基于大数据的收集,那么必然避不开任何数据的使用和借鉴,这也就必然会涉及到知识产权的侵犯问题——然而这个界限是模糊的,是无法模棱两可的。你可以说是因为这种行为目前已经泛滥成脏无可休止,也可以说产权持有者对于这种行为的处理的乏力和漠不关心——你甚至可以说这还是一种宣传知识的行为。这种不清晰的界限导致这个问题难以得到清晰的解答。

虚假内容的传播,犯罪的幕后黑手

AI或许不会真正意义的说谎,但人类可以告诉它虚假的事实,而它恰好可以编造更为逼真的事实。大范围的虚假内容传播会导致事实不再那么透明,真相被不明掩盖。更何况它有可能带来犯罪。我国实际上已经有了相关的法律规定:《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂行办法》等等,人民法院官方甚至也发表了对有关人工智能法律问题的思考。这些现象无不表明政府正在逐渐重视针对AI的法律体系完善和改进,而这也将成为今后限制AIGC技术发展的一大决定性因素(同时也是必不可少的)。

在这里插入图片描述

隐私问题:数据的收集

我们知道,AIGC技术的可行性在于海量数据的提供,那么它势必会涉及到个人数据的隐私问题。由于人工智能本身对数据的索取之深,再加上人们对大数据决策产生深度依赖,对于自身的数据的丢失的概念不够清晰,那么隐私问题必然是层出不穷的,这实际上是不可避免的,当然你可以认为只要不危害自己的生活,数据的泄露和滥用也就对自己影响不大,虽然话可以这么说,毕竟AI所做的只是数据的收集,而至于对于数据的使用,可能就需要法律来规范了。无论如何,我们还是要尽量保护自己的隐私权不受侵犯,尽量保护自己的基本权利。

道德危机,人类与AI的博弈

这是最为老生常谈的一个问题。人类总是在以高昂的姿态前进,在此之前从未有过超越人类本身的、人类自己创造的产物出现,而如今AI的出现,恰似棋逢对手,虽然是“我诞生了你”,但是“你未必就劣于我”。必然会造成很大的舆论危机和伦理问题的讨论。人类和技术之间实际上是一种共生关系。这是凯文凯利的观点。人类创造了人工智能,但也要学会与其和平共处,它在各方面的渗透之深也表明了——如果不与其保持良好的和谐关系,将会造成的问题是谁也不敢设想的。我们生活在一个高速发展的社会,但同样道德和伦理也限制着我们发展的速度和方向,但AI或许在某些方面的准则与我们人类并不一致,这也就间接导致了我们在与其共生的过程中所要注意的问题和界限。或许我们可以通过技术来告诉AI应该怎么做,应该遵循什么原则,但是要形成一套完整的、不出差错的体系是非常之难的——毕竟我们人类自己都没有形成一套完全相同的道德体系和认知观念。所以,我相信关于这些问题的争论会一直持续,我们只有不断试错和改进,才能朝着完美的方向前进,至于能否达到,一切未知。

AI的未来

如今我们再看文章开头的那个问题:那么针对AIGC对于人类社会的浸入,我们究竟该如何看待呢?

实际上仅凭我一家之言是根本无法回答的,甚至可以夸张地说,没有经历时间的检验,这个问题谁也无法给出准确的答案。毕竟,未来还未来临。所以,既然这门技术已经出现了,我们无法避免不跟随社会不断前进的脚步,否则会脱轨;我们也无法不陷于这个满是AI的世界,毕竟新的时代已经到来,就跟二十年前的互联网时代一般,那个时候人们同样有着针对互联网的疑问:将世界仅通过那么细的网线连接,如此神奇之技术究竟会给人类社会带来什么?

其实,我们现在也只能发出同当年一样的疑问:

现了,我们无法避免不跟随社会不断前进的脚步,否则会脱轨;我们也无法不陷于这个满是AI的世界,毕竟新的时代已经到来,就跟二十年前的互联网时代一般,那个时候人们同样有着针对互联网的疑问:将世界仅通过那么细的网线连接,如此神奇之技术究竟会给人类社会带来什么?

其实,我们现在也只能发出同当年一样的疑问:

AIGC如此神奇之技术究竟会给人类社会带来怎样的发展和变革呢?让我们拭目以待。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/833184.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ROS机器人实用技术与常见问题解决

问题速查手册(时实更新)更加全面丰富的问题手册记录 1.机器人使用GPARTED挂载未分配空间 需要在图型界面下操作,建议使用no machine连接 安装gparted磁盘分区工具, sudo apt-get install gparted -y 启动软件 sudo gparted 点击磁盘/内存…

如何使用vue脚手架创建项目

前言 使用vue搭建项目的时候,我们可以通过对应的cmd命令去打开脚手架,然后自己配置对应的功能插件 说明: 要使用Vue脚手架创建项目,你需要先确保你已经安装了Node.js和npm(Node.js的包管理器)。然后&#…

热敏电阻怎么进行性能测试?并以LabVIEW为例进行说明

过程也可用于执行热敏电阻测量。RTD和热敏电阻遵循非常相似的功能原理,测量步骤与下面提供的步骤相同。有关热敏电阻的更多信息,请参阅本文档。 查找设备引脚排列 在连接任何信号之前,请找到您的设备引脚排列。 打开NI MAX并展开设备和接口。…

视频素材库在哪里找免费手机版?8个可以用手机浏览的素材网

在视觉内容占据主导地位的今天,合适的视频素材可以大大提升项目的吸引力和效果。以下列出的视频素材网站为广告制作者、社交媒体策略师及电影制作人提供了从传统到现代风格的各种视频素材选择,满足不同的创作需求。 1. 蛙学府(中国&#xff…

PyGame 文字显示问题及解决方法

在 Pygame 中显示文字时可能会遇到一些问题,例如文字显示不清晰、字体不正确或者文字位置不准确等。以下是一些常见的问题及其解决方法,具体情况可以看看情况。 1、问题背景 一位用户在使用 PyGame 库进行游戏开发时,遇到了一个问题&#xf…

服务器关机前未退出xampp导出MySQL无法启动

背景解决 五一放假,服务器关机了,但是关机前没有正常关闭数据库服务,导致数据库无法启动! 查看错误日志如下 从报错信息可以看出是MySQL这个服务相关文件出现问题了,解决思路:重新安装xampp 重新安装xam…

automa警惕通过点击元素打开新的标签页,因为你可能会被他蒙蔽!

大家好,我是大胡子,专注于研究RPA实战与解决方案。 我们经常用到automa里面的【点击元素】组件,但要警惕通过点击元素打开新的标签页,例如下面这个场景,点击公众号的图文消息,之后,要自动输入标…

self-attention 的 CUDA 实现及优化 (上)

self-attention 的 CUDA 实现及优化 (上) 导 读 self-attention 是 Transformer 中最关键、最复杂的部分,也是 Transformer 优化的核心环节。理解 self-attention ,对于深入理解 Transformer 具有关键作用,本篇主要就围绕 self-attention 展…

QT--2

Qt界面设计 #include "widget.h" #include "ui_widget.h"Widget::Widget(QWidget *parent): QWidget(parent) {//窗口相关设置this->resize(680,520);this->setFixedSize(680,520);this->setWindowTitle("Tim");this->setWindowFla…

ILI9341显示驱动芯片的使用

ILI9341是一种常见的TFT LCD显示驱动芯片,它在众多的应用中都有广泛的使用。这种芯片的一个显著特点是它支持16位RGB565颜色,这意味着它可以显示多达65536种不同的颜色。这使得ILI9341能够提供鲜艳、生动的色彩效果,对于需要表现丰富色彩的应…

【进程终止】退出信号 | 三种退出情况 | 如何进程终止returnexit_exit

目录 退出码 退出信号 进程终止情况3 如何进程终止 return退出 库函数exit 系统调用函数_exit ​exit和_exit的区别缓冲区 exit _exit 退出码 回顾上篇 代码跑完,结果正确(退出码为0)代码跑完,结果不正确(退…

SpringDI方式及Redis应用场景的分享

1、为什么Spring和IDEA 都不推荐使用 Autowired 注解 大家在使用IDEA开发的时候有没有注意到过一个提示,在字段上使用Spring的依赖注入注解Autowired后会出现如下警告Field injection is not recommended (字段注入是不被推荐的);但是使用Resource却不会…

Python基础详解二

一,函数 函数是组织好的,可重复使用的,用来实现某个功能的代码段 def myMethod(data):print("数据长度为",len(data))myMethod("dsdsdsds") 函数的定义: def 函数名(传入参数):函数体return 返回值 def m…

关系型数据库MySQL开发要点之多表设计案例详解代码实现

什么是多表设计 项目开发中 在进行数据库表结构设计时 根据数据模型和业务关系 会根据业务需求和业务模块之间的关系分析设计表结构 由于业务之间互相关联 所以表结构之间也存在着各种联系 主要分为以下三种 一对多 每个部门下是有多个员工的 但是一个员工只能归属一个部…

CMakeLists.txt语法规则:foreach 循环基本用法

一. 简介 cmake 中除了 if 条件判断之外,还支持循环语句,包括 foreach()循环、while()循环。 本文学习 CMakeLists.txt语法中的循环语句。 CMakeLists.txt语法中 有两种 循环实现方式:foreach循环与 while循环。 二. CMakeLists.txt语法规则…

免费https证书申请

HTTPS证书,也称为SSL证书(Secure Sockets Layer)或TLS证书(Transport Layer Security),是一种数字证书,用于在互联网通信中确保数据传输的安全性、完整性和真实性。它是基于公钥基础设施&#x…

RISCV 外部GCC 工具链安装@FreeBSD15

在交叉编译的时候,可以使用FreeBSD15默认的工具链:LLVM 也可以使用GCC工具链,GCC可以使用现成pkg包安装,也可以编译安装。 LLVM的特点是高移植性和高效,但学习成本高。GCC的特点是成熟稳定,但优化能力有限…

基于FPGA的数字电子钟VHDL代码Quartus仿真

名称:基于FPGA的数字电子钟VHDL代码Quartus仿真(文末获取) 软件:Quartus 语言:VHDL 代码功能: 数字电子钟 1)设计一个能显示秒、分、时的24小时数字钟 2)用数码管显示出时,分,…

Unity射击游戏开发教程:(10)创建主界面

主界面开发 玩游戏时,主菜单是事后才想到要做的。实际上几乎每个游戏都有一个主界面。如果你点击打开游戏并立即开始游戏,你会感到非常惊讶。本文将讨论如何创建带有启动新游戏的交互式按钮的主界面/主菜单。 主菜单将是一个全新的场景。我们将添加一个 UI 图像元素,并在图像…

java中的变量、数据类型、人机交互

变量 变量要素 1、类型;每一个变量都需要定义类型(强类型)其它语言有弱类型(js) 2、变量名; 3、存储的值; 声明方式: 数据类型 变量名 变量值; public static vo…