生成式人工智能如何运作?

一、简述

        生成式人工智能是一种可用于创建内容(包括对话、故事、图像、视频和音乐)的人工智能。人工智能技术试图在图像识别、自然语言处理(NLP)和翻译等非传统计算任务中模仿人类智能。生成式人工智能是人工智能的发展方向。您可以训练其学习人类语言、编程语言、艺术、化学、生物学或任何复杂的主题。生成式人工智能可以重复使用训练数据来解决新问题。例如,学习英语词汇并根据其处理的字词创作一首诗。您的组织可以将生成式人工智能用于各种用途,例如聊天机器人、媒体创作以及产品开发和设计。

        生成式人工智能算法可以用新的方式探索和分析复杂的数据。因此,研究人员可以发现原本可能不明显的新趋势和模式。这些算法可以汇总内容,概述多种解决方案路径,集思广益,并根据研究笔记创建详细的文档。这就是生成式人工智能可极大地增强研究和创新的原因所在。

        例如,制药行业正在使用生成式人工智能系统来生成和优化蛋白质序列,并显著加快推进药物发现。

二、基本运作机制

        像所有人工智能一样,生成式人工智能的运作方式是使用机器学习模型,机器学习模型是根据大量数据进行预训练的超大型模型。

        基础模型(FM)是在广泛的广义和未标记数据上训练的机器学习模型。这些模型能够执行各种各样的一般任务。 FM 是这项已经发展了数十年的技术的最新进展结果。通常,FM 使用学习的模式和关系来预测序列中的下一个项目。 例如,在生成图像时,模型会分析图像并创建更清晰、更明确定义的图像版本。同样,对于文本,模型会根据之前的单词及其上下文预测文本字符串中的下一个单词。然后,模型使用概率分布技术选择下一个单词。

        大型语言模型(LLM)就是一类基础模型。例如,OpenAI 的生成式预训练traneformer(GPT)模型是 LLM。LLM 专门处理基于语言的任务,例如摘要、文本生成、分类、开放式对话和信息提取。 LLM 的与众不同在于它们能够执行多项任务。实现此功能的原因是 LLM 包含许多参数,使其能够学习高级概念。 像 GPT这样的 LLM 可以考虑数十亿个参数,并且能够根据很少量的输入生成内容。通过在预训练中接触各种形式和多种模式的互联网规模数据,LLM 学会了在各种环境中应用它们的知识。

三、主流生成式人工智能模型

        传统的机器学习模型具有辨别性,或者侧重于对数据点进行分类。它们尝试确定已知因素和未知因素之间的关系。例如,这些模型查看图像,即像素排列、线条、颜色和形状等已知数据,然后将它们映射到字词,即未知因素。从数学上讲,这些模型的工作原理是识别可以用数值方式将未知和已知因素映射为 x 和 y 变量的方程。

        生成式模型在此基础上更进一步。这些模型不是在给定某些特征的情况下预测标签,而是在给定具体标签的情况下尝试预测特征。从数学上讲,生成式建模计算 x 和 y 同时出现的概率。该模型学习不同数据特征的分布及其关系。

        例如,生成式模型分析动物图像以记录变量,例如不同的耳朵形状、眼睛形状、尾巴特征和皮肤图案。这些模型学习特征及其关系,以了解不同动物的总体外观。然后,它们可以重新创建训练集中没有的新动物图像。

        接下来,我们给出几大类生成式人工智能模型。

        扩散模型

        扩散模型通过对初始数据样本进行迭代性的受控随机更改来创建新数据。这些模型以原始数据为起点,然后加入细微的变化(噪点),逐渐使其与原始数据不那么相似。这种噪点经过仔细控制,以确保生成的数据保持一致性和真实性。

机器学习笔记 - Stable Diffusion 都使用了哪些技术?-CSDN博客文章浏览阅读2次。Stable Diffusion在2022年8月开源,是由慕尼黑大学的CompVis研究团队开发的生成式人工神经网络。该项目由初创公司StabilityAI、CompVis和Runway合作开发,并得到了EleutherAI和LAION的支持。截至2022年10月,StabilityAI已筹集了1.01亿美元的资金。Stable-Diffusion-WebUI是一个能够在浏览器上运行的网页版,它是一个具有跨时代意义的产品,让普通用户能够真正体验到AI绘画的无限魅力。https://skydance.blog.csdn.net/article/details/139539395        在多次迭代中添加噪点之后,扩散模型反转该过程。反向去噪会逐渐消除噪点,从而产生与原始数据样本相似的新数据样本。

        生成对抗网络

        生成对抗网络(GAN)是另一种基于扩散模型概念的生成式人工智能模型。 GAN 的工作原理是以竞争方式训练两个神经网络。第一个网络称为生成者,通过添加随机噪点来生成虚假的数据样本。第二个网络称为辨别者,其尝试区分真实数据和生成者产生的虚假数据。

机器学习笔记 - 生成对抗网络 (GAN)概述和入门示例_gan网络实例-CSDN博客文章浏览阅读3.2k次,点赞2次,收藏16次。生成对抗网络 (GAN) 是一类功能强大的神经网络,用于无监督学习。它是由 Ian J. Goodfellow 在 2014 年开发和引入的。GAN 基本上由两个相互竞争的神经网络模型组成的系统,它们相互竞争,能够分析、捕获和复制数据集中的变化。在 GAN 中,有一个生成器和一个鉴别器。生成器生成假数据样本(无论是图像、音频等)并试图欺骗鉴别器。另一方面,鉴别器试图区分真假样本。生成器和判别器都是神经网络,它们在训练阶段都相互竞争。重复这些步骤,在这个过程中,生成器和鉴别器在每次重复......_gan网络实例https://skydance.blog.csdn.net/article/details/123602075        在训练过程中,生成者不断提高其创建逼真数据的能力,而辨别者日益加强区分真假数据的能力。这种对抗过程一直持续到生成者产生的数据令人信服,以至于辨别者无法将其与真实数据区分。 GAN 广泛用于生成逼真的图像、风格转换和数据增强任务。

        变分自动编码器

        变分自动编码器(VAE)学习一种称为潜在空间的紧凑数据表示形式。潜在空间是数据的数学表示形式。可以将潜在空间视为唯一的代码,根据数据的所有属性来表示数据。例如,如果研究面部,则潜在空间包含代表眼睛形状、鼻子形状、颧骨和耳朵的数字。

机器学习笔记 - 自动编码器autoencoder_自动编码器自动是什么意思-CSDN博客文章浏览阅读9.4k次,点赞10次,收藏88次。自编码器是开发无监督学习模型的主要方式之一。但什么是自动编码器?简而言之,自动编码器通过接收数据、压缩和编码数据,然后从编码表示中重构数据来进行操作。对模型进行训练,直到损失最小化并且尽可能接近地再现数据。通过这个过程,自动编码器可以学习数据的重要特征。自动编码器是由多个层组成的神经网络。自动编码器的定义方面是输入层包含与输出层一样多的信息。输入层和输出层具有完全相同数量的单元的原因是自动编码器旨在复制输入数据。然后分析数据并以无监督方式重建数据后输出数据副本。_自动编码器自动是什么意思https://skydance.blog.csdn.net/article/details/123567960        VAE 使用两个神经网络 — 编码器和解码器。编码器神经网络将输入数据映射为潜在空间每个维度的均值和方差。该神经网络从高斯(正态)分布中生成随机样本。此样本是潜在空间中的一个点,表示输入数据的压缩简化版本。

        解码器神经网络从潜在空间中获取此取样点,然后将其重新构造回与原始输入相似的数据。使用数学函数衡量重新构造的数据与原始数据的匹配程度。

        基于traneformer的模型

        基于traneformer的生成式人工智能模型建立在 VAE 的编码器和解码器概念之上。基于traneformer的模型为编码器添加更多层,以提高理解、翻译和创意写作等文本式任务的处理性能。

        基于traneformer的模型使用自注意力机制。在处理序列中的每个元素时,这些模型权衡输入序列中不同部分的重要性。 另一个关键功能是这些人工智能模型实现上下文嵌入。序列元素的编码不仅取决于元素本身,还取决于其在序列中的上下文。

        要理解基于traneformer的模型如何运作,可以将语句想象成单词序列。 自注意力可以帮助模型在处理每个单词时将注意力集中在相关的单词上。为获取单词之间不同类型的关系,基于traneformer的生成式模型采用称为注意力头的多个编码器层。每个头都学习关注输入序列的不同部分。这样,模型就可以同时考虑数据的各个方面。 每个层还会对上下文嵌入进行优化。这些层使嵌入的信息更丰富,同时可获取从语法句法到复杂语义的所有内容。

四、技术演变

        神经网络和深度学习是现代生成式人工智能的最新先驱技术。2013 年开发而成的变分自动编码器是第一个可以生成逼真图像和语音的深度生成模型。

        VAE 引入创建多种数据类型创新变体的功能。该功能推动其他生成式人工智能模型的迅速出现,例如生成式对抗网络和扩散模型。这些创新侧重于让生成的数据日益类似于真实数据,尽管这些数据是人为创建的。

        2017 年,随着traneformer的推出,人工智能研究发生进一步的转变。traneformer将编码器和解码器架构与注意力机制无缝集成。traneformer以卓越的效率和多功能性简化语言模型的训练过程。像 GPT 这样的著名模型已成为基础模型,它们能够在广泛的原始文本语料库上进行预训练,并针对不同的任务进行微调。 traneformer变革自然语言处理可能实现的功能。它们为从翻译、摘要到回答问题等任务提供了生成式功能。 许多生成式人工智能模型持续取得长足进步,并且已经形成跨行业应用。最近的创新侧重于完善模型以使用专有数据。研究人员还希望创建越来越类似人类行为的文本、图像、视频和语音。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/24551.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Ubuntu22.04下源码编译安装pythonocc-7.8

Ubuntu22.04下源码编译安装pythonocc-7.8 本文介绍Ubuntu下手动编译安装pythonocc,及安装过程遇到的各种坑 基本依赖安装 sudo apt-get update sudo apt-get install -y wget libglu1-mesa-dev libgl1-mesa-dev libxmu-dev libxi-dev build-essential cmake libf…

如何提高网站收录?

GSI服务就是专门干这个的,这个服务用的是光算科技自己研发的GPC爬虫池系统。这个系统通过建立一个庞大的站群和复杂的链接结构,来吸引谷歌的爬虫。这样一来,你的网站就能更频繁地被谷歌的爬虫访问,从而提高被收录的机会。 说到效…

【机器学习】【深度学习】优化器(Optimizer)

一、概述 什么是优化器? 优化器(Optimizer)是深度学习中的一个核心的概念,用于更新神经网络的权重,以减少或最小化损失函数(loss function)的值。损失函数衡量了模型的预测值与真实值之间的差异,而优化器的目标是通过调整网络参…

CPU内部结构窥探·「3」

加法器的工作原理:从简单的逻辑到现代计算 我们在cpu内部结构窥探「1」中提到CPU内部ALU的核心部件就是运算器,今天就以加法器为例,来讲解我们ALU中算数逻辑运算的过程。 1.认识数字电路中的各种门电路 2. 什么是加法器? 加法器…

Web UI自动化测试_Selenium+Python

一、概述: 1.1 Selenium是什么 Selenium 是一个基于浏览器的自动化工具,可以跨平台、跨浏览器使用。 Selenium 主要包括三部分: 1、Selenium IDE: Firefox 浏览器的一个插件(扩展),它可以进行…

如何检测UV胶的均匀性?

如何检测UV胶的均匀性? 检测UV胶的均匀性可以通过以下几种方法来实现: 肉眼目视检查: 这是最简单直接的方法。将UV胶涂在表面上,使用裸眼观察胶层的表面。特别注意是否存在气泡、颜色不均匀、裂纹或其他明显的不均匀性。如凹凸不…

异步复位和同步释放

文章目录 前言一、为什么需要复位呢?二、同步复位1. 同步复位定义2. 同步复位的实现3. 同步复位的优点和缺点同步复位优点同步复位缺点 三、异步复位1. 异步复位定义2. 异步复位的实现3. 异步复位的优点和缺点异步复位优点异步复位缺点 四、异步复位同步释放1. reco…

Html/HTML5常用标签的学习

课程目标 项目实战,肯定就需要静态网页。朝着做项目方式去学习静态网页。 01、编写第一个html工程结构化 cssjsimages/imgindex.html 归档存储和结构清晰就可以。 02、HTML标签分类 认知:标签为什么要分类,原因因为:分门别类…

关于怎么用Cubemx生成的USBHID设备实现读取一体的鼠标键盘设备(改进版)

主要最近做了一个要用STM32实现读取鼠标键盘一体的那种USB设备,STM32的界面上要和电脑一样的能通过这个USB接口实现鼠标移动,键盘的按键。然后我就很自然的去参考了正点原子的例程,可是找了一圈,发现正点原子好像用的库函数&#…

【计算机网络】对应用层协议中HTTPS协议的总结

˃͈꒵˂͈꒱ write in front ꒰˃͈꒵˂͈꒱ ʕ̯•͡˔•̯᷅ʔ大家好,我是xiaoxie.希望你看完之后,有不足之处请多多谅解,让我们一起共同进步૮₍❀ᴗ͈ . ᴗ͈ აxiaoxieʕ̯•͡˔•̯᷅ʔ—CSDN博客 本文由xiaoxieʕ̯•͡˔•̯᷅ʔ 原创 CSDN 如…

Oracle的优化器

sql优化第一步:搞懂Oracle中的SQL的执行过程 从图中我们可以看出SQL语句在Oracle中经历了以下的几个步骤: 语法检查:检查SQL拼写是否正确,如果不正确,Oracle会报语法错误。 语义检查:检查SQL中的访问对象…

【C++】用红黑树封装map、set

用红黑树封装map、set 1. 红黑树1.1 模板参数的控制1.1.1 Value1.1.2 KeyOfValue 1.2 正向迭代器1.2.1 构造函数1.2.2 begin()end()1.2.3 operator()1.2.4 operator--()1.2.5 operator*()1.2.6 operator->()1.2.7 operator()1.2.8 operator!()1.2.9 总代码 1.3 反向迭代器1.…

规则引擎-Easy rule

规则引擎-Easy rule 最近有几个项目中都出现了根据XX条件执行XX方法的业务,在动手之前脑中总会下意识的发现如果按照常规的去写代码,无论使用何种设计模式,都会出现不同程度上的代码冗余或大量if-else判断。 甚至说判断XX条件的代码和执行X…

2024中国大学计算机科学与技术专业排名(非常详细)零基础入门到精通,收藏这一篇就够了

今天 6 月 8 号,高考第二天,随着大部分地区的高考结束,接下来就是焦急的等待分数的公布,然后学生们就迎来人生中的一个重要时刻——选择大学和专业。 在众多专业中,计算机科学与技术一直是备受瞩目的热门选择&#xf…

【爬虫】使用Python爬取百度学术页面的标题、作者、摘要和关键词

目录 安装所需库编写爬虫代码解释运行脚本结果 在本文中,我将介绍如何使用Python编写一个网络爬虫,从百度学术页面提取研究论文的标题、作者、摘要和关键词。我们将使用 requests和 BeautifulSoup库来实现这一目标。 安装所需库 首先,确保…

uniapp引入uview无代码提示

前提安装正确: 无论是基于npm和Hbuilder X方式安装,一定要配置正确。 解决办法 以前在pages.json里面的写法: "easycom": {"^u-(.*)": "uview-ui/components/u-$1/u-$1.vue" }但是现在hbuilderx要求规范ea…

驱动开发之 input 子系统

1.input 子系统介绍 input 就是输入的意思,input 子系统就是管理输入的子系统,和 pinctrl、gpio 子系统 一样,都是 Linux 内核针对某一类设备而创建的框架。比如按键输入、键盘、鼠标、触摸屏等 等这些都属于输入设备,不同的输入…

Redis到底支不支持事务?

文章目录 一、概述二、使用1、正常执行:2、主动放弃事务3、全部回滚:4、部分支持事务:5、WATCH: 三、事务三阶段四、小结 redis是支持事务的,但是它与传统的关系型数据库中的事务是有所不同的 一、概述 概念: 可以一次执行多个命令,本质是一…

《解决方案架构师修炼之道》读书笔记

1. 水在前面 第一次看到“解决方案架构师”这个词,就把这本书借回家翻了。最近也在网上看点资料,对比起来发现还是出版物内容更完整和更有体系,而且看书真的能让人安静下来。。。 《解决方案架构师修炼之道》所罗伯死里瓦斯塔瓦,内…