【GAN入门】生成 AI的概念

一、说明

        GAN是生成对抗网络(Generative Adversarial Network)的缩写,是一种无监督学习算法,由Goodfellow等人于2014年提出。GAN由一个生成器网络和一个判别器网络组成,通过二者之间的对抗来训练生成器网络生成与真实样本相似的假样本。生成器和判别器互相对抗,不断改善自己的性能。GAN广泛应用于图像、语音、自然语言等领域中的生成任务。

二、生成 AI & GAN概述

        GAN 是一类机器学习,可以使用用于训练模型的原始数据集生成新示例。这里有两个神经网络:生成器和鉴别器。在这里,代理人以零和博弈的形式相互对抗,一个代理人的胜利是另一个代理人的损失。生成器的目标是创建与真实数据一样逼真的假数据,而鉴别器的目标是从真实数据中识别假数据。两个网络玩猫捉老鼠的游戏,直到生成器创建鉴别器无法与真实数据区分开来的数据

人工智能(AI)不再是一个未来主义的概念——它正在改变我们今天生活的世界。它使机器能够执行通常需要人类智能的任务,例如识别语音,做出预测和解决问题。它帮助我们做出更明智的决策,并自动执行重复和乏味的任务;更有效地优化运营。

        尽管存在许多AI算法,但一种在行业中引起轰动的AI是生成AI。随着 ChatGPT 和 Midjourney 等生成式 AI 工具的日益普及,用户现在可以比以往更快地生成新的想法、内容和解决方案。

2.1 什么是生成人工智能?

        生成人工智能是人工智能的一个子领域,利用无监督和半监督机器学习技术。生成式 AI 描述了可用于创建全新内容的算法和模型,包括音频、视频、文本,甚至模拟等。

        它具有大量的实际用途,从提高图片分辨率和创建新的商业模式到用于开发医学领域的新药。

        与其他形式的 AI 不同,例如经过训练以进行预测或对数据进行分类的预测或分类模型,生成 AI 模型旨在创建类似于原始输入数据的新数据。

2.2 生成人工智能的模型?

        生成人工智能的一些突出框架或模型是:

  1.         1. 生成对抗网络
    1.         2. 基于变压器的模型
      1.         3. 变速自动编码器
        1.         4. 伯特
          1.         5. 自回归模型

三、生成对抗网络 (GAN)

3.1 了解 GAN的组分

        生成对抗网络 (GAN) 是机器学习和深度学习中的一种人工神经网络架构,由生成器和鉴别器两个神经网络组成,它们在竞争过程中一起训练。生成器尝试生成与真实数据无法区分的数据(例如图像、文本或音频),而鉴别器的任务是区分真实数据和生成的数据。这种对抗性训练过程有助于生成器不断提高其创建越来越逼真的数据的能力。

        想象一下,你想创作逼真的风景画。您决定为此目的使用 GAN。

  1. 生成器(艺术家):生成器就像一个从空白画布开始的艺术家。最初,它会随机生成一个根本不像风景的图像。
  2. 鉴别器(艺术评论家):鉴别器就像艺术评论家。它显示了真实的风景画(来自数据集)和生成器创建的假风景。一开始,鉴别器在区分真画和假画方面很糟糕,因为生成器的工作太糟糕了。
  3. 培训流程:
  • 生成器创造了一个虚假的景观。
  • 鉴别器对其进行评估。如果它检测到它是假的,它会向生成器提供反馈。
  • 生成器使用此反馈来尝试创建更令人信服的景观。
  • 此过程在循环中重复。随着时间的推移,生成器在制作逼真的风景方面变得更好,而鉴别器在分辨真假方面变得更加熟练。

        最终结果:经过多次迭代,生成器变得非常擅长创建风景,以至于鉴别器几乎无法区分真实和生成的绘画。您现在有一个可以制作高度逼真的风景画的 GAN!

3.2 FAN的架构。

        GAN 是一种深度学习架构,由两个协同工作的神经网络组成:生成器和鉴别器。生成器和鉴别器在一个称为对抗训练的过程中一起训练。在训练期间,生成器将随机噪声作为其输入,并将该噪声转换为有意义的输出,即类似于真实数据的假数据。

        至于鉴别器,它接受生成器的输出和真实数据作为输入,如果输入是真的还是假的,则输出概率分数。两个网络一起训练。生成器从鉴别器接收概率分数,作为有关如何提高生成数据质量的反馈,并且循环继续。使用反向传播训练鉴别器以调整其权重和偏差,以最大程度地减少其分类误差。随着生成器的改进,鉴别器性能会下降,因为它不容易区分数据。

        当鉴别器无法确定数据是来自生成器还是实际数据集时,则达到最佳阶段。

3.3  GAN 的生成器和评判器

GAN的体系结构

        在每个GAN中,您提供一个随机噪声种子或潜在向量,它可以是作为噪声作为输入发送到生成器的维度或二维数组。生成器网络放大此阵列以创建伪造的二维图像。现在,假图像和真实图像都被发送到鉴别器网络,该网络经过训练以对真实和虚假图像进行分类。

        根据生成器损耗和鉴别器损耗,对最大周期数进行微调。

3.4 实现 GAN 的 5 个步骤

  • 根据应用定义GAN架构
  • 训练鉴别器区分真假
  • 训练生成器伪造数据,这可以欺骗鉴别器并看起来逼真
  • 继续对多个时期进行鉴别器和生成器训练。
  • 保存生成器模型以创建新的假数据。

        在生成器的训练期间,将鉴别器值保持为常量,而训练鉴别器将生成器值保持为常量。每个人都应该在静态对手下接受训练。

应用

  • 生成假数据以增强其他机器学习算法
  • 生成人脸
  • 图像到图像转换
  • 文本到图像的翻译
  • 超分辨率:获得更高分辨率的图片。

四、GAN的应用。

        GAN 具有广泛的应用,包括以下内容:

1.图像和视频:GAN可以创建逼真的视频和图像,可用于图形和动画。

2. 图像超分辨率:使用超分辨率生成对抗网络 (SRGAN) 提高图像的分辨率

3. 文本到语音转换:GAN 可用于使用 GAN-TTS(文本到语音的生成对抗网络)从提供的文本生成语音

        生成对抗网络是AIML中的强大工具,它彻底改变了机器与数据交互的方式。随着GAN的不断发展和进步,它们将对塑造AI的未来和推动创新产生更大的影响。生成式AI的增长证明了GAN的巨大潜力和影响。

五、表格 GAN(生成 AI)

        表格 GAN 是一种生成对抗网络 (GAN),专门设计用于生成合成表格数据。与图像数据不同,表格数据通常表示为要素矩阵,其中每行表示一个实例或观测值,每列表示一个要素或属性。

        表格 GAN 使用更适合表格数据的架构,例如多层感知器 (MLP) 或带有 1D 过滤器的卷积神经网络 (CNN)。生成器网络将随机噪声向量作为输入,并生成合成表格数据集作为输出。鉴别器网络试图通过输出二元分类分数来区分真实数据和合成数据。

        表格 GAN 的训练过程涉及以对抗方式更新生成器和鉴别器网络,其中生成器尝试生成可以欺骗鉴别器的合成数据,鉴别器尝试正确区分真实数据和合成数据。生成器的目标是最小化鉴别器对合成数据的损失,而判别器的目标是最大化合成数据的损失,最小化真实数据的损失。

        表格 GAN 具有多种应用,例如生成用于数据增强的合成数据集、插补数据集中的缺失值以及生成用于测试和验证目的的数据。但是,它们也有一些局限性,例如,如果训练数据不能代表真实总体,则存在生成有偏见或不切实际的数据的风险。

        #GANs #GenerativeAI

六、生成式 AI:GAN 的验证技术

        生成对抗网络 (GAN) 有几种验证技术,用于评估生成样本的质量和性能。GAN的一些最常见的验证技术是:

  1. 初始分数 (IS):此技术使用预先训练的初始模型来计算用于测量生成图像的多样性和质量的分数。分数是根据生成的图像与真实图像在类分布和视觉质量方面的相似性计算的。
  2. Frechet Inception Distance(FID):该技术还使用预先训练的Inception模型,但计算高维特征空间中真实图像和生成图像的特征表示之间的距离。较低的FID分数表示生成的图像与真实图像更相似。
  3. 精度和召回率(PR):该技术评估生成的样本相对于真实样本的精度和召回率。精度测量与实际样本相似的生成样本的百分比,而召回率测量与生成样本相似的实际样本的百分比。
  4. 目视检查:该技术涉及目视检查生成的样品并将其与真实样品进行比较。这是一种主观技术,但可以为生成的样本的视觉质量和多样性提供有价值的见解。
  5. 用户研究:该技术涉及进行用户研究,以评估生成样本的感知质量和多样性。这种技术更加主观,可能会根据参与者的偏好和偏见而有所不同。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/81590.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用Python实现链式调用

嗨喽,大家好呀~这里是爱看美女的茜茜呐 我们在使用Django的models查询数据库时,可以看到有这种写法: form app.models import XXX query XXX.objects.all() query query.filter(name123, age456).filter(salary999)在这种写法里面&#xf…

AI生成文章-AI文章生成工具

随着社会的发展人工智能技术的突破,越来越多的人开始使用AI来生成文章,但是有一个问题一直困扰着大家:AI生成的文章会不会变得千篇一律,重复无新意呢? AI生成文章的兴起 让我们简要回顾一下AI生成文章的兴起。随着深度…

ES6——知识点记录

这里写目录标题 1.字符串支持1.codePointAt——根据字符串码元的位置得到其码点2.includes——判断字符串中是否包含指定的子字符串3.startsWith——判断字符串中是否以指定的字符串开始4.endsWith——判断字符串中是否以指定的字符串结尾5.repeat——将字符串重复指定的次数&a…

JDBC 学习笔记(基础)

示意图 目录 创建 JDBC 应用 例子:通过本地协议纯 Java 驱动程序实现JDBC 代码具体步骤: 1.注册驱动 2.建立与数据库的连接 3.获取执行SQL语句的对象 Statement 4.定义执行 SQL 语句 5.操作结果集对象 ResultSet 6.关闭操作对象及连接对象 JD…

【Tricks】关于如何防止edge浏览器偷取chrome浏览器的账号

《关于如何防止edge浏览器偷取chrome浏览器的账号》 前段时间edge自动更新了,我并没有太在意界面的问题。但是由于我使用同一个网站平台时,例如b站,甚至是邮箱,edge的账号和chrome的账号会自动同步,这就导致我很难短时…

CSS 实现祥云纹理背景

🪴 背景 最近掘金出来一个中秋创意活动,我准备参加一下。作品方向选择用纯css做一个中秋贺卡,其中有一些中秋的元素和一些简单的动画,而贺卡背景的实现就是本文要讲的内容。 中秋贺卡成果图(生成gif有点失真&#x1f6…

亚马逊鲲鹏系统日程控制功能可自动管理你的买家号

亚马逊鲲鹏系统是一款针对亚马逊买家号功能比较齐全的软件,可以批量注册、智能养号、自动下单、自动留评、QA等,这一系列功能都可以用日程控制进行管理操作。日程控制管理可以让你在吃饭睡觉、逛街玩耍时自动管理你的买家账号。 日程管理功能可以设置每月…

数据结构——二叉搜索树

二叉搜索树是二叉树的一种特殊形式。 二叉搜索树具有以下性质: 1.每个节点中的值必须大于(或等于)其左侧子树中的任何值 2.每个节点中的值必须小于(或等于)其右侧子树中的任何值。 像普通的二叉树一样,我们…

分享美好瞬间,内网穿透工具助您实现公网访问本地私人图床

文章目录 1. 树洞外链网站搭建1.1 下载安装树洞外链1.2 树洞外链网页测试1.3 cpolar的安装和注册 2.本地网页发布2.1 Cpolar临时数据隧道2.2 Cpolar稳定隧道(云端设置)2.3 Cpolar稳定隧道(本地设置) 3.公网访问测试 社交平台具有庞…

《Playing repeated games with Large Language Models》全文翻译

《Playing repeated games with Large Language Models》- 使用大型语言模型玩重复游戏 论文信息摘要1. 介绍2. 相关工作3. 一般方法4. 分析不同游戏系列的行为5. 囚徒困境5.1 性别之战 6. 讨论 论文信息 题目:《Playing repeated games with Large Language Model…

js中运算规则

法: 有对象,对象是根据object.valueof().toString()返回的值 //toString的对象 var obj2 {toString:function(){return a} } console.log(2obj2) //输出结果2a//常规对象 var obj1 {a:1,b:2 } console.log(2obj1); //输出结果 2[object…

uniapp h5 echarts 打包后图表点击失效/及其他失效

文章目录 期望效果实际效果环境引入echarts方式解决方法:注意 原因多说一句在h5打包的时候将 history 改为 hash 不然在浏览器打开后刷新会404 期望效果 实际效果 环境 pc端 window11 hbuilderx版本 3.8.12 echarts版本 5.4.3 引入echarts方式 npm install echar…

华为云云服务器云耀L实例评测 | 从零开始:华为云云服务器L实例使用教程

🌷🍁 博主猫头虎(🐅🐾)带您 Go to New World✨🍁 🦄 博客首页——🐅🐾猫头虎的博客🎐 🐳 《面试题大全专栏》 🦕 文章图文…

阿里云无影云桌面APP客户端下载(无影云电脑)

阿里云无影云电脑APP下载链接入口,支持iOS、Android、Windows、macOS和Web客户端,阿里云百科分享阿里云无影云电脑APP下载链接: 目录 阿里云无影云电脑APP下载链接入口 Windows客户端 macOS客户端 Web网页客户端 iOS客户端 Android客户…

自动驾驶之高精地图介绍

高精地图 文章目录 高精地图前言什么是高精地图高精数据分发引擎1.3 名词解释1. ADAS(Advanced DriverAssistance System)2. 为什么需要高精数据的分发引擎 高精数据分发引擎的建设高精数据分发引擎与ADAS应用的关系高精数据分发引擎架构高精数据分发引擎的模型表达路网模型的抽…

详解API接口如何安全的传输数据

概述 API接口的安全传输是确保数据在API请求和响应之间的传输过程中不被截获、篡改或泄露的重要步骤。以下是一些用于增强API接口安全传输的常见技术和最佳实践: 使用HTTPS:使用HTTPS协议而不是HTTP,以确保数据在传输过程中的安全性。HTTPS使…

软件系统的预算评估方法

软件系统的预算评估是确保项目能够在预定时间和成本范围内完成的重要步骤之一。以下是一些常见的软件系统预算评估方法,希望对大家有所帮助。北京木奇移动技术有限公司,专业的软件外包开发公司,欢迎交流合作。 1.比较估算法: 这是…

JMeter压测工具介绍、安装及汉化教程,详解安装目录结构

🧑‍💻作者名称:DaenCode 🎤作者简介:CSDN实力新星,后端开发两年经验,曾担任甲方技术代表,业余独自创办智源恩创网络科技工作室。会点点Java相关技术栈、帆软报表、低代码平台快速开…

新一代最强开源UI自动化测试神器Playwright(Java版)(对话框处理)

🎭Playwright让网页对话框🌐💬处理变得更加快捷!网页对话框是在网页上出现的常见弹窗,包括Alert、Confirm和Prompt等。这些对话框通常需要用户输入信息或进行某些选择,但是在自动化测试中处理它们可能会很棘…

KVM嵌套虚拟化实现

KVM嵌套虚拟化实现 理论 Libvirt主要支持三种 CPU mode host-passthrough: libvirt 令 KVM 把宿主机的 CPU 指令集全部透传给虚拟机。因此虚拟机能够最大限度的使用宿主机 CPU 指令集,故性能是最好的。但是在热迁移时,它要求目的节点的 CPU 和源节点的…