AIGC智能创作时代一书总结

基准模型:Foundation Model
大模型:Large Language Model,LLM

GAN(2014)、Diffusion(2015)、CLIP(2021)、Seq2Seq(2014)、Attention、Transformer(2017)、GPT(2018)、ChatGPT(2022)、RLHF、BERT(2018)、ViT
styleGAN(2018)、DVD-GAN(2019)

一、GAN:2014 早期AIGC的尝试
(1)GAN综合了深度学习和强化学习思想,由一个生成器和判别器的相互对抗,来实现图像和文字等元素的生成过程
GAN生成对抗过程:1.固定生成器,更新判别器 2.固定判别器,更新生成器,重复迭代达到标准
二、AI绘画
(1)2022.8 Stable Diffusion
Diffusion Model:扩散模型:是一类应用于细粒度图像生成的模型,尤其在跨模态的图像生成中,已逐渐代替GAN行程主流
(2)2021 CLIP:文本-图像预处理模型:用于匹配图像和文本的预训练神经网络模型
三、2017 Transformer
(1)Seq2Seq模型 2014
(2)注意力机制
(3)Transformer
四、GPT
(1)GPT-1 2018.6
(2)GPT-2 2019.2
(3)GPT-3 2020.5
(4)InstructionGPT
(5)ChatGPT 2022.11.30
(6)GPT-3.5
GPT-1:核心思想是将无监督学习作用于监督学习模型的预处理目标,先通过在无标签的数据上学习一个通用模型,然后根据问答和常识推理等特定自然语言处理任务微调模型,半监督学习
GPT-2:在语言模型领域,所有监督学习都可以看作无监督学习的子集,当模型的容量非常大且数据量足够丰富时,无监督学习的语言模型就可以覆盖所有有监督学习的任务
GPT-3:GPT-2的基础上大力出奇迹
InstructionGPT:经过微调GPT-3,可以尽量避免一些具有攻击性、不真实的语言输出,从人类反馈中进行强化学习,Reinforcement learning from human feedback,RLHF
ChatGPT:采用和InstructionGPT同样方式,调整数据集收集方式
Prompt提示词工程师:帮助人类更好地与AI互动
五、BERT模型
BERT变换器的双向编码器表示
ViT 视觉变换器
六、未来
预训练大模型+下游任务微调

1956人工智能这个科学领域正式形成
基于规则、机器学习、深度学习、强化学习、多模态跨模态生成领域
图灵测试:机器是否具备智能,能否判断是人还是机器
符号主义(逻辑判断符号)、联结主义(模仿人类)、行为主义

基于人类通过学习而获得智能,诞生了机器学习
基于人类在学习过程会有激励和惩罚,这些激励和惩罚会不断强化人类的能力,出现了强化学习
基于人类在接受信息时,往往将注意力集中在重要的信息上,产生了当代大模型的根基Transformer
基于人类在学习认图时并非学习照片细节的纹路,而是直接被不断告知关于图片中物体的描述,诞生了AI绘画的奠基性模型-CLIP模型

机器学习:计算机程序能从经验E中学习,以解决某一任务T,并通过性能度量P,能够测定在解决T时机器在学习经验E后的变现提升
机器学习训练过程:数据获取、特征工程(提取数据中的有效特征,并进行必要的转换)、模型训练、评估和应用
输出每个样本数据损失的函数叫做损失函数(Loss function)
所有损失综合在一起的平均情况,反应在代价函数(Cost function),描述训练这一模型产生的错误代价
强化学习:强化学习并不是对数据本身学习,而是在给定的数据环境中,让智能体学习如何选择一系列行动,来达成长期累积收益最大化的目标,强化学习本质是学习一套决策系统而非数据本身

代码开源社区:
(1)Github
(2)Papers with Code
(3)Hugging Face

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/220752.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python numpy 两种方法将相同shape的一维数组合并为二维数组

1 np.column_stack 最简单的一种方法 将多个一维数据按【列】合并为二维数组 import numpy as np# a b 都是一维数组 a np.array((1,2,3)) b np.array((2,3,4))# 变成二维 merge np.column_stack((a,b)) # array([[1, 2],[2, 3],[3, 4]])2 np.hstack 尽管该函数也是对【列…

FPGA乒乓操作详解,知道与FIFO的区别吗?

FPGA乒乓操作是一种高效的数据流控制处理技巧,它主要应用于需要快速且连续数据处理和缓冲的场合。乒乓操作的核心在于利用两个缓冲区交替存储数据流,从而实现数据的无缝实时传输和处理。 本文将详细介绍乒乓操作的基本原理、应用场景以及与FIFO的区别。…

超越GPT-4!谷歌AI大模型Gemini震撼发布

原创 | 文 BFT机器人 在Open AI风头正盛之际,谷歌大杀器终于上线! 当地时间12月6日,谷歌CEO桑达尔・皮查伊宣布正式推出其规模最大、功能最强大的新大型语言模型Gemini 1.0版。 据悉,Gemini 1.0是谷歌筹备了一年之久“对抗”GPT-…

python通过selenium获取输入框的文本值爬取编辑框内容

以百度首页的输入框为例,当输入‘你好‘后,html中的value的值会变成‘你好’ from selenium import webdriver web webdriver.Chrome() web.get(http://www.baidu.com) # 初始页面 cc web.find_element_by_xpath(//*[id"kw"]) #定位输入通过复制xpat…

Excel单元格隐藏如何取消?

Excel工作表中的有些单元格隐藏了数据,如何取消隐藏行列呢?今天分享几个方法给大家 方法一: 选中隐藏的区域,点击右键,选择【取消隐藏】就可以了 方法二: 如果工作表中有多个地方有隐藏的话,…

数据分析基础之《numpy(1)—介绍》

一、numpy介绍 1、numpy 数值计算库 num - numerical 数值化的 py - python 2、numpy是一个开源的python科学计算库,用于快速处理任意维度的数组 numpy支持常见的数组和矩阵操作。对于同样的数值计算任务,使用numpy比直接使用python要简洁的多 numpy使…

二、如何保证架构的质量、架构前期准备、技术填补与崩溃预防、系统重构

1、如何保证架构的质量 -- 稳定性和健壮性 2、正确的选择是良好的开端 -- 架构前期准备 ① 架构师分类:系统架构师、应用架构师、业务架构师 3、技术填补与崩溃预防 4、系统重构

Python创建代理IP池详细教程

一、问题背景 在进行网络爬虫或数据采集时,经常会遇到目标网站对频繁访问的IP进行封禁的情况,为了规避这种封禁,我们需要使用代理IP来隐藏真实IP地址,从而实现对目标网站的持续访问。 二、代理IP池的基本概念 代理IP池是一个包…

RLC防孤岛负载测试的操作和维护

孤岛现象是指当电网因故障或停电而与主电网断开连接时,某些部分仍然保持供电的现象。这种情况下,如果电力系统的保护设备不能及时检测到孤岛并切断供电,可能会导致严重的安全事故。因此,进行RLC防孤岛负载测试对于确保电力系统的安…

flutter学习-day9-基础组件

📚 目录 文本及字体样式各种按钮图片icon 自定义字体图标 单选开关和复选框输入框和表单 TextFieldForm登录界面例子 进度指示器 线形LinearProgressIndicator环形CircularProgressIndicator 本文学习和引用自《Flutter实战第二版》:作者:杜…

亿欧网首届“元创·灵镜”科技艺术节精彩纷呈,实在智能AI Agent智能体展现硬核科技图景

12月4日-10日,持续一周的首届“元创灵镜”科技艺术节在海南陵水香水湾拉开帷幕,虚实交互创造出的“海岛之镜”开幕式呈现出既真实又虚幻的未来感,融入前沿科技元素的艺术装置作品在“虚实之镜&自然生长”科技艺术展诠释着浪漫想象&#x…

linux提取文档第一列内容,删除重复行,统计文件行数

linux shell命令awk 提取文档第一列内容_awk取第一列-CSDN博客 Linux使用awk去掉重复值的几种情况_awk去重复值-CSDN博客 linux 统计文件行数_linux 统计文件行数 命令-CSDN博客 linux shell命令awk提取文档第一列内容 awk {print $1} ../OG0000006.out.blastp.tab > OG00…

C# WPF上位机开发(树形控件在地图软件中的应用)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 前面我们聊过图形软件的开发方法。实际上,对于绘制的图形,我们一般还会用树形控件管理一下。举个例子,一个地图…

功率信号源可以用在工业哪些产品上

功率信号源是一种关键的工业设备,其在各种产品和系统中发挥着至关重要的作用。这些信号源产生电信号,用于测试、校准、仿真和驱动各种工业设备。以下是功率信号源在工业中广泛应用的一些方面。 1.电源测试和校准 功率信号源常用于测试和校准电源系统。在…

pytorch之torch.utils.data学习

1、概述 PyTorch 数据加载利用的核心是torch.utils.data.DataLoader类 。它表示在数据集上 Python 可迭代,支持 map-style and iterable-style datasets(地图样式和可迭代样式数据集), customizing data loading order&#xff…

css/less/scss代码注意事项

一.命名 1.类名使用小写字母,以中划线分割;id 使用 驼峰式命名; 2.less/scss中的函数、混合采用驼峰命名; 3. class 的命名不要使用 标签名,如.p .div .img; 二.选择器 尽量使用直接子选择器,否则,有时会造成性能损耗 .content .title { .…

【Spark精讲】Spark存储原理

目录 类比HDFS的存储架构 Spark的存储架构 存储级别 RDD的持久化机制 RDD缓存的过程 Block淘汰和落盘 类比HDFS的存储架构 HDFS集群有两类节点以管理节点-工作节点模式运行,即一个NameNode(管理节点)和多个DataNode(工作节点)。 Namenode管理文件系统的命名空…

JFlash烧写单片机bin/hex文件

1,安装压 JLink_Windows_V660c,官网可下载; 2,打开刚刚安装的 J-Flash V6.60c 选择创建新工程“Create a new project”,然后点击StartJ-Flash 点击之后跳出Select device框,选择TI 选择TI后&#xff0c…

TypeScript入门实战笔记 -- 04 什么是字面量类型、类型推断、类型拓宽和类型缩小?

🍍开发环境 1:使用vscode 新建一个 04.Literal.ts 文件,运行下列示例。 2:执行 tsc 04.Literal.ts --strict --alwaysStrict false --watch 3:安装nodemon( 全局安装npm install -g nodemon ) 检测.js文件变化重启项…

谈谈数据归一化与标准化

背景: 归一化(Normalization)和标准化(Standardization)是常用的数据预处理技术,用于将不同范围或不同单位的特征值转换为统一的尺度,以便更好地进行数据分析和模型训练。一句话:消…