8.扩散模型的未来---GPT及大模型(3)完结

涌现能力
        在自然语言处理领域中,涌现能力(EmergentAbility)是指在训练模型时,模型可以自主地学习到新的任务或功能。换句话说,涌现能力是指模型具有自学习的能力,可以在没有额外训练数据的情况下,自主地实现新的任务或功能。涌现能力的实现基于模型的泛化能力和模型的表示能力。模型的泛化能力指的是模型在训练集和测试集之间的性能表现。模型的表示能力指的是模型可以在训练集中学习到的语言表示和结构。如果模型具有足够的泛化能力和表示能力,那么它就能够在新的任务或功能出现时自主地学习到这些任务或功能,而无须重新训练模型。

        从 GPT-1、GPT-2、GPT-3的发展历程可以发现,随着模型规模的增大,GPT在极少甚至没有提示的情况下解决新问题的能力在逐渐提升。Wei等人发现,随着规模的增大,模型会出现涌现能力,即小模型没有而大模型有的能力。例如,当型没有达到一定规模前,其在Few-shot 情形下的回答随机性较大,而当模型规模突破了临界点后,其 Few-shot能力会大幅提升。可以看出在模型达到一定规模之前的表现和随机模型样,但是到了一定规模之后,模型的表现显著提高并远远高于随机结果。

        在 BIG-Bench上,GPT-3和LaMDA 在未达到临界点时,模型的表现都接近于零。而当GPT-3的规模突破训练一定效率时,LaMDA的规模突破也突破一定训练效率时,模型的表现开始快速上升。这些结果说明,必须要有一定规模的模型才能让机器拥有自能。

        扩散模型的未来GPT及大模型下面介绍 GPT-3的模型参数和训练参数。GPT3有96个注意力层,并且每层有96个注意力头。词嵌入的维度从“1600”提升为“12888”,上下文窗口为2048个词长。此外,GPT-3还使用了稀疏注意力模块,降低了计算复杂度,仅关注相对距离不超过k和相对距离为2k、3k等的字符。稀疏注意力有局部紧密相关和远程稀疏相关的特性,对距离较近的上下文关注多,对距离较远的上下文关注少。除此之外,与GPT2本相同。GPT-3的训练数据集为5个不同的库,每个库都有特定的权重,高质量的据库采样量大,模型会被训练更多的“epoch”。这些数据库为common craw1、webText2、Booksl、Books2和 Wikipedia。总体数据量为 GPT-2的 10 倍以上实验结果表明,不论是“Zero-shot”还是“Few-shot”,GPT-3在多个任务中的表观比原来的 SOTA 更好。对于部分数据库上的任务,虽然 GPT3不能打败 SOTA,但是比Zero-shot 的 SOTA 表现得更好。在绝大多数情况下,在Few-shot情形下 GPT-的表现比在 One-shot 情形下表现得更好。但 GPT-3 仍有其局限性和可能的不良影响。虽然GPT-3可以生成高质量文本,但是当生成长句子时,它会出现前后矛盾或者重复的情况。GPT-3在自然语言推断中的表现不好,无法确定某个句子是否提示了其他语旬。此外,因为在训练时所有词被同等看待,所以对于一些无意义的词或者虚词也要很多计算量去计算,无法根据任务特点或者目标导向处理字符。另一方面,由于GPT-3 过于庞大、推断耗费较大,并且难以解释其机理,我们并不清楚 GPT-3是在“记"还是在“学习”。对于少样本学习,我们并不清楚什么样的示例和提示会起作用。最后一点,GPT-3可以生成以假乱真的新闻稿,这就意味着GPT-3存在传递错误信息和不实消息,并用于作假、生成有偏见的文本的风险。
InstructGPT和 ChatGPT
        虽然GPT-3在各大自然语言处理任务,以及文本生成的任务中令人惊艳,但是它还是会生成一些带有偏见的、不真实的、有害的、可能造成负面社会影响的信息。由于预训练模型是超大参数量级的模型在海量数据上训练出来的,与完全由人工控制的专家系统相比,预训练模型就像一个黑盒子。没有人能够保证预训练模型不会生成包含种族歧视、性别歧视等的危险内容,因为在几十 GB 甚至几十 TB 的训练数据理很可能会包含类似的训练样本。此外,GPT-3并不能按人类喜欢的表达方式去做出题,我们希望模型的输出可以与人类真实意图“对齐”(Aigmment),也就是说让语言模型的生成结果和人类的意图相匹配。这也是创造InstructGPT的初衷,InstructGPT的作者对其设置的优化目标可以概括为“3H”:Helpful(有用的)、Honest(可信的)和 Harmless(无害的)。为了实现 3H,InstructGPT在 GPT-3 的基础上进行微调,其训练方式可以分为3个步骤:1.有监督微调;2.奖励模型训练;3.强化学习训练。ChatGPT就是采用的和InstructGPT一样的技术方案开发出来的。实际上我们可以将其拆分成两种技术方案,一种是有监督微调(SFT);另一基于人类反馈的强化学习(RLHF),包合训练奖励模型并进行强化学习训练,下面们将介绍这两种技术方案。
        例如,在Few-shot 设置中,GPT-3对于同一个下游任务,通常采用固定的任务播方式,但这与真实场景下用户的使用方式存在较大的区别。一般来说用户在使用GPT-3时不会采用固定的任务表述,而是根据自己的说话习惯去表达某个需求。在训练过程中,首先从用户的真实请求中采样下游任务的播述,然后标注人员对任务描述进行续写,从而得到对问题的高质量回答,最后使用真实任务和真实回咨对模型进行微调。
        基于人类反馈的强化学习,简单来说就是对GPT生成的内容进行打分,符合标准的回答给予较多的回报,鼓励模型生成这种回答,对于不符合标准的回答给予较少的回报,抑制模型生成这种回答。给予人工评分的强化学习效率低、消耗资源大,其替代方案是训练一个奖励模型来模拟人类打分。具体方法就是,对同一个问题让模型生成一些文章,请评分人员对这些文章根据内容好坏进行排序,然后训练奖励模型模拟人类的评价结果。训练的目标函数就是简单回归任务的目标函数,但是为了能够适配GPT生成文本的多样性和复杂性,奖励模型一般会采用并生成与模型体量一致的模型。训练完成后,就可以用奖励模型代替人工对GPT进行强化学习训练了。具体来说,使用GPT生成一篇文章,然后使用奖励模型对其摘要进行打分,然后使用打分值,并借助PPO(Proximal Policy Optimization)算法优化 GPT。

        实验结果表明,标注人员明显感觉InstructGPT的输出比GPT-3的输出更好,1.3B的InstructGPT就能带来比175B的SFT更好的体验。此外,InstructGPT在真实性丰富度上表现得更好,并且对有害结果的生成控制得更好。这种提升是自然的结果因为人工续写微调,以及强化学习训练会促使模型生成真实的样本,避免有害样本但是InstructGPT 对于“偏见”没有明显改善,有时会给出荒谬的输出,这可能是受限于纠正数据的数量。此外,即便是优化了损失函数,mstrnucGPT仍会降低模型在通用自然语言处理任务上的效果。
 Visual ChatGPT
        前面所说的GPT 技术都是应用于自然语言场景中的,在实际的生产、生活还需要多模态的输入、输出形式来满足不同的需求。Visual CHATGPT是一种结合了CHATGPT和视觉基础模型(Visual Foundation Mode,VEM)的多模态同答系统。视觉基础模型一词通常用于描述计算机视觉中使用的一组基本算法:包括Stable Diffusion ,BLIP,controlNet 等。这些算法用于将标准的计算机视觉技能转移到人工智能应用程序中并作为更复杂模型的基础。VisualChatGPT将一系列视觉基融模型接入CHATGPT,使用户能够与ChaGPT以文本和图像的形式交互,并且提供复杂的视业指令,让多个模型协同工作。也就是说,它不仅可以像ChatGPT那样实现语音问答,还可以根据输入的图片实现视觉问答(VQA)、生成和修改图片、去掉图片中不需要的内容。 VisualChatGPT 可以理解用户的指令(如搜索、查询),并且具有修改和改进输出的反馈回路,可根据反馈进行调整和提高。Visual ChatGPT 的系统架构由用户查询(User Query)模块、提示管理(PromptManager)模块、视觉基础模型(VEM)、调用ChatGPTAPI系统和选代交互(fterativeReasoning)模块、输出(Outputs)模块构成。其中 ChatGpT 和 Prompt Manager(负责意图识别和语言理解,并决定后续的操作和产出。本节将结合 GPT及大模型来对扩散模型未来的研究方向进行简要阐释,主要从模型的算法研究和应用范式两方面进行分析。

        从算法的研究上来看,扩散模型与chatgpt及大模型一样都是生成式预训练,关于扩散模型可能的研究方向有以下几个:
        (1)当训练数据量和模型参数数量不断上涨时,gpt及大模型的表现会呈现出上涨的趋势,并在达到某一个点时发生突变,也是拥有“涌现能力、扩散趋有同样的上涨趋势,以及是否会有涌现能力是值得探索的,但是由于扩散模型的训练是非常消耗资源的,所以增大模型参数训练的优化问题也需要考虑进来。

        (2)CHATGPT等应用拥有卓越性能的一大原因是,在其模型训练过程中加入了基于人类反馈的强化学习进行微调,这能够大大提升微调的效果。因此在型中加入基于人类标注得到的“Reward Mode!”,并进行强化学习微调也是得尝试的,况且引入人类反馈还能大大提升扩散模型在“Human Evalunai中的表现。
        (3)LLaMA等大模型开源后,很多研究者探索了基于大模型进行高效微调的方法,即不微调大模型本身,仅通过构造相关指令集和拥有少量参数的adaptor的方式挖掘大模型存储的知识。因此,如何高效微调Stable Diffusion 等来应新的任务(如 ControlNet)是值得进一步研究的。
应用范式
        从模型的应用上来说,GPT及大模型已经能够广泛用于各种任务了,但扩散模型的应用范式还有待探索:
        (1)目前大部分扩散模型在生成任务中表现出色,能够生成逼真的、符合输入提示语义的样本。但是,很少有研究探索扩散模型在认知推理或者少样本泛化等任务中的应用的。因此,将扩散模型推广到更多的应用范式,进一步向GPT大模型的应用领域探索,对于发挥扩散模型的潜能是至关重要的。

        (2)在Visual ChaGPT 中,扩散模型被当成视觉基础模型使用,但是对于多模态能问答任务,自然语言和多模态特征也很重要。因此,如何开发出语言扩散大模型,甚至多模态扩散大模型来为多模态应用服务是值得进一步探索的,不同态的扩散大模型如何与现有基于LLM 的大模型形成协同作用也是值得研究的。
       

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/55804.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

openpnp - 底部相机视觉识别CvPipeLine的参数bug修正

文章目录 openpnp - 底部相机视觉识别的CvPipeLine的参数bug概述笔记openpnp的视觉识别参数的错误原因备注END openpnp - 底部相机视觉识别的CvPipeLine的参数bug 概述 底部相机抓起一个SOD323的元件,进行视觉识别。 识别出的矩形错了,是一个很长的长方…

Qt_软件添加版本信息

文章内容: 给生成的软件添加软件的版权等信息 #include <windows.h> //中文的话增加下面这一行 #pragma code_page(65001)VS_VERSION_INFO VERSIONINFO

TEI text-embeddings-inference文本嵌入模型推理框架

参看: https://github.com/huggingface/text-embeddings-inference#docker 文本嵌入模型榜单 https://huggingface.co/spaces/mteb/leaderboard bge模型下载 https://huggingface.co/BAAI/bge-m3/tree/main export HF_ENDPOINT=https://hf-mirror.comhuggingface-cli dow…

STM32-HAL库 - MAX30102心率血氧传感器 —— 2024.10.15

一、教程简介 本教程使用CubeMX配合Keil5编写代码&#xff0c;带你10分钟拿下MAX30102。在官方例程的基础上进行移植和封装&#xff0c;测量数据准确。采用模拟I2C&#xff0c;任意三个引脚均可驱动。 二、MAX30102简介 MAX30102是一个集成的脉搏血氧仪和心率监测仪生物传感器…

Tortoise SVN 安装汉化教程(乌龟SVN)

1.首先下载 去官网下载 如果下载比较慢的&#xff0c;链接自取 https://pan.quark.cn/s/cb6f2eee3f90 2. 安装Tortoise SVN 无脑next到完成 最后到桌面右键 你就发现svn出来了&#xff0c;但是是英文的&#xff01;&#xff01;&#xff01;&#xff01; 像我这种英文不好的…

流体力学笔记

目录 1、名词2、湍流与涡流3 涡激振动4 压力面与吸力面参考&#xff1a;[空气动力学的“他山之石”](https://zhuanlan.zhihu.com/p/412542513) 1、名词 转列&#xff1a;transition 涡脱落&#xff1a;vortex shedding 涡分离&#xff1a;vortex rupture 气动噪声&#xff1a…

【java Web如何开发?】

&#x1f3a5;博主&#xff1a;程序员不想YY啊 &#x1f4ab;CSDN优质创作者&#xff0c;CSDN实力新星&#xff0c;CSDN博客专家 &#x1f917;点赞&#x1f388;收藏⭐再看&#x1f4ab;养成习惯 ✨希望本文对您有所裨益&#xff0c;如有不足之处&#xff0c;欢迎在评论区提出…

rel,npt时间服务器

服务器端配置 配置文件/etc/chrony.conf 开放端口 查看123端口是否开放 关闭防火墙 客户端配置 配置文件/etc/chrony.conf 重启文件和查看是否成功 注意事项要在ping通下实现&#xff0c;要是能ping通配置好了还是不行可以查看防火墙是否关闭

EMCMO--多任务优化求解约束多目标问题

EMCMO–多任务优化求解约束多目标问题 title&#xff1a; An Evolutionary Multitasking Optimization Framework for Constrained Multi-objective Optimization Problems author&#xff1a; Kangjia Qiao, Kunjie Yu, BoyangQu, Jing Liang, Hui Song, and Caitong Yue. …

Redis7 数据类型

Redis7 数据类型 文章目录 Redis7 数据类型1. Redis键&#xff08;Key&#xff09;2. Redis字符串&#xff08;String&#xff09;3. Redis列表&#xff08;List&#xff09;4. Redis哈希表&#xff08;Hash&#xff09;5. Redis集合&#xff08;Set&#xff09;5.1 常用操作5.…

Atlas800昇腾服务器(型号:3000)—驱动与固件安装(一)

服务器配置如下&#xff1a; CPU/NPU&#xff1a;鲲鹏 CPU&#xff08;ARM64&#xff09;A300I pro推理卡 系统&#xff1a;Kylin V10 SP1【下载链接】【安装链接】 驱动与固件版本版本&#xff1a; Ascend-hdk-310p-npu-driver_23.0.1_linux-aarch64.run【下载链接】 Ascend-…

Vue3学习:vite项目中图片不能显示,报错 require is not defined

今天做了一个案例“给你喜欢的人送花”&#xff0c;如果喜欢谁&#xff0c;就给谁送花&#xff0c;最多可以送5朵。运行效果如下。 这个项目是使用 npm create vitelatest 命令创建的。 包括2个组件&#xff1a; 根组件App.vue子组件HelloVote.vue。 目录结构如图所示&#x…

秋招面试题记录_半结构化面试

c八股(可能问的多一点) 1.简单说说C11语法特性 答&#xff1a; 1.auto以及decltype自动类型推导&#xff0c;避免手动声明复杂类型&#xff0c;减少冗长代码提升了可读性和安全性。 2.智能指针 自动释放内存 (具体说说) 有shared和unique 差异主要体现在所有权、内存开销、…

Java项目-基于springboot框架的校园在线拍卖系统项目实战(附源码+文档)

作者&#xff1a;计算机学长阿伟 开发技术&#xff1a;SpringBoot、SSM、Vue、MySQL、ElementUI等&#xff0c;“文末源码”。 开发运行环境 开发语言&#xff1a;Java数据库&#xff1a;MySQL技术&#xff1a;SpringBoot、Vue、Mybaits Plus、ELementUI工具&#xff1a;IDEA/…

Java的walkFileTree方法用法【FileVisitor接口】

在Java旧版本中遍历文件系统只能通过File类通过递归来实现&#xff0c;但是这种方法不仅消耗资源大而且效率低。 NIO.2的Files工具类提供了两个静态工具方法walk()和walkFileTree()可用来高效并优雅地遍历文件系统。walkFileTree()功能更强&#xff0c;可自定义实现更多功能&am…

(二十)、从宿主机访问 k8s(minikube) 发布的 redis 服务

文章目录 1、环境准备2、具体操作2.1、启动 minikube (start/stop)2.2、准备 redis-deployment.yaml2.3、执行 redis-deployment.yaml2.3.1、查看 pod 信息和日志 2.4、检查部署和服务状态2.4.1、如果需要删除 3、查看 IP 的几个命令3.1、查看IP的几个命令3.2、解读3.3、宿主机…

k8s的部署和安装

k8s的部署和安装 一、Kubernets简介及部署方法 1.1 应用部署方式演变 在部署应用程序的方式上&#xff0c;主要经历了三个阶段&#xff1a; 传统部署&#xff1a;互联网早期&#xff0c;会直接将应用程序部署在物理机上 优点&#xff1a;简单&#xff0c;不需要其它技术的参…

HarmonyOS Next模拟器异常问题及解决方法

1、问题1&#xff1a;Failed to get the device apiVersion. 解决方法&#xff1a;关闭模拟器清除用户数据重启

电子商务网站维护技巧:保持WordPress、主题和插件的更新

在这个快节奏的数字时代&#xff0c;维护一个电子商务网站的首要任务之一是保持WordPress、主题和插件的最新状态。过时的软件不仅可能导致功能故障&#xff0c;还可能带来安全风险。本文将深入探讨如何有效地更新和维护您的WordPress网站&#xff0c;以确保其安全性和性能。 …

【天池比赛】【零基础入门金融风控 Task2赛题理解】【2.3.6】

【天池比赛】【零基础入门金融风控 Task2赛题理解】【2.3.1-2.3.5】 2.3.6 变量分布可视化 2.3.6.1 单一变量分布可视化 对于 pandas.core.series.Series 类型的变量&#xff1a; index&#xff1a;含义&#xff1a;它表示 Series 对象的索引&#xff0c;也就是每个数据点对…