自然语言处理的发展历程

1.自然语言处理发展的7个阶段

序号阶段时间贡献代表人物
1起源期1913-1956思考使用图灵算法计量模型来描述自然语言,描述词语及词语之间的关系。这一阶段停留在理论层面做探索图灵、马尔可夫、香农
2基于规则的形式语言理论期1957-1970形式语言理论的提出,开启了学术界对自然语言结构的研究、建模和解析,从而为基于结构与规则的文本识别、生成和翻译开辟了一条康庄大道诺姆·乔姆斯基、冯志伟
3基于规则、概率模型和预料库的融合期1971-1995隐马尔可夫模型的诞生属于一个里程碑式的重大进展,大大推进了自然语言处理的发展进程。
4浅层机器学习期1996-2005朴素贝叶斯模型等模型弥补传统融合模型方法的不足,展现一定的学习和推理能力,这有助于提高自然语言的综合能力,比如优化文本分类、消除奇艺、增强语义分析、强化情感分析
5深度学习期2006-2017神经网络语言模型能够挖掘到更多隐含信息,多层神经网络能够有效地实现特征工程的自动化,通过逐层初始化的预训练方式解决多层神经网络训练的难题。另一进展是词向量技术和表征方法的提出,提高了文本识别的准确度和精度
6预训练语言模型期2018-2021预驯良模型大大降低了自然语言处理的门槛,让创业公司能轻轻松松的在预训练语言模型的基础上进行优化,并在各个垂直领域的应用中获得良好的效果
7大模型期2022-大模型表现出优异的自然语言生成和推理性能

2.从BERT模型到ChatGPT

2.1BERT模型说明

BERT模型由谷歌于2018年发布,其主要创新点在于提出了预训练的思想,并且使用Transformer的编码器作为模型的基础架构。BERT模型能够解决的实际问题如:语法错误判别、情感分析、语义相近、语义相近评分、问题对语义相近、句子对关系判断、问答、实体识别问题、阅读理解、完形填空。

2.2BERT模型诞生之后行业持续摸索

BERT模型诞生后,由于优秀的性能和开源的特性,其很快应用到各行各业和各类自然语言处理任务中,比如智能客服、语音质检、对话机器人和搜索引擎等,产生了巨大的商业价值。

此时,GPT技术选型嗨处于非主流状态,另外当时行业攻坚克服的方向主要放在自然语言处理上,而非自然语言生成上。

2.3ChatGPT的诞生

与BERT模型相比,ChatGPT在文本生成方面的效果提高十分明显。两者的差异在于BERT模型重点关注的是自然语言处理任务,而ChatGPT重点突破的是自然语言生成任务。

2.3.1InstructGPT模型的构建流程

InstructGPT模型是ChatGPT的孪生兄弟,该模型的构建分为以下3个步骤:

(1)微调GPT-3.0

按照要求收集并标注演示数据,为监督学习做准备。

1)构建Prompt数据集:比如“向小孩解释登月”、“讲讲白雪公主的故事”等

2)对数据集进行标注:主要通过人工进行标注,比如“登月就是去月球”

3)使用标注数据集微调GPT-3:使用监督学习策略对模型进行微调,获得新的模型参数

(2)训练奖励模型

收集训练奖励模型(Reward Model,RM)所需要的比较数据集。标注数据知识对于给定输入用户更偏好哪个输出,依据此进行奖惩,从而训练RM来更好的按照人类偏好进行模型输出。

1)模型预测:用微调过的GPT-3对采样的任务进行预测

2)数据标注,获得比较数据集:对模型预测数据结果按照从好到坏的规则进行标注,获得比较数据集

3)得到RM:用比较数据集作为输入数据训练,得到RM

(3)使用ppo算法更新模型参数

通过强化学习手段,使用PPO算法优化RM,使用RM的输出作为标量奖励,同时使用PPO算法对监督政策进行微调以优化RM。

1)使用PPO算法预测结果:通过强化学习手段,使用PPO算法优化GPT-3并构建新的生成函数,然后输入采样的Prompt数据集,获得模型输出

2)使用RM打分:使用第二步训练好的RM给模型输出进行打分,获得Reward(奖励)打分数据

3)更新模型参数:根据Reward打分数据来更新模型参数

模型构建的第二步和第三步可以循环操作,只需要收集关于当前最佳策略的更多比较数据集,用于训练心得RM,然后使用PPO算法训练新的策略

从以上的InstructGPT的构建流程和方法介绍中可以看到,InstructGPT的构建流程相对简单,并没有涉及特别复杂的方法论和技术,也没有涉及很多原创的理论,更多的是站在巨人肩膀上的工程实践方面的创新

2.3.2ChatGPT和InstructGPT的差异

通过对话形式,ChatGPT能够回答问题、承认错误、对模糊的需求进行询问、质疑不正确的前提和拒绝不适当的请求等。ChatGPT是InstructGPT的兄弟模型,被训练为在提示中遵循指令并输出反馈结果。

模型InstructGPTChatGPT
底座模型GPT-3.0GPT-3.5
数据集指令数据集人工交互标注数据+指令数据集,最后转化为对话数据集
应用场景更适合指令型文本生成任务更适合对话型文本生成任务
推理能力较强
代码生成能力较强
泛化能力中等较强

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/4167.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深度学习系列66:试穿模型IDM-VTON上手

1. 模型概述 如图,总体流程为: 输入为:衣服的编码xg;人物noise的编码xt;人物身上衣物的mask和人体pose分割(densepose);衣服部分经过两部分网络:1)高级语义网络IP-Adapter&#xff…

3122.使矩阵满足条件的最少操作次数

周赛第三题,知道要用动态规划,但是不知道怎么回到子问题 显然根据题意我们需要让每一列都相同,但是相邻列不能选择同一种数字,观察到数据nums[i]介于0-9,我们就以此为突破口. 首先我们用count[n][10], count[i][j]记录第i1列值为j的元素个数,转移方程如下: dfs(i,pre) max(dfs…

pytest-xdist:远程多主机 - 分布式运行自动化测试

简介:pytest-xdist插件使用新的测试执行模式扩展了pytest,最常用的是在多个CPU之间分发测试以加快测试执行,即 pytest -n auto同时也是一个非常优秀的分布式测试插件,分别支持ssh和socket两种方式实现master和worker的远程通讯。…

游戏新手村20:游戏落地页广告页如何设计

在互联网营销中,着陆页(Landing Page,有时被称为首要捕获用户页)就是当潜在用户点击广告或者搜索引擎搜索结果页后显示给用户的网页,LandingPage对于游戏广告的转化率和重要性就不言而喻了。 网页游戏LP页面 上图就是我们大家在浏览网站时不小心蹦出或者主动点击某…

python学习笔记12:小数类型的角度到度分秒的转换

目录 实现方式1 实现方式2 本博客讲述了两种计算方式及其代码的实现,并在最后对比了两种方法的结果差异。 比较结果显示,不同的实现方式之间可能存在数值误差。 实现方式1 具体计算步骤如下: 数值取整数部分得到度 108.5745800204 -->…

IIS中搭建.Net Core项目,步骤详解

一、准备服务器 1)安装IIS 这个比较简单,百度一下就行 2)安装 .NET Core 运行时 下载地址:下载 .NET(Linux、macOS 和 Windows) 因为我是本地开发,所以我下载的是SDK 安装成功之后显示如下: 检查是否安装…

万兆以太网MAC设计(6)IP协议报文格式详解以及IP层模块设计

文章目录 前言:IPv4报文协议格式二、IP_RX模块设计2.1、模块接口2.2、模块工作过程 三、IP_TX模块设计3.1、模块接口3.2、模块工作过程 四、仿真4.1、发送端4.2、接受端 前言:IPv4报文协议格式 参考:https://sunyunqiang.com/blog/ipv4_prot…

正点原子[第二期]Linux之ARM(MX6U)裸机篇学习笔记-5

前言: 本文是根据哔哩哔哩网站上“正点原子[第二期]Linux之ARM(MX6U)裸机篇”视频的学习笔记,在这里会记录下正点原子 I.MX6ULL 开发板的配套视频教程所作的实验和学习笔记内容。本文大量引用了正点原子教学视频和链接中的内容。…

txt大文件拆分(批量版)

之前的python程序只能拆分单个文件,这里重新加了个文件夹拆分的功能(打包好的exe文件在文章末尾) 使用步骤:运行代码–>把文件放到input文件夹里–>命令行界面回车–>output文件夹输出文件 outputPath "./output&q…

曲线「三分」

明明做作业的时候遇到了 n 个二次函数Si(x)ax^2bxc ,他突发奇想设计了一个新的函数F(x)max{Si(x)},i1,2……n 。 明明现在想求这个函数在 的最小值,要求精确到小数点后四位,四舍五入。 输入格式 输入包含 T组数据,每组第一行一…

神经网络的优化器

神经网络的优化器是用于训练神经网络的一类算法,它们的核心目的是通过改变神经网络的权值参数来最小化或最大化一个损失函数。优化器对损失函数的搜索过程对于神经网络性能至关重要。 作用: 参数更新:优化器通过计算损失函数相对于权重参数的…

【蓝桥杯省赛真题38】python字符串拼接 中小学青少年组蓝桥杯比赛 算法思维python编程省赛真题解析

目录 python字符串拼接 一、题目要求 1、编程实现 2、输入输出 二、算法分析 三、程序编写 四、程序说明 五、运行结果 六、考点分析 七、 推荐资料 1、蓝桥杯比赛 2、考级资料 3、其它资料 python字符串拼接 第十三届蓝桥杯青少年组python编程省赛真题 一、题目…

MySQL8.0 msi版本安装教程

MySQL8.0 msi 版本安装教程 1> 官网下载安装包 2> 安装MySQL 2.1双击打开下载的安装包,进入到下面这个页面,选择 Custom 选项,之后,点击next 说明: 2.2 选择所需产品,更改安装位置(当然也可以默认安…

性能分析与调优(超详细)

🍅 视频学习:文末有免费的配套视频可观看 🍅 关注公众号【互联网杂货铺】,回复 1 ,免费获取软件测试全套资料,资料在手,涨薪更快 常看到性能测试书中说,性能测试不单单是性能测试工程…

免费ChatGPT合集——亲测免费

1、YesChat 无需登录 网址:YesChat-ChatGPT4V Dalle3 Claude 3 All in One Freehttps://www.yeschat.ai/ 2. 讯飞星火 要登录 讯飞星火大模型-AI大语言模型-星火大模型-科大讯飞 3.通义千问 要登录 通义我是通义,一个专门响应人类指令的…

Unity打开Android文件管理器并加载文件

1、在AssetStore商店中加入免费插件 2、调用代码 3、使用UnityWebRequest加载路径数据

【算法】组合回溯专题

组合总数 给你一个 无重复元素 的整数数组 candidates 和一个目标整数 target ,找出 candidates 中可以使数字和为目标数 target 的 所有 不同组合 ,并以列表形式返回。你可以按 任意顺序 返回这些组合。 candidates 中的 同一个 数字可以 无限制重复被…

新能源车载芯片分析

新能源汽车市场正迸发出巨大的活力,传统主机厂和新势力都纷纷推出各种车型,打起了价格战,各种新技术让人眼花缭乱。当前,战场硝烟弥漫,新能源汽车公司犹如春秋时期的各诸侯国。车载芯片作为新能源汽车的关键组成部分&a…

Jmeter之Beanshell详解

一、 Beanshell概念 Beanshell: BeanShell是一种完全符合Java语法规范的脚本语言,并且又拥有自己的一些语法和方法;BeanShell是一种松散类型的脚本语言(这点和JS类似);BeanShell是用Java写成的,一个小型的、免费的、可以下载的、嵌入式的Java源代码解释器,具有对象脚本语言特性…

【Java】全套云HIS源码包含EMR、LIS(多医院、卫生机构使用)

云HIS系统简介 SaaS模式Java版云HIS系统源码,在公立二甲医院应用三年,经过多年持续优化和打磨,系统运行稳定、功能齐全,界面布局合理、操作简便。 1、融合B/S版电子病历系统,支持电子病历四级,HIS与电子病…