聊聊ChatGPT的本质

这是鼎叔的第九十八篇原创文章。行业大牛和刚毕业的小白,都可以进来聊聊。

阶段性总结下我对ChatGPT的基础理解,算是一篇学习思考笔记吧。其中难免有很多不准确的,或过于简略的地方,将来再迭代学习。

OpenAI做ChatGPT的底层逻辑

一句话描述,就是大力出奇迹。为什么会产生这种结果呢?

这要从AI发展的两大流派说起,就是符号主义和连接主义。前者基于逻辑推理的智能模拟方式,通过专家对于符号的深入研究来完善逻辑推理。这种方式的最大局限性是在真实场景中要考虑的逻辑推理过于复杂了,想达到用户的高满意度极其困难。

连接主义就是从脑神经的结构受到启发,主要神经元数量足够多,训练的输入量足够庞大,训练出来的神经元连接效果就有可能达到人类思考的水平。人的大脑形成认知,就是某些神经元的链接输出被固化了。

OpenAI在这个方面下的赌注成功了,海量参数、极其庞大的训练文本和巨大算力,最终产生了涌现的进化效果,复杂常识的理解能力急剧提升。垂直小模型的推理难题被轻松解决。

一夜之间很多老AI人觉得以往的研究白干了,但是新模型的前景又让从业人员无比兴奋。

ChatGPT训练成功的要素

个人观点,这是非专业初学者更应该努力理解的:ChatGPT训练成功,主要做对了哪几件事(除了“大”),继承了什么好的遗产。

1 预训练。

ChatGPT对互联网上的海量信息进行了无监督学习,这些庞大的已有信息显然绝大部分都没有被人工标注过,也不可避免夹带了大量低质量的信息,包括网络上常见的阴谋论,偏见等。

ChatGPT从未标注数据中自动推导出预训练数据,使预训练变得更有扩展性。

预训练也是迁移学习在深度学习中实现的主要方法,通过在替代性任务上训练模型,然后将其适配到下游任务中,实现了跨任务的知识迁移。

2 RLHF 基于人类反馈的强化学习

RLHF解决的核心问题是,让大模型生成内容和人类的常识、认知、需求和价值观保持一致。

OpenAI团队首先从海量数据集中,搜集包含有“问题”和“答案”的数据对,然后用它们来训练一个奖励模型,当输入文本的质量越高(即更符合人类评价标准),奖励分数越高。最后让大语言模型能够根据这个奖励模型给出的奖励分数来自我生成更高质量的回答。

这个技术方案依然面对大量伦理监管和局限性挑战,还在不断演进中。

3 模型微调。

多数组织其实是无法满足预训练和微调基础模型的计算要求的,以共生为关联和标准模型训练,会产生虚假关联和东拼西凑的合成结果。

每家公司不可能都从头训练一个自己的大模型,要想在自己服务接口中提供大模型能力,推理成本是必须考虑的要素,微调相对来说就是一个更优的方案。轻量级的微调模型也能够针对每个用户的数据进行训练,同时满足数据安全的需求。

4 Transformer和自注意力机制

ChatGPT的技术基础就是谷歌的Transformer深度学习模型。传统的自然语言处理模型难以进行并行计算,导致长文本处理时性能下降非常明显。

Transformer模型是基于自注意力机制来构建的,包含编码器和解码器两个部分,前者负责将输入序列转换为定长的向量表示,后者将向量解码为输出序列,自注意力机制能够建立长距离的依赖关系,即使经过多轮对话,还能够保持对前文指代的正确理解。Transformer的并行计算能力让它在长序列处理时具有更高的效率。

5 Token机制

Token是ChatGPT这种大语言模型最重要的概念。Token就是文本处理的最小单位,英文中就是一个单词,中文中就是一个分词。输入的每个token都会对应一个唯一的数字ID,以便让模型进行编码和解码。

对于包含了数亿甚至数十亿参数的大模型,要实现高效的训练和推理,模型的输入必须进行限制,长文本就会基于Token进行分割。这种表示形式既有利于大模型的处理,也有利于通过token之间关系的学习来获取更多语义信息。

最近爆火的视频生成大模型Sora,也使用了类似的概念-最小视频单位Patch。当微观学习尺度是统一的,不管什么尺寸、分辨率和帧率的输入视频都可以统一进行学习和输出。

ChatGPT的商业机会

商业机会按产业细分类型,可以分为这几类受益领域:

1 提供AI算力的公司,提供定制化,合理计费的算力服务。

2 提供上游数据服务的公司,包括对数据进行查询、转换、标注和治理。

3 提供中间算法定制模型的公司和研究机构。具备真正基础大模型研发能力的公司非常少,但是提供垂直能力封装的、体验强化的中间模型,还是很有市场的,但这块需要有足够强的垂直行业能力或者客户服务嗅觉,或者建设活跃的AI交流社区。

4 提供热门应用拓展能力的公司。这样的公司有两类,一类是在某类应用上已经有先发优势,有大量的忠实用户,然后把大模型能力引入到特定的用户场景,成功地形成口碑效应,增加了付费意愿。

还有一类创业型公司,快速利用大模型的能力提供尝鲜产品,利用自己的“快”赶在大公司的前面,在应用场景上截胡用户。这类公司的员工非常少,非常精,容易获得高估值,对同类“老”公司带来不少威胁。这类公司的核心灵活打法就是疯狂地采集免费训练数据,趁平台大公司反击之前训练好基础模型,拉到初期的用户群,因为员工极少,发展惊人,能进一步扩大估值和融资。

ChatGPT目前的局限

实时性不足,肯定是现阶段ChatGPT的主要问题。大模型是基于已有海量内容的预训练来升级的,时效性暂时还有很大的短板。

创造力有限。ChatGPT能够自我优化内容质量,根据用户兴趣进行调整,但生成内容依然缺乏原创性,也缺乏可控制的个性化内容。长此以往会降低使用者的热情和工作能力,部分使用者会依赖大模型工具,自身能力会退化。

全新任务的迁移能力不佳。ChatGPT能够连贯地输出有逻辑性的文本,但它在理解语境和情感时可能会受到数据偏差和模型偏移的影响,导致在新的场景任务中表现不佳。大模型学习掌握了一定的语言规律和人类的思维方式,但在创造文本时存在语法逻辑瑕疵,需要后期纠正。

人类文明的思维复杂性是在多维度的,体现了其多样性,这远不是让计算机求解问题这么单纯直接。

ChatGPT重塑沟通效率

ChatGPT带来的自然语言表达效率空前提升,给我们的启发是,可以利用ChatGPT把需要大量沟通的业务重做一遍。

对于沟通表达可能比较弱的工程师,ChatGPT可能是帮助工程师对外沟通的利器,工程师可以按心目中的标准训练特定产品,让非技术人员和该产品先行互动,节约自己的人工沟通时间。

这也是鼎叔在团队敏捷实践中引入大模型解决手段的初衷。技术人员和非技术人员不一定都能不厌其烦地面对面交流,理解对方意图的初级AI可能是不错的预沟通桥梁。

还有一类沟通困难场景,是因为某一方(客户或者员工)比较羞涩,尴尬。借助ChatGPT问答,不用操心自己的隐私暴露,比如心理/生理问题的咨询服务。

此外,教育界对于ChatGPT在学校的使用会严防死守,但它确实可以大幅提高老师的日常效率,节约大量批改作业和教学杂活的时间,同时为学生的个性化教育带来了可能性。

ChatGPT的进化方向

一 和搜索技术更好的整合,比如RAG技术。搜索技术和ChatGPT看起来有相似性,但也有很多本质的不同。

搜索引擎由搜索器,索引器,检索器,用户接口组成,搜索产品对于结果的实时性要求高。但搜索产品的结果体验始终不佳,满屏的搜索结果还夹杂着大量广告,让普通用户无从选择。

ChatGPT的体验是革命性的,让用户眼前一亮,并且能够顺利地聊下去,得益于长效的注意力机制,前后连贯的推理和互动,让用户活跃度暴涨。

两者互相印证,互为补充,可以大幅提升大模型答案的实时性,还可以降低回答的幻觉率。

二 和知识图谱更好的结合。这点有待更多学习。

三 多模态的发展。四大模态(文本,音频,图片,视频)的商业机会在互相渗透,虎视眈眈,对用户而言分界线并不明显,多模态提供了更多强者通吃的机会。

四 AI伦理有关的技术管理体系。

大模型的数据标注训练,本身就存在人为错误可能,如果被恶意标注,会产生极大偏离主流价值观的结果。

恶意引入大量的“特殊语料”或者加大其权重,也可以起到扭曲价值观的目的。

不怕一眼假的幻觉,就怕看不出真假的幻觉,把产品快速被调教成“坏人”。

可以想见,AI伦理的破坏者手段更加隐蔽,难以追查,这也对管理制度和体系化能力提出了更高要求。

因为大模型本身的不可解释性,黑产团伙也可能操纵训练数据集,生成他们想要的对抗样本。

五 具身智能。就像最近OpenAI和机器人公司合作,在短短时间就给机器人进行了认知赋能,机器人本身精准的控制力,又能把AI指令和行动近乎完美的融合在一起。

图片

六 AI Agents群体智能,ChatGPT是其中当仁不让的大脑。

大模型实体是由不同公司,不同资源和不同技能团队负责的,在AGI(通用人工智能)真正成熟之前,每个大模型产品都有自己擅长的垂直能力和不擅长的短板。

当我们要输出一个用户满意的智能方案,完全可以调用多个不同的大模型实体来完成,它们就叫Agents。

比如一个自动生成的金融报告平台,会需要擅长写报告的agent,擅长分析商业数据的agent,擅长绘制金融图片的agent,以及擅长做风险和收益分析的agent,这四个agent在后台共同协作,前台由ChatGPT直接和用户对话和反馈。

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/16013.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何利用线程池实现互联网验证码保护服务

如何利用线程池实现互联网验证码保护服务 1、业务背景与实现思路2、代码实操1、业务背景与实现思路 首先介绍一下业务背景,假设我们的系统是一个短视频播放网站,每个新加入的用户都需要注册账号并绑定手机号。为了验证用户手机的正确性,我们的系统会发送一条验证码到用户注…

K8s的kubectl的基本操作

K8s的kubectl的基本操作 K8s基本信息的查看 查看版本信息 kubectl versio查看资源对象简写 kubectl api-resources查看集群信息 kubectl cluster-info配置kubectl自动补全 source <(kubectl completion bash)查看master节点状态 kubectl get cs查看命名空间 kubectl…

【找出第 K 大的异或坐标值】python

4层循环暴力超时 class Solution:def kthLargestValue(self, matrix: List[List[int]], k: int) -> int:nums[]for a in range(len(matrix)):for b in range(len(matrix[0])):num0for i in range(a1):for j in range(b1):num^matrix[i][j]nums.append(num)nums.sort()retu…

类的内存对齐位段位图布隆过滤器哈希切割一致性哈希

文章目录 一、类的内存对齐1.1规则1.2原因 二、位段2.1介绍2.2内存分配问题2.3跨平台问题2.4使用的注意事项 三、位图的应用3.1 给40亿个不重复的无符号整数&#xff0c;找给定的一个数。&#xff08;int的范围可以到达42亿多&#xff09;3.2 给定100亿个整数&#xff0c;设计算…

Golang实现文件复制

方法&#xff1a;三种 package zdpgo_fileimport ("errors""io""os" )// CopyFile 使用io.Copy进行文件的复制&#xff0c;同时也会复制文件的所有权限 // param src 复制文件 // param des 目标文件 // return error 错误信息 func CopyFile(s…

2024年弘连网络FIC大会竞赛题线下决赛题

总结&#xff1a; FIC决赛的时候&#xff0c;很多小问题没发现&#xff0c;在pve平台做题确实很方便。 这套题目复盘完&#xff0c;服务器这块的知识确实收获了很多&#xff0c;对pve集群平台和网络拓扑也有了一定的认识&#xff0c;感谢各位大佬悉心指导。 接下来&#xff0…

【FPGA】Verilog:奇校验位生成器的实现(Odd Parity bit generator)

解释奇数奇偶校验位生成器和检查器的仿真结果及过程。 真值表和卡洛图: Odd Parity Bit Generator A B C

怎么在pyqt中显示matplotlib的绘图?

想要在pyqt中显示matplotlib的绘图&#xff0c;在绘图时&#xff0c;其实不必使用以下语句&#xff1a; matplotlib.use("Qt5Agg") # 声明使用QT5最关键的语句是&#xff1a; from matplotlib.backends.backend_qt5agg import FigureCanvasQTAggFigureCanvasQTAgg…

学 Python 具体能干什么?

Python 是一种功能强大、用途广泛的编程语言&#xff0c;因其简洁易读的语法和丰富的库生态系统而备受欢迎。学习 Python后&#xff0c;你可以从事以下几方面的工作&#xff1a; 1. Web 开发 Python 有很多流行的 Web 框架&#xff0c;如&#xff1a; Django&#xff1a;一个…

Android studio的Gradle出问题

Gradle sync failed: Plugin [id: com.android.application, version: 7.1.1, apply: false] was not found in any of the following sources: 在src里面的build.gradle中 plugins { id ‘com.android.application’ } 的上面加上 buildscript {repositories {jcenter()}depen…

从 0 开始实现一个网页聊天室 (小型项目)

实现功能 用户注册和登录好友列表展示会话列表展示: 显示当前正在进行哪些会话 (单聊 / 群聊) , 选中好友列表中的某个好友, 会生成对应的会话实时通信, A给B发送消息, B的聊天界面 / 会话界面能立刻显示新的消息 TODO: 添加好友功能用户头像显示传输图片 / 表情包历史消息搜…

禅道密码正确但是登录异常处理

禅道密码正确&#xff0c;但是登录提示密码错误的异常处理 排查内容 # 1、服务器异常&#xff0c;存储空间、数据库异常 # 2、服务异常&#xff0c;文件丢失等异常问题定位 # 1、df -h 排查服务器存储空间 # 2、根据my.php排查数据库连接是否正常 # 3、修改my.pho,debugtrue…

探索切片索引:列表反转的艺术

新书上架~&#x1f447;全国包邮奥~ python实用小工具开发教程http://pythontoolsteach.com/3 欢迎关注我&#x1f446;&#xff0c;收藏下次不迷路┗|&#xff40;O′|┛ 嗷~~ 目录 一、引言&#xff1a;列表反转的挑战 二、切片索引的基本概念 三、切片索引实现列表反转 …

vs2013使用qt Linguist以及tr不生效问题

一、qt Linguist&#xff08;语言家&#xff09;步骤流程 1、创建翻译文件,在qt选项中 2.选择对应所需的语言&#xff0c;得到.ts后缀的翻译文件 3.创建.pro文件&#xff0c;并将.ts配置在.pro文件中 3.使用qt Linguist 打开创建好的以.ts为后缀的翻译文件&#xff0c;按图所示…

细粒度图像分类论文(AAM模型方法)阅读笔记

细粒度图像分类论文阅读笔记 摘要Abstract1. 用于细粒度图像分类的聚合注意力模块1.1 文献摘要1.2 研究背景1.3 本文创新点1.4 计算机视觉中的注意力机制1.5 模型方法1.5.1 聚合注意力模块1.5.2 通道注意力模块通道注意力代码实现 1.5.3 空间注意力模块空间注意力代码实现 1.5.…

【软件设计师】面向对象技术

1.面向对象基础 1.1 基本概念 方法重载是函数名字相同&#xff0c;参数列表不同 组成 即组合&#xff0c;指整体与部分的关系&#xff0c;整体与部分生命周期相同 聚合 关联关系的一个特例&#xff0c;是体现整体与部分&#xff0c;即使has-a的关系&#xff0c;此时整体与部分…

【LakeHouse】Apache Iceberg + Amoro 助力网易构建云原生湖仓

Apache Iceberg Amoro 助力网易构建云原生湖仓 1.云原生湖仓背景与挑战2.Apache Iceberg 、Amoro 与云原生2.1 Apache Iceberg2.2 Amoro 简介 3.Apache Iceberg Amoro 云原生实践3.1 云上湖仓案例一3.2 云上湖仓案例二3.3 云上湖仓案例三 4.Amoro 未来发展规划 出品社区&…

【代码随想录——回溯算法二周目】

1. 组合总和 var (path []intres [][]int )func combinationSum(candidates []int, target int) [][]int {path make([]int, 0)res make([][]int, 0)dfs(candidates,target,0,0)return res }func dfs(candidates []int, target int,tempTarget int,start int) {if tempTarg…

Django-auth组件

Django-auth组件 1 表结构 我们从python manage.py migrate为我们创建的auth组件内置的表开始看 auth_user&#xff1a;用户表存储用户信息&#xff08;登录admin后台&#xff09; 里面的字段分两类&#xff1a;用户基本信息&#xff08;用户名&#xff0c;邮箱&#xff0c;密…

华为OD机试【找出通过车辆最多颜色】(java)(100分)

1、题目描述 在一个狭小的路口&#xff0c;每秒只能通过一辆车&#xff0c;假设车辆的颜色只有 3 种&#xff0c;找出 N 秒内经过的最多颜色的车辆数量。 三种颜色编号为0 &#xff0c;1 &#xff0c;2。 2、输入描述 第一行输入的是通过的车辆颜色信息[0,1,1,2] &#xff0…