ChatGPT的大致原理

国外有个博主写了一篇博文,名字叫TChatGPT: Explained to KidsQ」,
直译过来就是,给小孩子解释什么是ChatGPT。
在这里插入图片描述
因为现实是很多的小孩子已经可以用父母的手机版ChatGPT玩了
,ChatGPT几乎可以算得上无所不知,起码给小孩子讲故事,回
答一些简单的回答不在话下。其实这里面就涉及到ChatGPT的一
个最最基本也是核心的功能,就是问答,而这个问答功能就是第
一代ChatGPT非常的简单直接,你打字给它,它输出给你。比如
你输入你好,它会随机的给出「吗」,「高」,「美」等回答,这
些回答选项取决于你们之前的对话内容。
在这里插入图片描述
这个阶段的ChatGPT是大语言模型,它的特点就是只能接受文字
输入,并且也只能以文字输入。中文,英文,数字或者是代码,其
本质上都是文字,那么其实最主要的问题就是为什么ChatGPT能理
解我们说的话,同时还能基本上回答出让我们满意甚至是惊艳的回
答。我们其实可以用一句老话来形容,那就是书读百遍,其义自现。
说白了就是读的多了,就算不懂某句古诗或者古文的意思,但是起
码是背下来了,直接背出来了。ChatGPT就是读了巨量的「书」,
这些资料有的来自于书籍,有的来自于互联网,总之它读了很多很
多的书,它的记忆里存储了大量的知识,这一点儿跟人类其实非常
的像。但是在回答的问题跟人类会有一些不同,比如我们在背诵古
诗词的时候,床前明月光Q,后面如果我们背下来了并且确定背的
对的话,后一句肯定接的是疑是地上霜。当然我们可以随便编一个
错误回答,比如唧唧复唧唧,我们是回答了,但是我们知道肯定是
瞎编的。但是ChatGPT在回答的时候不是这么思考的,它的学习资
料来自于公开的数据,如果所有的?里面床前明月光后面都是疑是地
上霜,那么你放心,它肯定可以回答的又快又对。不过事实上,互联
网上的资料不一定都对,有可能某一篇或者某几篇文章里面它的诗句
就是错的,那么ChatGPT就有一定的几率输出错误的回答。
在这里插入图片描述
特别是很多人都体验过,ChatGPT会胡乱的说作者名字。因为ChatGPT的
输出主要是靠概率,下一个字的输出取决于前面的内容,就还拿刚开始的
问题来举例。
就比如你好,后面可以跟很多的词。如果你看到一个人好像受伤了,坐在
地上,你应该会说:你好吗?如果你在篮球场碰到了一个身高2米以上的
运动员,你应该不会说你好吗或者你好美,而是你好高。你好美也同理。
我们就可以这么理解,ChatGPT是一个可以综合各种信息进行概率最大
化输出的人工智能模型。
这个时候我们可以讲一些细节。ChatGPT的名字分为两部分:Chat和GPT。
Chat是聊天的意思,GPT是Gene rative Pre-trained Transformer的首字母缩写。
其中Genrative是生成的意思,它的作用是可以创造或者生产一些新的东西;
Pre-trainedQ是它从大量的文本资料中学习而来,Transformer指的是一种人
工智能的模型。T不用关注,主要就看G和P这两个词就行。
我们主要用的就是它的Generative功能,用、来生成各种各样的内容;但是我们
需要知道方,么它可以生产各种内容,原因就在于P。只有学习了大量的内容,
才可以进行再生产。而这种学习其实是会有局限性了,很自然的,比如说你从
小学习了很多的知识,但你可以保证你对一个问题的回答是完全正确的吗?
几乎不可能,第一是知识的局限性,ChatGPT也一样,不可能掌握所有的知识;
第二是知识的准确性,怎么保证所有的知识都是准确无误的;第三是知识的复
杂性,同一个概念在不同的语境下有不同的体现,这种度别说AI,就连人都很
难完美把握。
能大致讲一下ChatGPT的原理…所以我们在使用ChatGPT的时候,也需要监督
ChatGPT输出内容的准确性,它大概率是没问题的,但是你要把它用在关键问
题上,就得人工再审核一遍。而现在的ChatGPT,其实已经升级过两次了,一
次是GPT4Q,具有更准确的回答能力,另一次是最近的GPT Turbo。现在的Ch
atGPT,是一种叫多模态的大模型它跟第一代不同的地方就在于它不仅可以接收
和输出文字,也可以接收其他类型的输入,比如图片,文档,视频等等,然后输
出也更加多样化除了文本之外,也可以输出图片或者文件等等。
在这里插入图片描述
这个「模」在这里就指的是不同的数据类型,为什么ChatGPT要做多模态,
本质上就是因为OpenAI做ChatGPT的初衷就是要做AGI。
在这里插入图片描述
而AGI又是什么呢,它的全名叫Artificial generalintelligence,通用人工智能。
在这里插入图片描述
它的特点就是可以在所有的任务中表现的跟人类相似。也可以简单的理解
为跟人类具有相近的智能程度,而像人类的话,起码可以跟人类一样做到几
件事,可以看东西,可以听东西,可以说东西也可以写东西。
第一代的ChatGPT只能看文字和写文字,其实远远摸不到AGI的边。
而多模态就是必要的实现路径,现在的ChatGPT可以看,看文字和看图片都
可以;可以听和说,这个功能已经在手机APP版本的ChatGPT中实现了,也
可以写,也就是输出东西,它可以写代码,写文章,也可以画画等等。
这就是为什么要做多模态的出发点,更重要的是这个世界本来就是多模态的,
很多东西很难用文字完全表述,比如如何形容一朵花都感觉不够完美,最简
单方法就是把照片拿出来看。
而多模态的ChatGPT就做的事这件事,接收:类型的输入并且输出各种类型的输出。
这篇问答主要的作用是通俗的解释了ChatGPT的运行原理,但是很多的细节并没
有涉及到,如果大家对于细节感兴趣,建议大家可以去看看深入学习一下。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/687895.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CDH 6.3.2集成Hudi异常org.codehaus.jackson不存在及开源JDK版本异常

CDH 6.3.2集成Hudi异常,首先获取hudi源码,地址:git clone https://github.com/apache/hudi.git,进入根目录hudi编译相关jar时,存在2个问题jar包依赖为导入和开源JDK版本问题。异常分别如下所示。 1.编译命令 到hudi根…

【漏洞复现-通达OA】通达OA share身份认证绕过漏洞

一、漏洞简介 通达OA(Office Anywhere网络智能办公系统)是中国通达公司的一套协同办公自动化软件。通达OA /share/handle.php存在一个认证绕过漏洞,利用该漏洞可以实现任意用户登录。攻击者可以通过构造恶意攻击代码,成功登录系统管理员账户,继而在系统后台上传恶意文件控…

哪种台灯的灯光适合学生用?明基/书客/松下等护眼台灯推荐

目前近视人群越来越多,并且有低龄化的倾向。针对护眼这一卖点,市面上出现了很多护眼台灯品牌,但是很多不知名的网红品牌生产出来的产品质量没有办法得到保障。在挑选护眼台灯时,还是要先做好攻略才不会踩雷。 一、使用护眼台灯更…

Stable Diffusion webui安装详细教程

上一篇文章介绍了sd主流的ui,相信大家已经有所了解,下面为大家介绍sd-webui的安装详细教程 文章目录 一、 安装包说明二、对电脑的要求三、安装文件介绍四、安装步骤五、电脑问题与云主机六、界面简要说明及通用反向提示词 一、 安装包说明 通常我们使…

14. Qt 程序菜单实现,基于QMainWindow

目录 前言: 技能: 内容: 一、ui中直接添加控件实现 二、 完全通过代码实现菜单 参考: 前言: 基于QMainWindow,两种方式实现菜单:通过直接添加ui控件快速添加菜单和完全通过代码实现菜单&a…

护眼落地灯值得买吗?书客、霍尼韦尔、柏曼三款落地灯大PK!

落地灯对于上班族、学生党来说真的很友好,能够提供贴合眼睛用光舒适的光度,使这些日常长时间用眼的人能够减少不良光线对眼睛造成的影响,从而科学健康的用眼! 市面上的落地灯产品越来越多,琳琅满目的产品让不少刚接触落…

⭐北邮复试刷题429. N 叉树的层序遍历(按层入队出队BFS)(力扣每日一题)

429. N 叉树的层序遍历 给定一个 N 叉树,返回其节点值的层序遍历。(即从左到右,逐层遍历)。 树的序列化输入是用层序遍历,每组子节点都由 null 值分隔(参见示例)。 示例 1:输入&a…

自定义类型详解 ----结构体,位段,枚举,联合

目录 结构体 1.不完全声明 2.结构体的自引用 3.定义与初始化 4.结构体内存对齐与结构体类型的大小 结构体嵌套问题 位段 1.什么是位段? 2.位段的内存分配 枚举 1.枚举类型的定义 2.枚举的优点 联合(共同体) 1.联合体类型的声明以…

多模态(三)--- BLIP原理与源码解读

1 BLIP简介 BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation 传统的Vision-Language Pre-training (VLP)任务大多是基于理解的任务或基于生成的任务,同时预训练数据多是从web获…

D3842——三极管驱动,专为脱线和Dc-Dc开关电源应用设计的,起动电流小

D3842/43/44是专为脱线和Dc-Dc开关电源应用设计的恒频电流型Pwd控制器内部包含温度补偿精密基准、供精密占空比调节用的可调振荡器、高增益混放大器、电流传感比较器和适合作功率MOST驱动用的大电流推挽输出颇以及单周期徊滞式限流欠压锁定、死区可调、单脉冲计数拴锁等保护电路…

Transformer面试十问

1 Scaled Dot-Product Attention中为什么要除以 d k \sqrt{d_k} dk​ ​? 1. 从纯数学上考虑:对于输入均值为0,方差为1的分布,点乘后结果其方差为dk,所以需要缩放一下。下图为原论文注释。 2. 从神经网络上考虑:防止在计算点积…

安装配置NMon

NMon(Nigel’s Monitor)是一款由IBM公司提供的免费性能监控工具,专门用于监控AIX系统和Linux系统的资源使用情况 下载软件 wget http://sourceforge.net/projects/nmon/files/nmon16p_binaries.tar.gz 如果报错的话,安装提示添加…

vue的生命周期图解

vue的生命周期图解 添加链接描述 vue的生命周期函数及过程的简述: vue的生命周期函数,其实就是vm的生命周期; 创建:beforeCreate、created 挂载:beforeMount、mounted 更新:beforeUpdate、updated [ˌʌpˈ…

【Java EE初阶十七】网络原理(二)

2. 传输层 2.2 TCP协议 2.2.2 关于可靠传输 4.滑动窗口 前面的三个机制,都是在保证 tcp 的可靠性; TCP 的可靠传输,是会影响传输的效率的.(多出了一些等待 ack 的时间,单位时间内能传输的数据就少了); 滑动窗口,就让可靠传输对性能的影响,更…

什么是FTC能效标签? FTC能效标签办理流程是怎么样?

亚马逊美国站能源标签FTC 什么是FTC及历史背景 Federal TradeCommission(FTC)是美国联邦贸易委员会,是执行多种反托拉斯和保护消费者法律的联邦机构。其目的是确保国家市场行为具有竞争性,且繁荣、 高效地发展,不受不合理的约束。美国联邦贸易…

前端工程化面试题 | 10.精选前端工程化高频面试题

🤍 前端开发工程师、技术日更博主、已过CET6 🍨 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 🕠 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 🍚 蓝桥云课签约作者、上架课程《Vue.js 和 E…

赋能AI原生应用开发:百度智能云千帆AppBuilder正式开放服务

为满足企业敏捷、高效地进行AI原生应用开发的需求,降低AI原生应用开发门槛,百度智能云千帆AppBuilder正式开放服务。戳我体验 AppBuilder将大模型开发AI原生应用的常见模式、工具、流程,沉淀成一个工作台,帮助开发者聚焦业务本身…

【网络安全】什么样的人适合学?该怎么学?

有很多想要转行网络安全或者选择网络安全专业的人在进行决定之前一定会有的问题: 什么样的人适合学习网络安全?我适不适合学习网络安全? 当然,产生这样的疑惑并不奇怪,毕竟网络安全这个专业在2017年才调整为国家一级…

C++初阶:容器适配器介绍、stack和queue常用接口详解及模拟实现

介绍完了list类的相关内容后:C初阶:适合新手的手撕list(模拟实现list) 接下来进入新的篇章,stack和queue的介绍以及模拟: 文章目录 1.stack的初步介绍2.stack的使用3.queue的初步介绍4.queue的使用5.容器适…

rust函数 stuct struct方法 关联函数

本文结合2个代码实例主要介绍了rust函数定义方法,struct结构体定义、struct方法及关联函数等相关基础知识。 代码1: main.rc #[derive(Debug)]//定义一个结构体 struct Ellipse {max_semi_axis: u32,min_semi_axis: u32, }fn main() {//椭圆&#xff0…