四、ChatGPT的回答从哪里来?—我耀学IT

        ChatGPT回答问题时通常比问题本身更长,这是因为它需要通过补充额外的信息来提供完整的答案。它的回答来源于对现有信息的抽取和整合,那么具体是怎么进行抽取和整合的呢,下面我们带着这个疑问来详细讨论一下它的工作原理。首先,英语中的问题通常以疑问词开头,例如"What"、"Why"、"Who"、"When"、"Where"、"Which"和"How"等。这些疑问词也被称为WH单词。

那么在这些问题中又可以把他大致分为两类,一类是回答简单问题,一类是回答复杂问题。

一、咱们先说回答简单问题:

        对计算机来说,除了涉及"为什么"和"怎么做"的问题,其他问题都属于简单问题。例如,如果你问ChatGPT:"2023年美国总统是谁?",它可以很快回答:"是拜登。" 这类问题,计算机能够根据疑问词和主题词的组合来理解。在这个例子中,问题的主题词是"美国总统",疑问词是"是谁",然后ChatGPT通过统计网上与这个问题相关的答案,建立一个关于"美国总统"的语义框架或知识框架。要知道它不是一对一的直接给出正确结果,相反它会给出多个可能的答案,并根据答案的概率进行排序,最终返回最可能的答案。不过需要注意的是,如果数据还没有更新,比如在换届时期,ChatGPT给出的答案可能会出错。

        类似的问答功能还可以在今天的智能助手中找到,比如使用苹果手机的Siri功能或谷歌的Google Voice功能,它们都能回答大部分简单问题,方法基本类似。

        讲到苹果的Siri,很多人觉得它比ChatGPT笨多了,即便是很多关于事实的问题,它也给不出答案,直接说不知道。其实这是对美国的商业和法律缺乏了解。苹果作为大的上市公司,是不能随便给别人建议的,否则法律上的麻烦很多。此外,作为一个用户每天依赖的产品,可靠性非常重要,不能时对时错。因此,像Siri这类的产品,做不到就不做了。

二、回答所谓复杂的问题:

对于复杂问题,计算机的处理方式与人有很大不同。

人类遇到复杂问题时,有三种途径可以回答:

        第一种情况,你知道答案,直接给出。这种情况计算机也能应对。例如,答案可能就在某个问答网站的文章中。过去,计算机采用网页搜索,将网页提供给用户。而今天的ChatGPT,则会从相应的网页中抽取相应的内容。

        第二种情况,你不知道答案,但你有相关知识,可以利用基本知识推导出答案。计算机在这方面的能力相对有限。虽然ChatGPT在很多方面已经很强大,但在回答小学常识类问题时,其正确率还不到60%。这是因为这类问题很少在网络上被讨论,或者网络上没有足够靠谱的答案,而ChatGPT缺乏像人一样运用知识去寻找答案的能力,它只能从现有的答案中归纳总结。

        第三种情况,你不知道答案,现有知识也无法直接推导出答案,需要进行研究。例如,在疫情期间,市面上有很多种口罩,但并不是所有的口罩都有效。这类问题并没有好的答案,需要通过实验和探索来发现新知识。ChatGPT无法做到这一点。

第三点、咱们来总结性的聊聊ChatGPT的工作原理:

        ChatGPT回答问题和进行写作都基于对现有事实的抽取和整合,或者说归纳总结。

        ChatGPT的训练数据是在Google进行的一项大规模语法分析任务。Google对1000亿个高质量的英语句子进行了语法分析,得到了知识图谱和语言模型。其中,知识图谱是由专门构建知识图谱的小公司和Google共同构建的,涵盖了数百万个知识点及其相互关系。ChatGPT还下载了维基百科的内容,构建了维基百科的知识图谱。

        在回答问题时,ChatGPT首先在知识图谱中寻找可能的答案。对于复杂问题,它可能需要从原始网页中提取信息。ChatGPT会找到多个可能包含答案的文章,并从中提取语句,通过语言模型构建答案。它的语言模型相当于一个“厨师”,将提取的信息组织成连贯的回答。如果语言模型质量较高,提供的答案会更加连贯和有逻辑性。

        在对话和写作方面,ChatGPT通过模仿同类文章或对话来生成内容。在对话中,你说一句话,它回答一句,通过类似的填空游戏继续进行。

        举例(可换):比如有这样一句话:从去年( )开始,考研成了大学生最关注的话题之一。请问中间该填什么词?

        对此,语言模型可以给出概率最高的几个词作为候选。比如上半年,下半年,夏天等等,不太可能提示“箱子”、“北京”、“土豆”这些不相关的词。类似地,如果一段话中拿走了一两个句子,今天语言模型也能填回去,只要语言模型足够大、足够好,填进去的内容读起来就通顺。

        至于写作,ChatGPT会利用用户提供的新信息替换原有内容,从而生成不同的作文。需要注意的是,输入的训练数据决定了输出的风格和质量。ChatGPT写的作文其实没有什么营养,内容只是比较巧妙的重复。不过客观地讲,今天大部分中学生写的作文其实质量都不高,也不过是把范文抄来抄去,甚至写得还远不如ChatGPT。毕竟,模仿和抄袭,人是做不过机器的。

        国内的阿里巴巴也推出了类似ChatGPT的产品,其回答和写作风格可能与ChatGPT有所不同,这是因为它们受到不同的训练数据影响。

最后总结一下:

        ChatGPT回答问题不是简单的问题对答案匹配,而是通过对现有信息的抽取和整合来回答问题。其工作原理涉及知识图谱的使用、从原始网页中提取信息以及语言模型的应用。ChatGPT的回答和写作都是基于模仿同类内容,并根据输入的训练数据生成不同的风格和质量的回答。

[我耀学IT]:        Patience is key in life

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/701705.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Jenkins解决Host key verification failed (2)

Jenkins解决Host key verification failed 分析原因情况 一、用OpenSSH的人都知ssh会把你每个你访问过计算机的公钥(public key)都记录在~/.ssh/known_hosts。当下次访问相同计算机时,OpenSSH会核对公钥。如果公钥不同,OpenSSH会发出警告,避免…

Spring中关于事务的一些方方面面

事务隔离级别: 先了解一些事务隔离级别有哪些: 未提交读(Read Uncommitted): 允许脏读,也就是可能读取到其他会话中未提交事务修改的数据 提交读(Read Committed): 只能读取到已经提交的数据。Oracle等多数数据库默…

车载电子电器架构 —— OEM基础技术概念开发流程

车载电子电器架构 —— 基础技术概念开发 我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 屏蔽力是信息过载时代一个人的特殊竞争力,任何消耗你的人和事,多看一眼都是你的不对。非必要不费力证明…

vue间的组件通讯

文章目录 父子组件通讯(通过props和$emit)兄弟组件通讯(使用事件总线):跨级组件通讯(使用provide/inject):使用Vuex状态管理:使用$refs引用组件: 父子组件通讯…

广度优先-BFS

介绍 以广度为准&#xff0c;先访问从岔道能直接到达的所有结点&#xff0c;然后再按这些结点被访问顺序访问它们能直接到达的结点&#xff0c;直至全部遍历完。 求矩阵中元素上下左右均为1所组成的块的数目 #include <iostream> #include <queue> using namesp…

写点技术人员离职的心得

离职的心态 人们在辞退或者被辞退都会对原公司抱有意见&#xff0c;因为疫情&#xff0c;公司业务告急&#xff0c;工资发不出来&#xff0c;我也失去了工作。虽然情绪上难免会有波动&#xff0c;但是转念一想&#xff0c;我应该用开心的心态来看待这次辞职&#xff0c;并希望…

Linux之JAVA环境配置jdkTomcatMySQL

目录 一. 安装jdk 1.1 查询是否有jdk 1.2 解压 1.3 配置环境变量 二. 安装Tomcat&#xff08;开机自启动&#xff09; 2.1 解压 2.2 启动tomcat 2.3 防火墙设置 2.4 创建启动脚本&#xff08;设置自启动&#xff0c;服务器开启即启动&#xff09; 三. MySQL安装&#xff08;…

vscode使用restClient实现各种http请求

vscode使用restClient实现各种http请求 一&#xff0c;安装插件 首先&#xff0c;我们要在vscode的扩展中&#xff0c;搜索rest Client&#xff0c;然后安装它&#xff0c;这里我已经安装过了。 安装后&#xff0c;我们就可以使用rest client插件进行http各种操作了。 二&…

Unity接入SQLite (二):SQL常用命令

在上一篇上《Unity接入SQLite (一):SQLite介绍-CSDN博客》中已经介绍了如何在Unity中接入SQLite插件&#xff0c;并且创建了一个db文件。如何进行数据库的读取&#xff0c;其中SQL命令非常重要 1.SQL支持的数据类型 SQL数据类型是用来定义数据库中存储的数据的类型&#xff0…

二分图匹配详解

二分图的原始模型及相关概念 二分图又称作二部图&#xff0c;是图论中的一种特殊模型。 设G(V,E)G(V,E)是一个无向图。 如顶点集V可分割为两个互不相交的子集&#xff08;A, B&#xff09;&#xff0c;并且图中每条边(i&#xff0c;j)所关联的两个顶点 i 和 j 就都分属两个不…

定时任务处理-Spring Task

目录 1 前言 2 cron表达式 2.1 相关概念的介绍 2.2 举个例子(白雪警告) 2.3 使用网站自动生成 3 Spring Task的使用 3.1 导入依赖坐标 3.2 开启任务调度 3.3 自定义定时任务类 1 前言 当我们需要处理一些定时任务的时候就需要用到我们的Spring Task&#xff0c;接下来…

(done) 两个矩阵 “相似” 是什么意思?

参考视频&#xff1a;https://www.bilibili.com/video/BV1zu411673J/?spm_id_from333.337.search-card.all.click&vd_source7a1a0bc74158c6993c7355c5490fc600 参考资料&#xff1a;https://baike.baidu.com/item/%E7%9B%B8%E4%BC%BC%E7%9F%A9%E9%98%B5/10369874?frge_a…

算能RISC-V通用云编译飞桨paddlepaddle@openKylin留档

尝试一在riscv里编译飞桨。 先总结&#xff1a; 下载飞桨代码&#xff0c;参照pr修改代码 然后编译 cmake ../ -DWITH_GPUOFF -DWITH_RISCVON make -j 16 TARGETRISCV64_GENERIC 编译好后安装&#xff1a; pip install paddlepaddle-0.0.0-cp38-cp38-linux_riscv64.whl -…

Opencv(C++)学习 ARM上引用opencv报相关头文件找不到

简单问题记录&#xff0c;C 与C互相引用时应该多注意类似问题。 问题描述&#xff1a;在项目中&#xff0c;建立了一个interface.h提供了一个C语言兼容的接口void work()&#xff0c;并在对应的interface.cpp中使用OpenCV完成相关处理实现。在PC端测试时&#xff0c;main.cpp成…

【HTML/CSS/JavaScript-编程指南】

HTML/CSS/JavaScript-编程指南 ■ HTML/CSS/JavaScript简介■ HTML/CSS/JavaScript学习网站■ VScode■ VSCode编写HTML■ VSCode编写CSS■ VSCode编写JavaScript ■ 语法■ HTML语法■ CSS语法■ JavaScript 语法 ■ HTML/CSS/JavaScript简介 HTML&#xff08;全称 Hypertext…

小波变换模拟

小波变换是一种信号处理技术&#xff0c;通过在时间-频率域中使用基于小波的函数进行信号分析。小波变换在处理非平稳信号和图像时特别有用&#xff0c;可以将信号分解为不同频率的成分。它在数据压缩、去噪、特征提取等领域有广泛应用。 MATLAB中提供了用于二维离散小波变换的…

css4浮动+清除浮动

浮动 一.常见网页布局1.三种布局方式2.布局准则 二.浮动&#xff08;float&#xff09;1.好处2.概念3.三大特性4.使用5.常见网页布局模板6.注意点 三.清除浮动1.why2.本质3.语法4.四种way&#xff08;后三个都是给父级添加&#xff09;清除浮动总结 一.常见网页布局 1.三种布局…

终端启动jupyter notebook更换端口

一、问题描述 如果尝试在端口 8889 上启动 Jupyter Notebook 但最终启动在了 8890 端口&#xff0c;这通常意味着 8889 端口已经被占用。要解决这个问题&#xff0c;可以尝试以下几种方法来关闭占用 8889 端口的进程。 1. 查找并终止占用端口的进程 首先&#xff0c;需要找出…

课时45:表达式_表达式_字符串表达式

3.2.3 字符串表达式 学习目标 这一节&#xff0c;我们从 基础知识、简单实践、小结 三个方面来学习。 基础知识 简介 所谓的字符串表达式&#xff0c;主要是判断 比较运算符 两侧的值的内容是否一致&#xff0c;由于bash属于弱类型语言&#xff0c;所以&#xff0c;默认情况…

【课程作业】提取图中苹果的面积、周长和最小外接矩形的python、matlab和c++代码

提取图中苹果的面积、周长和最小外接矩形 在图像处理中&#xff0c;提取对象的关键属性是常见的任务之一。本文将演示如何使用三种流行的编程语言——Python、Matlab和C&#xff0c;利用相应的图像处理库&#xff08;OpenCV或Matlab内置函数&#xff09;来提取图像中苹果的面积…