ChatGPT第四讲

ChatGPT的回答从哪里来?

        ChatGPT回答问题时通常比问题本身更长,这是因为它需要通过补充额外的信息来提供完整的答案。它的回答来源于对现有信息的抽取和整合,那么具体是怎么进行抽取和整合的呢,下面我们带着这个疑问来详细讨论一下它的工作原理。

  首先,英语中的问题通常以疑问词开头,例如"What"、"Why"、"Who"、"When"、"Where"、"Which"和"How"等。这些疑问词也被称为WH单词。

        那么在这些问题中又可以把他大致分为两类,一类是回答简单问题,一类是回答复杂问题。

一、咱们先说回答简单问题:

        对计算机来说,除了涉及"为什么"和"怎么做"的问题,其他问题都属于简单问题。例如,如果你问ChatGPT:"2023年美国总统是谁?",它可以很快回答:"是拜登。" 这类问题,计算机能够根据疑问词和主题词的组合来理解。在这个例子中,问题的主题词是"美国总统",疑问词是"是谁",然后ChatGPT通过统计网上与这个问题相关的答案,建立一个关于"美国总统"的语义框架或知识框架。要知道它不是一对一的直接给出正确结果,相反它会给出多个可能的答案,并根据答案的概率进行排序,最终返回最可能的答案。不过需要注意的是,如果数据还没有更新,比如在换届时期,ChatGPT给出的答案可能会出错。

        类似的问答功能还可以在今天的智能助手中找到,比如使用苹果手机的Siri功能或谷歌的Google Voice功能,它们都能回答大部分简单问题,方法基本类似。

        讲到苹果的Siri,很多人觉得它比ChatGPT笨多了,即便是很多关于事实的问题,它也给不出答案,直接说不知道。其实这是对美国的商业和法律缺乏了解。苹果作为大的上市公司,是不能随便给别人建议的,否则法律上的麻烦很多。此外,作为一个用户每天依赖的产品,可靠性非常重要,不能时对时错。因此,像Siri这类的产品,做不到就不做了。

二、回答所谓复杂的问题:

        对于复杂问题,计算机的处理方式与人有很大不同。

        人类遇到复杂问题时,有三种途径可以回答:

        第一种情况,你知道答案,直接给出。这种情况计算机也能应对。例如,答案可能就在某个问答网站的文章中。过去,计算机采用网页搜索,将网页提供给用户。而今天的ChatGPT,则会从相应的网页中抽取相应的内容。

        第二种情况,你不知道答案,但你有相关知识,可以利用基本知识推导出答案。计算机在这方面的能力相对有限。虽然ChatGPT在很多方面已经很强大,但在回答小学常识类问题时,其正确率还不到60%。这是因为这类问题很少在网络上被讨论,或者网络上没有足够靠谱的答案,而ChatGPT缺乏像人一样运用知识去寻找答案的能力,它只能从现有的答案中归纳总结。

        第三种情况,你不知道答案,现有知识也无法直接推导出答案,需要进行研究。例如,在疫情期间,市面上有很多种口罩,但并不是所有的口罩都有效。这类问题并没有好的答案,需要通过实验和探索来发现新知识。ChatGPT无法做到这一点。

第三点、咱们来总结性的聊聊ChatGPT的工作原理:

        ChatGPT回答问题和进行写作都基于对现有事实的抽取和整合,或者说归纳总结。

        ChatGPT的训练数据是在Google进行的一项大规模语法分析任务。Google对1000亿个高质量的英语句子进行了语法分析,得到了知识图谱和语言模型。其中,知识图谱是由专门构建知识图谱的小公司和Google共同构建的,涵盖了数百万个知识点及其相互关系。ChatGPT还下载了维基百科的内容,构建了维基百科的知识图谱。

        在回答问题时,ChatGPT首先在知识图谱中寻找可能的答案。对于复杂问题,它可能需要从原始网页中提取信息。ChatGPT会找到多个可能包含答案的文章,并从中提取语句,通过语言模型构建答案。它的语言模型相当于一个“厨师”,将提取的信息组织成连贯的回答。如果语言模型质量较高,提供的答案会更加连贯和有逻辑性。

        在对话和写作方面,ChatGPT通过模仿同类文章或对话来生成内容。在对话中,你说一句话,它回答一句,通过类似的填空游戏继续进行。

         举例(可换):比如有这样一句话:从去年( )开始,考研成了大学生最关注的话题之一。请问中间该填什么词?

        对此,语言模型可以给出概率最高的几个词作为候选。比如上半年,下半年,夏天等等,不太可能提示“箱子”、“北京”、“土豆”这些不相关的词。类似地,如果一段话中拿走了一两个句子,今天语言模型也能填回去,只要语言模型足够大、足够好,填进去的内容读起来就通顺。

        至于写作,ChatGPT会利用用户提供的新信息替换原有内容,从而生成不同的作文。需要注意的是,输入的训练数据决定了输出的风格和质量。ChatGPT写的作文其实没有什么营养,内容只是比较巧妙的重复。不过客观地讲,今天大部分中学生写的作文其实质量都不高,也不过是把范文抄来抄去,甚至写得还远不如ChatGPT。毕竟,模仿和抄袭,人是做不过机器的。

        国内的阿里巴巴也推出了类似ChatGPT的产品,其回答和写作风格可能与ChatGPT有所不同,这是因为它们受到不同的训练数据影响。

最后总结一下:

        ChatGPT回答问题不是简单的问题对答案匹配,而是通过对现有信息的抽取和整合来回答问题。其工作原理涉及知识图谱的使用、从原始网页中提取信息以及语言模型的应用。ChatGPT的回答和写作都是基于模仿同类内容,并根据输入的训练数据生成不同的风格和质量的回答。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/710093.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【转载】Windows 11 任务栏位置调整

更改注册表(部分win11版本有效) Win R快捷键打开「运行」——执行regedit命令打开「注册表编辑器」进入路径: 计算机\HKEY_CURRENT_USER\Software\Microsoft\Windows\CurrentVersion\Explorer\StuckRects3 修改Settings这个二进制的第 2 行…

前端同时传递文件数据+非文件数据,前后端解决方案

之前录制视频《文件上传组件》的时候有位观众提了个问题,如果我没有理解错的话,应该就是前后同时传递文件数据 非文件数据,前后端数据该如何接收,这里我给出我自己的解决方案 tip:下文在编写前端代码的时候,用到了这篇…

使用WebAssembly提升Web应用性能

文章目录 使用WebAssembly提升Web应用性能引言一、什么是WebAssembly1. WebAssembly的定义2. WebAssembly的目标和用途 二、WebAssembly与JavaScript的比较1. 执行速度2. 类型检查3. 内存管理4. 适用场景 三、WebAssembly的优势1. 提升性能2. 安全性3. 可移植性4. 集成性 四、如…

MYSQL安装及卸载

目录 一、下载 二、解压 三、配置 1. 添加环境变量 2. 初始化MySQL 3. 注册MySQL服务 4. 启动MySQL服务 5. 修改默认账户密码 四、登录MySQL 五、卸载MySQL 一、下载 点开下面的链接:MySQL :: Download MySQL Community Server 点击Download 就可以下载对…

Linux-基础命令(黑马学习笔记)

Linux的目录结构 Linux的目录结构 Linux的目录结构是一个树形结构 Windows系统可以拥有多个盘符,如C盘、D盘、E盘 Linux没有盘符这个概念,只有一个根目录 /,所有文件都在它下面 Linux路径的描述方式 ● 在Linux系统中,路径之…

真实与虚幻的边界:算法备案的重要不言而喻

曾经需要耗费大量时间和精力的人脸生成、替换,现在只需通过先进的深度合成算法便能轻松实现;而以往难以触及的人物属性编辑和操控,如今也已成为创作者手中的得力工具。深度合成技术在图像和视频编辑领域的应用,已然掀起了革命性的…

【AI绘画·24年1月最新】Stable Diffusion整合包安装!解压即用--秋葉aaaki 大佬的作品,试用

前言 Stable Diffusion 之前费老大的劲部署安装,解决报错。搞完之后,突然发现有个现成集成包可以用,真是效率高到不行,今天搞下来试试 我电脑配置: CPU: 12th Gen Intel Core™ i7-12700F 2.10 GHz 内存32G&#xff0…

Vuex使用之Vue3

1. 搭建Vuex环境 创建文件:src/store/index.js //引入Vueximport { createStore } from vuex//准备actions对象——响应组件中用户的动作const actions {jia(context, value) {context.commit(JIA, value)}}//准备mutations对象——修改state中的数据const mutatio…

C++高级面试题:解释 C++ 中的静态断言(Static Assertion)

C高级面试题:解释 C 中的静态断言(Static Assertion)在C中,静态断言(Static Assertion)是一种在编译时对条件进行检查的机制。它类似于传统的 assert 宏,但是静态断言是在编译时进行检查&#x…

腾讯云又双叕降价,云服务器配置优惠价格表2024新版报价

腾讯云服务器多少钱一年?62元一年起,2核2G3M配置,腾讯云2核4G5M轻量应用服务器218元一年、756元3年,4核16G12M服务器32元1个月、312元一年,8核32G22M服务器115元1个月、345元3个月,腾讯云服务器网txyfwq.co…

ChatGPT与互联网产业的变革浪潮

ChatGPT与互联网产业的变革浪潮 在互联网产业快速发展的当下,ChatGPT的出现无疑是一场革命。作为一款先进的语言处理工具,ChatGPT不仅在技术层面引发了广泛关注,更在实际应用中展现出巨大的潜力和影响力。本文将探讨ChatGPT对互联网产业的影…

nginx使用详解--缓存使用

Nginx 是一个功能强大的 Web 服务器和反向代理服务器,它可以用于实现静态内容的缓存,缓存可以分为客户端缓存和服务端缓存。 客户端缓存 客户端缓存指的是浏览器缓存, 浏览器缓存是最快的缓存, 因为它直接从本地获取(但有可能需要发送一个协商缓存的请…

代码随想录算法训练营Day32 || leetCode 122.买卖股票的最佳时机II || 55. 跳跃游戏 || 45.跳跃游戏II

122.买卖股票的最佳时机II 本题思路比较巧妙&#xff0c;将n天之内的利润进行了拆分&#xff0c;例如P(3)-P(1)P(3)-P(2)P(2)-P(1)&#xff0c;按照这个思路&#xff0c;将所有正数差值加起来即可 class Solution { public:int maxProfit(vector<int>& prices) {i…

CAPL编程学习笔记--关于on 事件的详细解释

CAPL编程是比较有特色的一种面向通讯的编程语言。 1&#xff1a;on XXX类型&#xff08;即事件类型&#xff09; 维克多的官方文档对CAPL的描述是一门类C语言&#xff0c;说白了它也是用C写出来的。我们看on&#xff08;注意都是小写&#xff09;事件的代码结构 on * { }&…

【物联网应用案例】开发智能农业解决方案考虑的事项

一、开发智能农业解决方案考虑的事项 正如我们所看到的&#xff0c;物联网在农业中的用例是无穷无尽的。智能设备可以通过多种方式帮助您提高农场的绩效和收入。然而&#xff0c;农业物联网应用程序的开发并不是一件容易的事。 如果您正在考虑投资智能农业&#xff0c;则需要…

设备管理系统解决方案

软件资料获取&#xff1a;软件项目开发全套文档下载_软件项目文档-CSDN博客 1.系统概述 1.1.需求描述 建立设备信息库&#xff0c;对设备相关档案的登录、整理。通过建立完善的设备档案&#xff0c;将设备的各类原始信息进行信息化管理&#xff0c;使设备档案查询工作方便快…

【web APIs】4、(学习笔记)有案例!

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、日期对象实例化方法 二、时间戳三、DOM 节点插入节点删除节点查找节点父子关系兄弟关系 四、案例举例1.显示格式化时间2.倒计时3.学成在线首页4.学生就业信…

一图总结:华为销售体系(铁三角组织LTC流程)

《华为铁三角工作法》阅读了多遍&#xff0c;花了些时间整理了一张图对本书的框架性总结&#xff0c;从流程&#xff08;LTC&#xff09;、组织&#xff08;铁三角&#xff09;、激励和管理三个大方面概览华为销售体系。 核心是一靠流程&#xff0c;二靠团队&#xff0c;而前提…

阿里云服务器大降价20%,简单拥有五年三台2h4gECS,组建公网集群

要在阿里云ECS上组建集群&#xff0c;您可以按照以下步骤进行操作&#xff1a; 创建ECS实例&#xff1a;登录阿里云控制台&#xff0c;选择ECS实例&#xff0c;点击“创建实例”按钮。根据实际需求选择实例的配置参数&#xff0c;例如实例规格、操作系统、网络等。根据需要选择…

如何使用视频号下载提取器提取视频,推荐2种方法使用!

视频号下载提取视频号视频&#xff0c;推荐大家2个方法&#xff01; 前者简单&#xff0c;后者较为复杂&#xff0c;不过都可以提取视频号视频&#xff0c;大家可根据实际情况来使用。 01 视频号下载工具提取器&#xff1f; 1&#xff1a;通过搜一搜的这款搜索引擎找到自己…