ChatGPT的回答从哪里来?

ChatGPT回答问题时通常比问题本身更长,这是因为它需要通过补充额外的信息来提供完整的答案。它的回答来源于对现有信息的抽取和整合,那么具体是怎么进行抽取和整合的呢,下面我们带着这个疑问来详细讨论一下它的工作原理。

首先,英语中的问题通常以疑问词开头,例如"What"、"Why"、"Who"、"When"、"Where"、"Which"和"How"等。这些疑问词也被称为WH单词。

那么在这些问题中又可以把他大致分为两类,一类是回答简单问题,一类是回答复杂问题。

一、咱们先说回答简单问题:

对计算机来说,除了涉及"为什么"和"怎么做"的问题,其他问题都属于简单问题。例如,如果你问ChatGPT:"2023年美国总统是谁?",它可以很快回答:"是拜登。" 这类问题,计算机能够根据疑问词和主题词的组合来理解。在这个例子中,问题的主题词是"美国总统",疑问词是"是谁",然后ChatGPT通过统计网上与这个问题相关的答案,建立一个关于"美国总统"的语义框架或知识框架。要知道它不是一对一的直接给出正确结果,相反它会给出多个可能的答案,并根据答案的概率进行排序,最终返回最可能的答案。不过需要注意的是,如果数据还没有更新,比如在换届时期,ChatGPT给出的答案可能会出错。

类似的问答功能还可以在今天的智能助手中找到,比如使用苹果手机的Siri功能或谷歌的Google Voice功能,它们都能回答大部分简单问题,方法基本类似。

讲到苹果的Siri,很多人觉得它比ChatGPT笨多了,即便是很多关于事实的问题,它也给不出答案,直接说不知道。其实这是对美国的商业和法律缺乏了解。苹果作为大的上市公司,是不能随便给别人建议的,否则法律上的麻烦很多。此外,作为一个用户每天依赖的产品,可靠性非常重要,不能时对时错。因此,像Siri这类的产品,做不到就不做了。

二、回答所谓复杂的问题:

对于复杂问题,计算机的处理方式与人有很大不同。

人类遇到复杂问题时,有三种途径可以回答:

第一种情况,你知道答案,直接给出。这种情况计算机也能应对。例如,答案可能就在某个问答网站的文章中。过去,计算机采用网页搜索,将网页提供给用户。而今天的ChatGPT,则会从相应的网页中抽取相应的内容。

第二种情况,你不知道答案,但你有相关知识,可以利用基本知识推导出答案。计算机在这方面的能力相对有限。虽然ChatGPT在很多方面已经很强大,但在回答小学常识类问题时,其正确率还不到60%。这是因为这类问题很少在网络上被讨论,或者网络上没有足够靠谱的答案,而ChatGPT缺乏像人一样运用知识去寻找答案的能力,它只能从现有的答案中归纳总结。

第三种情况,你不知道答案,现有知识也无法直接推导出答案,需要进行研究。例如,在疫情期间,市面上有很多种口罩,但并不是所有的口罩都有效。这类问题并没有好的答案,需要通过实验和探索来发现新知识。ChatGPT无法做到这一点。

第三点、咱们来总结性的聊聊ChatGPT的工作原理:

ChatGPT回答问题和进行写作都基于对现有事实的抽取和整合,或者说归纳总结。

ChatGPT的训练数据是在Google进行的一项大规模语法分析任务。Google对1000亿个高质量的英语句子进行了语法分析,得到了知识图谱和语言模型。其中,知识图谱是由专门构建知识图谱的小公司和Google共同构建的,涵盖了数百万个知识点及其相互关系。ChatGPT还下载了维基百科的内容,构建了维基百科的知识图谱。

在回答问题时,ChatGPT首先在知识图谱中寻找可能的答案。对于复杂问题,它可能需要从原始网页中提取信息。ChatGPT会找到多个可能包含答案的文章,并从中提取语句,通过语言模型构建答案。它的语言模型相当于一个“厨师”,将提取的信息组织成连贯的回答。如果语言模型质量较高,提供的答案会更加连贯和有逻辑性。

在对话和写作方面,ChatGPT通过模仿同类文章或对话来生成内容。在对话中,你说一句话,它回答一句,通过类似的填空游戏继续进行。

举例(可换):比如有这样一句话:从去年( )开始,考研成了大学生最关注的话题之一。请问中间该填什么词?

对此,语言模型可以给出概率最高的几个词作为候选。比如上半年,下半年,夏天等等,不太可能提示“箱子”、“北京”、“土豆”这些不相关的词。类似地,如果一段话中拿走了一两个句子,今天语言模型也能填回去,只要语言模型足够大、足够好,填进去的内容读起来就通顺。

至于写作,ChatGPT会利用用户提供的新信息替换原有内容,从而生成不同的作文。需要注意的是,输入的训练数据决定了输出的风格和质量。ChatGPT写的作文其实没有什么营养,内容只是比较巧妙的重复。不过客观地讲,今天大部分中学生写的作文其实质量都不高,也不过是把范文抄来抄去,甚至写得还远不如ChatGPT。毕竟,模仿和抄袭,人是做不过机器的。

国内的阿里巴巴也推出了类似ChatGPT的产品,其回答和写作风格可能与ChatGPT有所不同,这是因为它们受到不同的训练数据影响。

最后总结一下:

ChatGPT回答问题不是简单的问题对答案匹配,而是通过对现有信息的抽取和整合来回答问题。其工作原理涉及知识图谱的使用、从原始网页中提取信息以及语言模型的应用。ChatGPT的回答和写作都是基于模仿同类内容,并根据输入的训练数据生成不同的风格和质量的回答。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/702041.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

五种多目标优化算法(MOBA、NSWOA、MOJS、MOAHA、MOPSO)性能对比(提供MATLAB代码)

一、5种多目标优化算法简介 多目标优化算法是用于解决具有多个目标函数的优化问题的一类算法。其求解流程通常包括以下几个步骤: 1. 定义问题:首先需要明确问题的目标函数和约束条件。多目标优化问题通常涉及多个目标函数,这些目标函数可能存在冲突,需要在不同目标之间进…

1_怎么看原理图之GPIO和门电路笔记

一、GPIO类 如下图:芯片输出高电平/3.3V,LED亮;当芯片输出低电平,则LED暗 如下图:输入引脚,当开关闭合,则输入为低电平/0V,当开关打开,则输入为高电平/3.3V 现在的引脚都…

【VIP专属】Python应用案例——基于Keras, OpenCV和MobileNet口罩佩戴识别

目录 1、导入所需库 2、加载人脸口罩检测数据集 3、对标签进行独热编码

Stable Diffusion 3 发布及其重大改进

1. 引言 就在 OpenAI 发布可以生成令人瞠目的视频的 Sora 和谷歌披露支持多达 150 万个Token上下文的 Gemini 1.5 的几天后,Stability AI 最近展示了 Stable Diffusion 3 的预览版。 闲话少说,我们快来看看吧! 2. 什么是Stable Diffusion…

微信小程序 uniapp+vue餐厅美食就餐推荐系统

本论文根据系统的开发流程以及一般论文的结构分为三个部分,第一个部分为摘要、外文翻译、目录;第二个部分为正文;第三个部分为致谢和参考文献。其中正文部分包括: (1)绪论,对课题背景、意义、目…

网络编程-NIO案例 与 AIO 案例

案例说明:一个简单的群聊实现,支持重复上下线。 NIO 服务端 public class NIOServer {public static void main(String[] args) throws IOException {ServerSocketChannel serverChannel ServerSocketChannel.open();// 初始化服务器serverChannel.b…

token的有状态和无状态

在身份验证和授权领域,"有状态"(stateful)和"无状态"(stateless)通常用来描述系统处理用户认证信息的方式。 有状态(Stateful): 有状态的认证系统在服务器端会维…

uvloop,一个强大的 Python 异步IO编程库!

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站零基础入门的AI学习网站~。 目录 ​编辑 前言 什么是uvloop库? 安装uvloop库 使用uvloop库 uvloop库的功能特性 1. 更…

DPDK常用API合集二

网络数据包缓冲管理(librte_mbuf) 1.1 rte_pktmbuf_alloc 是 DPDK(数据平面开发工具包)中的一个函数,用于在内存池中分配一个新的 mbuf(内存缓冲区) struct rte_mbuf *rte_pktmbuf_alloc(stru…

Spring ReflectionUtils 反射工具介绍和使用

一、ReflectionUtils 在 Java 中,反射(Reflection)是一种强大的机制,允许程序在运行时动态地检查类、获取类的信息、调用类的方法、访问或修改类的属性等。Java 的反射机制提供了一组类和接口,位于 java.lang.reflect…

WebLogic Server JNDI注入漏洞复现(CVE-2024-20931)

0x01 产品简介 Oracle WebLogic Server 是一个Java应用服务器,它全面实现了J2EE 1.5规范、最新的Web服务标准和最高级的互操作标准。WebLogic Server内核以可执行、可扩展和可靠的方式提供统一的安全、事务和管理服务。Oracle Fusion Middleware(Oracle融合中间件)和Oracle…

【二分查找】【浮点数的二分查找】【二分答案查找】

文章目录 前言一、二分查找(Binary Search)二、浮点数的二分查找三、二分答案总结 前言 今天记录一下基础算法之二分查找 一、二分查找(Binary Search) 二分查找(Binary Search)是一种在有序数组中查找目…

Nodejs+vue图书阅读评分个性化推荐系统

此系统设计主要采用的是nodejs语言来进行开发,采用 vue框架技术,对于各个模块设计制作有一定的安全性;数据库方面主要采用的是MySQL来进行开发,其特点是稳定性好,数据库存储容量大,处理能力快等优势&#x…

效率系列(九) macOS入门各式快捷操作

大家好,我是半虹,这篇文章来讲 macOS 中的各式快捷操作 零、序言 快捷操作这种东西,看得再多,不如实际用起来,用习惯之后,真的会感受到效率提高的 所以这篇文章主要是想总结下常用的触控板手势和键盘快捷…

数字热潮:iGaming 能否推动加密货币的普及?

过去十年,iGaming(互联网游戏)世界有了显著增长,每月有超过一百万的新用户加入。那么,这一主流的秘密是什么?让我们在本文中探讨一下。 领先一步:市场 数字时代正在重新定义娱乐,iG…

MySQL运维实战(7.2) MySQL复制server_id相关问题

作者:俊达 主库server_id没有设置 主库没有设置server_id Got fatal error 1236 from master when reading data from binary log: Misconfigured master - server_id was not set主库查看server_id mysql> show variables like server_id; ----------------…

如何在本地电脑部署HadSky论坛并发布至公网可远程访问【内网穿透】

文章目录 前言1. 网站搭建1.1 网页下载和安装1.2 网页测试1.3 cpolar的安装和注册 2. 本地网页发布2.1 Cpolar临时数据隧道2.2 Cpolar稳定隧道(云端设置)2.3 Cpolar稳定隧道(本地设置)2.4 公网访问测试 总结 前言 经过多年的基础…

哈希表在Java中的使用和面试常见问题

当谈到哈希表在Java中的使用和面试常见问题时,以下是一些重要的点和常见问题: 哈希表在Java中的使用 HashMap 和 HashTable 的区别: HashMap 和 HashTable 都实现了 Map 接口,但它们有一些重要的区别: HashMap 是非线…

Repeater:创建大量类似项

Repeater 类型用于创建大量类似项。与其它视图类型一样,Repeater有一个model和一个delegate。 首次创建Repeater时,会创建其所有delegate项。若存在大量delegate项,并且并非所有项都必须同时可见,则可能会降低效率。 有2种方式可…

【ubuntu】永久修改主机名

文章目录 1. 问题描述2. 解决方案 1. 问题描述 主机名过长(后面的部分) 2. 解决方案 查看主机名详情 hostnamectl修改指定主机名 hostnamectl set-hostname ubuntu2204 --static登出重进即可