ChatGPT基础(一) GPT的前世今生

文章目录

      • GPT模型简史
      • GPT系列模型
      • ChatGPT的应用

最近ChatGPT3.5可以免注册使用了,出来刨一波坟 说一说ChatGPT的来源和应用。

在这里插入图片描述

GPT模型简史

Generative pre-trained transformers(GPT)生成式预训练转换模型是大语言模型的一种(Large Language Model–>LLM)。它是用于自然语言处理的人工神经网络,可以在未经标记的语料上进行训练并能在基础的信息上生成出全新的内容。

GPT的前身可以追溯到2015年由Ian Goodfellow等人在论文《Generative Adversarial Nets》中首次提出,该模型使用生成对抗网络(GAN)学习生成数据,从而能够生成高质量的图像和文本。2018年,OpenAI基于GAN模型的思想发布了一款新的自然语言处理模型——GPT-1。

在这里插入图片描述

GPT系列模型

GPT模型是由OpenAI发布的一系列模型的总称。

在这里插入图片描述

GPT-1: 2018年11月OpenAI发布了GPT-1,是以4.5GB的文本资料作为训练数据得到的模型,该模型有接近1.2亿个参数。GPT-1是一个单向的语言模型它在预测下一个单词时,只考虑了前面的单词,效果一般。

GPT-2: 为了改进GPT-1的性能,OpenAI在2019年2月发布了GPT-2,新模型基于40GB的文本资料训练得到,有15亿个参数 是当时最大的语言模型之一。与GPT-1相比,GPT-2的文本处理能力有了显著提升,它可以生成更加自然和流畅的语言。

GPT-3: 在GPT-2的基础上,OpenAI 2020年又开发了一款更加强大的自然语言处理模型——GPT-3。GPT-3以570GB的资料作为语料训练得到,有1750亿个参数。

GPT-3.5: 在GPT-3的基础上,2022年3月OpenAI发布了GPT3.5模型,该模型同样也有1750亿个参数,并且基于GPT3.5推出了对应的聊天机器人ChatGPT,自此OpenAI一战封神,将人工智能推上了巅峰。

GPT-4.0: 2023年3月OpenAI推出了GPT-4.0,该模型据说有1.7万亿个参数,可以同时处理文字和图像号称地表最强大模型,只不过收费了价格还不便宜。

ChatGPT的应用

基于GPT-3.5的思想,OpenAI开发了一个针对对话场景的自然语言处理机器人——ChatGPT。具有强大的对话生成能力,它可以生成自然流畅的对话。它还可以进行问题回答、图像描述、翻译、文本分类、知识图谱等多种自然语言处理任务。ChatGPT已经成为一个非常受欢迎的自然语言处理模型,被广泛应用于智能客服、智能问答、聊天机器人等领域。

1.智能问答: 可以智能回答各个领域的知识问题,答案质量好 响应快。

2.文本翻译: 可以进行文本和内容的翻译。

3.摘要总结: 可以总结提取大段文章和内容的核心要点,梳理内容脉络.。

4.文本生成: 可以根据关键字和内容提示,生成新的文章,用来写小作文很不错 例如生成诗歌、新闻报道、小说等。

5.信息检索: 可以快速帮你梳理和查找对应领域的知识点和内容。

6.聊天机器人: 可以作为聊天机器人使用,与您进行简单的对话并提供有用的信息和资源。

7.情感分析: 可以分析文本的情感,并判断其中是否包含正面、负面或中性情感。

8.图像描述: 可以根据输入的图像生成文字描述,不过得用GPT4.0,GPT3.5目前不支持图像的处理。

9.搜索引擎优化: 如果有网站或者博客,它可以提供有关搜索引擎优化的建议和技巧.

10.知识图谱:它可以提供有关特定主题的知识图谱,并且可以回答与知识图谱相关的问题。

11.辅助编程: 可以回答各种编程相关的问题,并且可以为编程者提供建议和帮助。

注: 知识图谱是一种强大的知识表示和组织方式,通过将信息以图形结构的形式表示出来,使得计算机能够更好地理解和利用这些知识,从而实现各种智能应用.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/798752.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

@SpringBootApplication 详解

SpringBootApplication 详解 SpringBootApplication标识在Spring工程的引导启动类上,是Spring最最最重要的注解,封装了如下注解: SpringBootConfiguration:底层封装了Configuration,用于声明当前类也是一个配置类。E…

PPT在线压缩工具推荐

有时候使用邮箱发送邮件时,添加的PPT、Word、PDF文档总会因为过大而转为其他类型的附件发送,不仅上传缓慢,对方查收下载时还有有效期限制,7天或15天后就过期再也无法下载了,有没有什么办法可以压缩PPT等文档&#xff0…

【QT+QGIS跨平台编译】076:【libdxfrw跨平台编译】(一套代码、一套框架,跨平台编译)

点击查看专栏目录 文章目录 一、libdxfrw介绍二、QGIS下载三、文件分析四、pro文件五、编译实践一、libdxfrw介绍 libdxfrw是一个用于读取和写入DXF(Drawing Exchange Format)文件的开源C++库。DXF是一种由AutoCAD开发的文件格式,用于存储CAD(计算机辅助设计)图形数据,它…

【大数据】安装hive-3.1.2

1、上传HIVE包到/opt/software目录并解压到/opt/modules/ tar -zxvf apache-hive-3.1.2-bin.tar.gz -C /opt/modules/ 2、修改路径 mv /opt/modules/apache-hive-3.1.2-bin/ /opt/modules/hive 3、将hIVE下的bin目录加入到/etc/profile中 export HIVE_HOME/opt/module…

3d怎么在一块模型上开个孔---模大狮模型网

在进行3D建模时,有时候需要在模型上创建孔,以实现特定的设计需求或功能。无论是为了添加细节,还是为了实现功能性的要求,创建孔都是常见的操作之一。本文将介绍在3D模型上创建孔的几种常用方法,帮助您轻松实现这一目标…

pytorch 演示 tensor并行

pytorch 演示 tensor并行 一.原理二.实现代码 本文演示了tensor并行的原理。如何将二个mlp切分到多张GPU上分别计算自己的分块,最后做一次reduce。 1.为了避免中间数据产生集合通信,A矩阵只能列切分,只计算全部batch*seqlen的部分feature 2.因为上面的步骤每张GPU只有部分featu…

使用dotnet-dump 查找 .net core 3.0 占用CPU 100%的原因解析

这篇文章介绍了3个工具 •dotnet-counters: 实时统计runtime的状况, 包括 CPU、内存、GC、异常等 •dotnet-trace: 类似性能探测器 •dotnet-dump: 程序崩溃时使用该工具 这次使用的是dotnet-dump, 即使程序没有崩溃, 也可以dump程序快照, 用于分析 实验环境 ubuntu-16.04.5-…

「PHP系列」PHP 循环详解

文章目录 一、while - 只要指定的条件成立,则循环执行代码块二、do...while - 首先执行一次代码块,然后在指定的条件成立时重复这个循环三、for - 循环执行代码块指定的次数四、foreach - 根据数组中每个元素来循环代码块五、相关链接 一、while - 只要指…

2024 Tuxera NTFS for Mac功能介绍及如何安装使用

随着科技的发展,我们的日常生活和工作越来越依赖于电子设备。而在这些设备中,Mac由于其出色的稳定性和易用性,成为了许多用户的首选。然而,尽管Mac自带的文件系统已经足够强大,但仍有一些用户希望获得更加高效、稳定的…

Java学习笔记NO.30

1. ArrayList ArrayList是Java中最常用的动态数组实现。它可以自动扩展以容纳任意数量的元素,并提供了快速的随机访问能力。 import java.util.ArrayList; public class ArrayListExample { public static void main(String[] args) { // 创建 ArrayList Array…

【氮化镓】在轨实验研究辐射对GaN器件的影响

【Pioneering evaluation of GaN transistors in geostationary satellites】 摘要: 这篇论文介绍了一项为期6年的空间实验结果,该实验研究了在地球静止轨道上辐射对氮化镓(GaN)电子元件的影响。实验使用了四个GaN晶体管&#xf…

如何水出第一篇SCI:SCI发刊历程,从0到1全过程经验分享!!!

如何水出第一篇SCI:SCI发刊历程,从0到1全路程经验分享!!! 详细的改进教程以及源码,戳这!戳这!!戳这!!!B站:Ai学术叫叫兽e…

代码随想录算法训练营第四十天|leetcode139题

一、leetcode第139题 本题是完全背包问题&#xff0c;由于可以重复使用&#xff0c;因此需要先遍历背包再遍历物品&#xff0c;dp[i]的含义是在长度为i处能否从数组中找到元素组成。 具体代码如下&#xff1a; class Solution { public:bool wordBreak(string s, vector<…

WPS解决插入公式在正文带来行间距变大问题

问题描述 写论文解释公式时&#xff0c;插入对应的变量&#xff0c;导致行间距变大&#xff0c;如图 显然上文与下文行间距不等。但无法通过修改数值修改下文行间距。 解决办法

java - 读取配置文件

文章目录 1. properties2. XML(1) dom4j(2) XPath 1. properties // 创建properties对象用于读取properties文件Properties properties new Properties();properties.load(new FileReader("src/main/resources/test.properties"));String name properties.getPrope…

消息队列之RabbitMQ的安装配置

一&#xff0c;前言 RabbitMQ是由erlang语言开发&#xff0c;基于AMQP&#xff08;Advanced Message Queue 高级消息队列协议&#xff09;协议实现的消息队列&#xff0c;它是一种应用程序之间的通信方法&#xff0c;消息队列在分布式系统开发中应用非常广泛。点击跳转RabbitM…

3、计算机的执行过程

三、存储器 1、存储器的分类 按存储器介质份分类 半导体存储器&#xff08;TTL&#xff08;集成度低、功耗高、速度快&#xff09;、MOS&#xff08;功耗低&#xff0c;集成度高&#xff09;&#xff09;。U盘等&#xff1b;易失 磁表面存储器&#xff08;磁头、载磁体&#xf…

90天玩转Python—05—基础知识篇:Python基础知识扫盲,使用方法与注意事项

90天玩转Python系列文章目录 90天玩转Python—01—基础知识篇:C站最全Python标准库总结 90天玩转Python--02--基础知识篇:初识Python与PyCharm 90天玩转Python—03—基础知识篇:Python和PyCharm(语言特点、学习方法、工具安装) 90天玩转Python—04—基础知识篇:Pytho…

SSM整合----第一个SSM项目

文章目录 前言一、使用步骤1.引入库2.建表3 项目结构4 web.xml的配置5 配置数据源6 SpringMVC配置7 配置MyBatis Mapper8 书写控制类 总结 前言 提示&#xff1a;这里可以添加本文要记录的大概内容&#xff1a; SSM整合是指Spring、SpringMVC和MyBatis这三个框架的整合使用。…

MTK i500p AIoT解决方案

一、方案概述 i500p是一款强大而高效的AIoT平台&#xff0c;专为便携式、家用或商用物联网应用而设计&#xff0c;这些应用通常需要大量的边缘计算&#xff0c;需要强大的多媒体功能和多任务操作系统。该平台集成了Arm Cortex-A73 和 Cortex-A53 的四核集群&#xff0c;工作频…