大语言模型LLM的一些点

大语言模型LLM的一些点

news/2025/4/27 3:57:27/文章来源:https://blog.csdn.net/wangyangzhizhou/article/details/132282413

LLM发展史

GPT模型是一种自然语言处理模型，使用Transformer来预测下一个单词的概率分布，通过训练在大型文本语料库上学习到的语言模式来生成自然语言文本。

GPT-1(117亿参数)，GPT-1有一定的泛化能力。能够用于和监督任务无关的任务中。
GPT-2(15亿参数），在生成方面表现出很大天赋，阅读摘要、聊天、续写、编故事。
GPT-3(1750亿参数)，作为一个自监督模型，可以完成自然语言处理的绝大部分任务，模仿人类叙事，创作定制诗歌，生成游戏剧本等。
InstructGPT是一个经过微调的新版GPT-3，可以将有害的不真实的有偏差的输出最小化。
ChatGPT是InstructGPT的衍生产品，将人类的反馈纳入训练的过程。更好的使模型输出与用户意料保持一致。
ChatGPT-4.0多模态数据支撑，智能程度更高、具备更强大的常识、Plugins插件。

关于大模型

AI大模型是“人工智能预训练大模型”的简称，包含了“预训练”和“大模型”两层含义，二者结合产生了一种新的人工智能模式，即模型在大规模数据集上完成了预训练后无需微调，或仅需要少量数据的微调，就能直接支撑各类应用。
预训练大模型具备大量基础知识，针对某个垂直领域只需做微调就能完成任务。
当前AI大模型包含自然语言处理(NLP)、计算机视觉（CV）等，统一整合的多模态大模型等。

语言模型

统计语言模型是在1990年代基于统计学习方法发展起来的。其基本思想是基于马尔科夫假设，例如根据最近的上下文预测下

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/37588.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

vue自定义指令--动态参数绑定

vue自定义指令--动态参数绑定

在企业微信侧边栏应用中，给dialog添加了拖拽功能，但是因为dialog高度超过了页面高度，所以高度100%时拖拽有个bug--自动贴到窗口顶部而且企业侧边栏宽高都有限制，拖拽效果并不理想，所以就想缩小dialog再进行拖拽。拖拽…

阅读更多...

IntelliJ IDEA和Android studio怎么去掉usage和作者提示

IntelliJ IDEA和Android studio怎么去掉usage和作者提示

截止到目前我已经写了 600多道算法题，其中部分已经整理成了pdf文档，目前总共有1000多页（并且还会不断的增加），大家可以免费下载下载链接：https://pan.baidu.com/s/1hjwK0ZeRxYGB8lIkbKuQgQ 提取码&#xf…

阅读更多...

java处理CSV文件

java处理CSV文件

文章目录 1. 方法2. maven依赖3. 示例代码 1. 方法 opencsv–>CSVParser；commons-csv–>CSVReader；有时候文本里有逗号可能会导致错误分割 2. maven依赖 <dependency><groupId>org.apache.commons</groupId><artifactId>…

阅读更多...

457. 环形数组是否存在循环

457. 环形数组是否存在循环

457. 环形数组是否存在循环原题链接：完成情况：解题思路：参考代码：经验吸取原题链接： 457. 环形数组是否存在循环 https://leetcode.cn/problems/circular-array-loop/description/ 完成情况： 解题思路…

阅读更多...

使用Pandas进行数据清理的入门示例

使用Pandas进行数据清理的入门示例

数据清理是数据分析过程中的关键步骤，它涉及识别缺失值、重复行、异常值和不正确的数据类型。获得干净可靠的数据对于准确的分析和建模非常重要。本文将介绍以下6个经常使用的数据清理操作： 检查缺失值、检查重复行、处理离群值、检查所有列的数据类型…

阅读更多...

explicit关键字和 static成员

explicit关键字和 static成员

explicit关键字和 static成员 1、explicit 关键字2、static成员（静态成员变量属于类的（只有所属这个类的对象才能修改），不同于全局变量（任何对象都能修改））2.1 定义和性质2.2 静态成员的使用场…

阅读更多...

opencv进阶02-在图像上绘制多种几何图形

opencv进阶02-在图像上绘制多种几何图形

OpenCV 提供了方便的绘图功能，使用其中的绘图函数可以绘制直线、矩形、圆、椭圆等多种几何图形，还能在图像中的指定位置添加文字说明。 OpenCV 提供了绘制直线的函数 cv2.line()、绘制矩形的函数 cv2.rectangle()、绘制圆的函数cv2.circle()、绘制椭圆的…

阅读更多...

【Quarkus技术系列】「云原生架构体系」在云原生时代下的Java“拯救者”是Quarkus，那云原生是什么呢？

【Quarkus技术系列】「云原生架构体系」在云原生时代下的Java“拯救者”是Quarkus，那云原生是什么呢？

云原生时代下的Java"拯救者" 在云原生时代，其实Java程序是有很大的劣势的，以最流行的spring boot/spring cloud微服务框架为例，启动一个已经优化好，很多bean需要lazy load的application至少需要3-4秒时间，内…

阅读更多...

广西一公司泄露22万个人信息，被罚23万

广西一公司泄露22万个人信息，被罚23万

近日，广西北海公安网安部门发现，北海某公司网站存在严重数据泄露问题，约22万个人信息数据已挂在暗网售卖。经查，涉案公司主要提供网上咨询服务，在日常工作中收集了个人和企业等大量公民信息，但公司存放数…

阅读更多...

【算法题】2547. 拆分数组的最小代价

【算法题】2547. 拆分数组的最小代价

题目： 给你一个整数数组 nums 和一个整数 k 。将数组拆分成一些非空子数组。拆分的代价是每个子数组中的重要性之和。令 trimmed(subarray) 作为子数组的一个特征，其中所有仅出现一次的数字将会被移除。例如，trimmed([3,1,2,4,3,4…

阅读更多...

一站式自动化测试平台-Autotestplat

一站式自动化测试平台-Autotestplat

3.1 自动化平台开发方案 3.1.1 功能需求 3.1.3 开发时间计划如果是刚入门、但有一点代码基础的测试人员，大概 3 个月能做出演示版(Demo)进行自动化测试，6 个月内胜任开展工作中项目的自动化测试。如果是有自动化测试基础的测试人员，大概 …

阅读更多...

python序列化反序列化和异常处理笔记

python序列化反序列化和异常处理笔记

迭代器迭代是访问集合元素的一种方式。迭代器是一个可以记住遍历的位置的对象。迭代器对象从集合的第一个元素开始访问，直到所有的元素被访问完结束。迭代器只能往前不会后退。 1. 可迭代对象我们已经知道可以对list、tuple、str等类型的数据使用for...in...的…

阅读更多...

面试热题（数组中的第K个最大元素）

面试热题（数组中的第K个最大元素）

给定整数数组 nums 和整数 k，请返回数组中第 k 个最大的元素。请注意，你需要找的是数组排序后的第 k 个最大的元素，而不是第 k 个不同的元素。输入: [3,2,1,5,6,4] 和 k 2 输出: 5提到数组中最大元素，我们往往想到就是先给数组…

阅读更多...

判断自己网络所在的NAT类型

判断自己网络所在的NAT类型

文章目录各NAT类型介绍软件准备流程各NAT类型介绍 NAT0: OpenInternet，没有经过NAT地址转换，公网IP NAT1: Full Cone NAT，动态家宽可以达到最优的状态，外网设备可以主动发信息给NAT1网络内的设备。 NAT2: Address-Restricted C…

阅读更多...

什么是JavaScript中的柯里化(Currying)和偏函数应用(Partial Application)？它们在JavaScript中有哪些应用场景？

什么是JavaScript中的柯里化(Currying)和偏函数应用(Partial Application)？它们在JavaScript中有哪些应用场景？

1、什么是JavaScript中的柯里化(Currying)和偏函数应用(Partial Application)？它们在JavaScript中有哪些应用场景？ 柯里化（Currying）和偏函数应用（Partial Application）是函数式编程中的两个重要概念&…

阅读更多...

Mybatis 源码 ④ ：TypeHandler

Mybatis 源码 ④ ：TypeHandler

文章目录一、前言二、DefaultParameterHandler1. DefaultParameterHandler#setParameters1.1 UnknownTypeHandler1.2 自定义 TypeHandler 三、DefaultResultSetHandler1. hasNestedResultMaps2. handleRowValuesForNestedResultMap2.1 resolveDiscriminatedResultMap2.2 creat…

阅读更多...

K8S系列二：实战入门

K8S系列二：实战入门

写在前面本文是K8S系列第二篇，主要面向对K8S新手同学，阅读本文需要读者对K8S的基本概念，比如Pod、Deployment、Service、Namespace等基础概念有所了解。尚且不熟悉的同学推荐先阅读本系列的第一篇文章：《K8S系列一：概…

阅读更多...

远程控制医疗行业应用解析：如何满足医院合规需求？

远程控制医疗行业应用解析：如何满足医院合规需求？

远程控制医疗行业应用解析：如何满足医院合规需求？ 作为一个起源于IT行业的技术，以远程桌面为基础的远程控制技术目前在医疗领域也已经有了比较广阔的应用前景，尤其是在医疗数字化系统/设备的远程运维场景，已经有了一些…

阅读更多...

如何正确下载tomcat？？？

如何正确下载tomcat？？？

亲爱的小伙伴，千万别再去找下网站下载啦，这样詪容易携带病毒。我们去官方网址下载。 Apache Tomcat - Welcome! 最后下载解压即可。。。

阅读更多...

正则表达式学习详解

正则表达式学习详解

正则表达式正则表达式（Regular Expression），通常简称为正则或正则表达式，是一种用于描述字符串模式的工具。它是由一系列字符和特殊字符组成的字符串，用于定义搜索模式或进行字符串匹配、替换、提取等操作。正则表…

阅读更多...

最新文章