AI大模型学习笔记一

AI大模型学习笔记一

news/2026/1/8 9:48:54/文章来源:https://blog.csdn.net/weixin_43679037/article/details/135577918

一、商业观点：企业借助大模型获得业务增长可能

在这里插入图片描述

二、底层原理：transformer

1）备注

①下面每个步骤都是自回归的过程（aotu-regressive）：已输出内容的每个字作为输入，一起生成下一个字
②合起来就是：y1输出之后，y1和x序列一起作为输出，来生成y2；y1和y2加x序列作为输入，来输出y3
③GPT3.5有1750亿参数，也就是1750亿维

2）运行步骤

①把一串输入的字符串拆分成x序列的结构
②再把这串x序列的输入字符串映射成z序列
（z序列是：z1、z2、z3、z4等，不一定必须是512维），每个z是512维坐标的向量，由512个坐标构成
③解码器根据传入的z序列生成y序列

3）编码器框架图

在这里插入图片描述
①左边是编码器，右边是解码器
②输入有两个预处理
1）input Embedding：把每个字都变成512个字去描述
2）positionnal Encoding：不仅要把每个字换成512个描述，而是还要关注每个字的位置（也就是关注词的主谓宾）
③linear做类似线性回归的东西
④softmax：把前序所有的计算结果转化成概率数字，有了概率数字才会知道蹦出来的下个数字是什么

三、应用技术：fine tune

链接

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/620395.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

华为OD机试2024年最新题库（Java）

华为OD机试2024年最新题库（Java）

我是一名软件开发培训机构老师，我的学生已经有上百人通过了华为OD机试，学生们每次考完试，会把题目拿出来一起交流分享。重要：2024年1月-5月，考的都是OD统一考试（C卷），题库已经整理…

阅读更多...

8-docker-compose命令操作容器报“no configuration file provided: not found”

8-docker-compose命令操作容器报“no configuration file provided: not found”

1.问题描述 docker-compose命令操作容器时，有时会报出“no configuration file provided: not found”问题 [root@centos79 opt]# docker-compose ps no configuration file provided: not found [root@centos79 opt]# 2.解决方案最常见的原因是没有在docker-compose.yml文…

阅读更多...

Promise高级版 - 通过输出题理解「Promise源码」

Promise高级版 - 通过输出题理解「Promise源码」

1 Promise源码分析 Promise的基本工作原理 Promise构造函数：Promise构造函数接受一个执行器函数作为参数，该函数有两个参数：resolve和reject。在构造函数内部，会创建一个Promise实例，并初始化其状态为pending。状态…

阅读更多...

【GNN2】PyG完成图分类任务，新手入门，保姆级教程

【GNN2】PyG完成图分类任务，新手入门，保姆级教程

上次讲了如何给节点分类，这次我们来看如何用GNN完成图分类任务，也就是Graph-level的任务。【GNN 1】PyG实现图神经网络，完成节点分类任务，人话、保姆级教程-CSDN博客图分类就是以图为单位的分类，举个例子&#xff1…

阅读更多...

设备树OF函数操作实验-读取设备节点backlight的整型属性

设备树OF函数操作实验-读取设备节点backlight的整型属性

一. 简介本文学习使用设备树操作 OF函数，读取设备节点的整型的属性值。读取设备树文件 imx6ull-14x14-evk.dts 中一个设备节点的信息。这里读取 backlight设备节点的属性值：读取整型的属性。注意：这里的整型数据都是 32位的数据。而非 …

阅读更多...

Open3D 点云等比例缩放（20）

Open3D 点云等比例缩放（20）

Open3D 点云等比例缩放（20）一、算法介绍二、算法实现1.代码世人慌慌张张，不过图碎银几两，偏偏这碎银几两，能解世间万种慌张。一、算法介绍实现这样一个功能，沿着中心，按照指定的比例，比如1/2，缩小或者放大点云，保存到新的文件中二、算法实现 1.代码 import…

阅读更多...

小程序基础学习（js混编）

小程序基础学习（js混编）

在组件中使用外部js代码实现数据改变先创建js文件编写一些组件代码编写外部js代码在组件的js中引入外部js 在 app.json中添加路径规则组件代码  <view><view>当前计数为{{count}}</view> <v…

阅读更多...

操作系统复习一、二章

操作系统复习一、二章

操作系统复习一、二章文章目录操作系统复习一、二章第一章计算机系统概述处理器中各寄存器的作用指令的执行过程中断存储器层次结构和CacheI/O 通信技术第二章操作系统概述大内核微内核大内核微内核操作系统的定义、目标和功能定义目标和功能操作系统的发展过程现代操…

阅读更多...

Kibana：使用反向地理编码绘制自定义区域地图

Kibana：使用反向地理编码绘制自定义区域地图

Elastic 地图（Maps）附带预定义区域，可让你通过指标快速可视化区域。地图还提供了绘制你自己的区域地图的功能。你可以使用任何您想要的区域数据，只要你的源数据包含相应区域的标识符即可。但是，当源数据不包含区域…

阅读更多...

半监督学习 - 半监督K均值（Semi-Supervised K-Means）

半监督学习 - 半监督K均值（Semi-Supervised K-Means）

什么是机器学习半监督K均值（Semi-Supervised K-Means）是K均值聚类算法的一种扩展，它结合了有标签数据和无标签数据进行聚类。在传统的K均值算法中，所有数据点都是无标签的，而在半监督K均值中，我们允许一部…

阅读更多...

RabbitMQ的高可用机制

RabbitMQ的高可用机制

通过搭建集群保证高可用 RabbitMQ的集群模式： 普通集群，镜像集群（开发时用的多），仲裁集群普通集群（标准集群）会在各个节点间共享部分数据（交换机和队列元信息）&#…

阅读更多...

最新域名群站开源系统：打造强大网站矩阵，引领SEO优化新潮流！

最新域名群站开源系统：打造强大网站矩阵，引领SEO优化新潮流！

搭建步骤第一步：安装PHP和MYSQL服务器环境对于想要深入了解网站建设的人来说，自己动手安装PHP和MYSQL服务器环境是必不可少的步骤。这将使你能够更好地理解网站的运行机制，同时为后续的网站开发和优化打下坚实基础。第二步：…

阅读更多...

QSpace：Mac上的简洁高效多窗格文件管理器

QSpace：Mac上的简洁高效多窗格文件管理器

在Mac用户中，寻找一款能够提升文件管理效率的工具是常见的需求。QSpace，一款专为Mac设计的文件管理器，以其简洁的界面、高效的多窗格布局和丰富的功能，为用户提供了一个全新的文件管理体验。 QSpace：灵活与功能丰富的结…

阅读更多...

ImportError: cannot import name ‘Doc‘ from ‘typing_extensions‘

ImportError: cannot import name ‘Doc‘ from ‘typing_extensions‘

在训练大模型时候出现：ImportError: cannot import name ‘Doc’ from ‘typing_extensions’ 。问题原因安装的typing_extensions版本不正确解决方法 pip install typing_extensions4.8.0

阅读更多...

Python Flask教程

Python Flask教程

Flask Doc: https://rest-apis-flask.teclado.com/docs/course_intro/what_is_rest_api/Github: https://github.com/tecladocode/rest-apis-flask-python 1. 最简单的应用最小应用 from flask import Flaskapp Flask(__name__)app.route("/") def hello_world()…

阅读更多...

手写webpack的loader

手写webpack的loader

一、概念帮助webpack将不同类型的文件转换为webpack可识别的模块。二、Loader执行顺序分类 pre：前置loadernormal：普通loaderinline：内联loaderpost：后置loader 执行顺序 4类loader的执行顺序为per>normal>inline&…

阅读更多...

MATLAB十六进制与十进制互相转换

MATLAB十六进制与十进制互相转换

MATLAB十六进制与十进制互相转换包含单个数字进行转换和数组进行转换（可用于串口数据解析）一、单个数字转换 1.十六进制转十进制 % 输入一个十六进制字符串 hexString = 51;% 使用 hex2dec 函数将十六进制转换为十进制 decimalValue = hex2dec(hexString);% 显示结果 d…

阅读更多...

极简Oracle 11g Release 2 (11.2.0.1.0)

极简Oracle 11g Release 2 (11.2.0.1.0)

注意：此法无法安装oracle11g(11.2.0.4)，会报如下错： [FATAL] [INS-10105] The given response file /assets/db_install.rsp is not valid. 一、下载解压ORACLE安装包。从 oracle 官网下载所需要的安装包，这里我们以 oracle 11…

阅读更多...

二级C语言备考5

二级C语言备考5

一、单选共40题 （共计40分） 第1题 （1.0分） 题号:6100 难度:中第1章下列叙述中正确的是 A:程序可以作为算法的一种表达方式 B:算法的有穷性是指算法的规模不能太大 C:算法的复杂度用于衡量算法的控制结…

阅读更多...

分类方法之逻辑回归

分类方法之逻辑回归

什么是逻辑回归逻辑回归是一种用于解决分类问题的统计分析方法。它是一种广义线性模型，主要用于预测一个事件的概率。逻辑回归通过将输入变量和权重进行线性组合，并通过一个特殊的函数（称为逻辑函数或Sigmoid函数）将结果转化为0…

阅读更多...

最新文章