书生·浦语大模型实战营-学习笔记4

XTuner 大模型单卡低成本微调实战

在这里插入图片描述

Finetune简介

常见的两种微调策略:增量预训练、指令跟随
在这里插入图片描述
在这里插入图片描述

指令跟随微调

数据是一问一答的形式
对话模板构建
在这里插入图片描述
每个开源模型使用的对话模板都不相同
在这里插入图片描述

指令微调原理:
由于只有答案部分是我们期望模型来进行回答的内容,所以我们只对答案部分进行损失的计算
在这里插入图片描述

增量预训练微调

数据都是陈述句,没有问答形式
在这里插入图片描述
在这里插入图片描述

LoRA & QLoRA

XTuner中使用的微调原理:LoRA & QLoRA
如果我们要对整个模型的所有参数都进行调整的话,需要非常大的显存才能够进行训练,但是用LoRA的方法就不需要这么大的显存开销了
在这里插入图片描述
比较:全参数微调、LoRA、QLoRA
全参数微调:整个模型都要加载到显存中,所有模型参数的优化器也都要加载到显存中,显存不够根本无法进行·
LoRA:模型也是要先加载到显存中,但是我们只需要保存LoRA部分的参数优化器,大大减小了显存占用
QLoRA:加载模型时就使用4bit量化的方式加载(相当于不那么精确的加载),但是可以节省显存开销,QLoRA部分的参数优化器,还可以在GPU和CPU之间进行调度【这是Xtunner进行整合的功能 】,显存满了就自动去内存中去跑。

在这里插入图片描述

XTuner介绍

在这里插入图片描述
在这里插入图片描述

XTuner快速上手

  1. 安装
pip install xtuner
  1. 挑选配置模版
xtuner list-cfg -p internlm_20b
  1. 一键训练
xtuner train internlm_20b_qlora_oasst1_512_e3
  1. Config 命名规则
模型名internlm_20b ( 无 chat 代表是基座模型 )
使用算法qlora
数据集oasst1
数据长度512
Epoche3, epoch 3
![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/67e55262c53d4d988fa0948795877b8c.png) ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/2746f7cf958b47a1b2b388a43f5a9260.png) ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/3a93273b4b84489ca5be2e991156e1d6.png) ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/3a14ced892df4f02a58633f803aff1e9.png)

在这里插入图片描述
XTunner支持多数据的样本拼接,增加运行效率,输入模型,统一的进行梯度的传播
在这里插入图片描述
在这里插入图片描述
自定义数据集建议使用json格式
在这里插入图片描述

8GB显卡玩转LLM

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

动手实战环节

https://github.com/InternLM/tutorial/blob/main/xtuner/README.md

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/636349.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

蓝桥杯-最少刷题数

📑前言 本文主要是【算法】——最少刷题数的文章,如果有什么需要改进的地方还请大佬指出⛺️ 🎬作者简介:大家好,我是听风与他🥇 ☁️博客首页:CSDN主页听风与他 🌄每日一句&#x…

一文搞清楚Java中的包、类、接口

写在开头 包、类、接口、方法、变量、参数、代码块,这些都是构成Java程序的核心部分,即便最简单的一段代码里都至少要包含里面的三四个内容,这两天花点时间梳理了一下,理解又深刻了几分。 Java中的包 Java 定义了一种名字空间&…

Centos7系统没有tab补全功能

问题: 新安装的centos7系统在执行命令的时候,没有tab补全命令 解决: 1.安装epel源 yum install -y epel-release 2.安装 bash-completion, bash-completion-extras yum install -y bash-completion bash-completion-extras 3.查…

接口测试 02 -- JMeter入门到实战

前言 JM eter毕竟是做压测的工具,自动化这块还是有缺陷。 如果公司做一些简单的接口自动化,可以考虑使用JMeter快速完成,如果想做完善的接口自动化体系,建议还是基于Python来做。 为什么学习接口测试要先从JMeter开始?…

Python——字符串的基本操作

⼀、 创建 s1 lenovo s2 "QF" s3 """hello lenovo""" s4 hello 亮 s5 """hello shark """ s6 hello world ⼆、简单使⽤ 1.\ 转义符 testimony This shirt doesn\t fit me words hello \ns…

[Linux使用] 库依赖分析 LDD

查看程式运行所需的共享库,常用来解决程序因缺少某个库文件而不能运行的一些问题。 /opt/app/todeav1/test$ldd test libstdc.so.6 > /usr/lib64/libstdc.so.6 (0x00000039a7e00000) libm.so.6 > /lib64/libm.so.6 (0x0000003996400000) libgcc_s.so.1 > /lib64/libg…

json解析

1什么是json JSON(JavaScript Object Notation,JS对象简谱)是一种轻量级的数据交换格式。它是基于ECMAScript(欧洲计算机协会制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰…

卡尔曼滤波增益推导

该文章主要是记录温习卡尔曼滤波算法理论时的一些理解,重点讲解卡尔曼增益的推导过程。其中忽略了部分基础知识和详细的推导过程,阅读该文章需要本身已具备卡尔曼滤波基础。文章内容摘取自网络博客的部分内容,因为原文章的逻辑不是很通顺&…

pandas中,DataFrame.sample 的理解:

DataFrame.sample 是 pandas 库中 DataFrame 对象的方法,用于从数据框中抽取随机样本。 DataFrame.sample(nNone, fracNone, replaceFalse, weightsNone, random_stateNone, axisNone)n(int或None): 指定要抽取的样本数量。如果指…

NLP论文阅读记录 - 2021 | WOS 基于多头自注意力机制和指针网络的文本摘要

文章目录 前言0、论文摘要一、Introduction1.1目标问题1.2相关的尝试1.3本文贡献 二.问题定义和解决问题的假设问题定义解决问题的假设 三.本文方法3.1 总结为两阶段学习3.1.1 基础系统 3.2 重构文本摘要 四 实验效果4.1数据集4.2 对比模型4.3实施细节4.4评估指标4.5 实验结果4…

python222网站实战(SpringBoot+SpringSecurity+MybatisPlus+thymeleaf+layui)-帖子详情页实现

锋哥原创的SpringbootLayui python222网站实战: python222网站实战课程视频教程(SpringBootPython爬虫实战) ( 火爆连载更新中... )_哔哩哔哩_bilibilipython222网站实战课程视频教程(SpringBootPython爬虫实战) ( 火…

PiflowX组件-OracleCdc

OracleCdc组件 组件说明 Oracle CDC连接器允许从Oracle数据库读取快照数据和增量数据。 计算引擎 flink 组件分组 cdc 端口 Inport:默认端口 outport:默认端口 组件属性 名称展示名称默认值允许值是否必填描述例子hostnameHostname“”无是Or…

解决一个mysql的更新属性长度问题

需求背景: 线上有一个 platform属性,原有长度为 varchar(10),但是突然需要填入一个11位长度的值;而偏偏这个属性在线上100张表中有50张都存在,并且名字各式各样,庆幸都包含 platform;例如 platf…

JavaSE核心基础-方法-笔记

1.方法概述 将一些代码抽取出来,放到单独的代码块中,形成方法,可以反复调用。 2.方法的定义格式以及解释 格式: 修饰符 返回值类型 方法名 (参数列表){ //方法主…

非科班转码的秋招复盘:地理信息科学GIS专业到后端研发、软件开发

本文介绍地理信息科学(GIS)专业的2024届应届生,在研三上学期期间,寻找后端研发、软件开发等IT方向工作的非科班转码秋招情况。 首先,这篇文章一开始写于2023年年底,当时为了参加一个征文活动,所…

Python爬虫的9个具体应用场景案例分析与具体应用。

文章目录 前言一、新闻采集二、数据挖掘三、网站监测四、舆情分析五、爬虫定制化开发六、数据采集与处理七、网络安全八、网络营销九、自动化测试关于Python技术储备一、Python所有方向的学习路线二、Python基础学习视频三、精品Python学习书籍四、Python工具包项目源码合集①P…

嵌入式学习-网络编程-Day6

嵌入式学习-网络编程-Day6 一、思维导图 二、作业 1.基于UDP的网络聊天室(2024.1.21号前上交) 项目需求: 1.如果有用户登录,其他用户可以收到这个人的登录信息 2.如果有人发送信息,其他用户可以收到这个人的群聊信…

LabVIEW振动数据采集与分析系统

在这个项目中, LabVIEW软件配合精确的硬件组件,以实现高效的振动数据采集和复杂信号分析。硬件方面,系统采用了PCB振动加速度传感器的高灵敏度传感器,以及NI9234型号的数据采集卡,确保了数据采集的高精度和可靠性。软件…

Leetcode刷题-(6~10)-Java+Python+JavaScript

算法题是程序员的基本功,也是各个大厂必考察的重点,让我们一起坚持写算法题吧 遇事不决,可问春风,春风不语,即是本心。 我们在我们能力范围内,做好我们该做的事,然后相信一切都事最好的安排就…

2024年对我懒这件事的弥补

一、回顾、前言 时光飞逝转眼2023年就“溜”走了,还记得我最后一次发博客是在2023.7.12 距离现在已经n天了,原因尽是懒! 拜拜,我继续偷懒去咯。 咳咳,显然这不可能,当然为了弥补大家我这个大好人也是憋…