XTuner 大模型单卡低成本微调实战

XTuner 大模型单卡低成本微调实战

  • Finetune简介
    • 增量预训练微调
    • 指令跟随微调
    • LoRA
  • XTuner介绍
    • 功能亮点
  • 8GB显存玩转LLM
    • Flash Attention
    • DeepSpeed ZeRO
  • 上手操作
    • 平台
    • 激活环境
    • 微调

参考教程:XTuner

Finetune简介

LLM的下游应用任务中,增量预训练指令跟随是经常会用到的两种微调模式

增量预训练微调

使用场景:让基座模型学习到一些新知识,如某个垂直领域的常识
训练数据:文章、代码、书籍等

指令跟随微调

使用场景:让模型学会对话模版,根据人类指令进行对话
训练数据:高质量的对话、问答数据
在这里插入图片描述

在这里插入图片描述
在实际对话时,经常有三种角色

  • system 给定一些上下文信息 比如:你是一个xxx
  • user 实际用户 给提出一些问题
  • Assistant 根据user的输入,结合system的上下文信息 作出回答
    在这里插入图片描述
    在这里插入图片描述

LoRA

LoRA是通过在原本的Linear旁,新增一个支路,包含两个连续的小Linear 新增的这个支路通常叫做Adapter
Adapter参数远小于原本的Linear 能大幅减低训练的显存消耗。
在这里插入图片描述
在这里插入图片描述

XTuner介绍

功能亮点

适配多种生态

  • 多种微调算法
  • 适配多种开源生态
  • 自动优化加速
    在这里插入图片描述

8GB显存玩转LLM

Flash Attention 和 DeepSpeed ZeRO是XTuner最重要的两个优化技巧

Flash Attention

将Attention计算并行化 避免了计算过程中Attention Score NxN的显存占用

DeepSpeed ZeRO

通过将训练过程中的参数、梯度和优化器状态切片保存,能够在多GPU训练时使用FP16的权重,相较于Pytorch的AMP训练,在单GPU上也能大幅节省显存

在这里插入图片描述

上手操作

平台

Ubuntu + Anaconda + CUDA/CUDNN + 8GB nvidia显卡

激活环境

conda create --name xtuner0.1.9 python=3.10 -y
mkdir xtuner019 && cd xtuner019
git clone -b v0.1.9  https://github.com/InternLM/xtuner
# 进入源码目录
cd xtuner# 从源码安装 XTuner
pip install -e '.[all]'

准备在 oasst1 数据集上微调 internlm-7b-chat

# 创建一个微调 oasst1 数据集的工作路径,进入
mkdir ~/ft-oasst1 && cd ~/ft-oasst1

微调

准备配置文件

XTuner 提供多个开箱即用的配置文件,用户可以通过下列命令查看:
# 列出所有内置配置
xtuner list-cfg

在这里插入图片描述

假如显示bash: xtuner: command not found的话可以考虑在终端输入 export PATH=$PATH:‘/root/.local/bin’
拷贝一个配置文件到当前目录: # xtuner copy-cfg ${CONFIG_NAME} ${SAVE_PATH}

cd ~/ft-oasst1
xtuner copy-cfg internlm_chat_7b_qlora_oasst1_e3 .

配置文件名的解释:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/624458.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

卓越协同,数字化运维:智能工单系统助力企业解决派单难题-亿发

不少企业的I运维部门在管理制度上存在架构混乱、分工不明、流程不透明等问题,导致部门内部和合作服务商之间的协作常常呈现出“踢皮球”的状态。因此,有效的企业运维协同管理显得尤为关键。然而,如果内部的协同流程设计不合理,过多…

软件测试|使用Python打印五子棋棋盘

简介 五子棋是我们传统的益智类游戏,在制作五子棋时,我们需要先将棋盘打印出来,本文就来介绍一下使用Python打印五子棋棋盘。 步骤一:打印空棋盘 首先,我们需要在Python中定义一个棋盘函数,该函数将打印…

DHCP自动获取实验和DNS正向解析实验

一、服务程序 1.1DHCP定义 DHCP(动态主机配置协议)是一个局域网的网络协议。指的是由服务器控制一段IP地址范围,客户机登录服务器时就可以自动获得服务器分配的IP地址和子网掩码。默认情况下,DHCP作为Windows Server的一个服务组…

基于JavaWeb+BS架构+SpringBoot+Vue电影订票系统系统的设计和实现

基于JavaWebBS架构SpringBootVue电影订票系统系统的设计和实现 文末获取源码Lun文目录前言主要技术系统设计功能截图订阅经典源码专栏Java项目精品实战案例《500套》 源码获取 文末获取源码 Lun文目录 1 绪 论 3 1.1研究背景和意义 3 1.2拟解决的问题及特性 3 1.3论文的结构 …

目标检测中的数据增强

整个代码参考:bubbliiiing/object-detection-augmentation。 random_data.py import cv2 import numpy as np from PIL import Image, ImageDrawdef rand(a=0, b=1):return np.random.rand()*(b-a) + adef get_random_data(annotation_line, input_shape, jitter=.3, hue=.1…

下一代 Vue3 Devtools 正式开源

什么是 Vue DevTools Vue DevTools 是一个旨在增强 Vue 开发人员体验的工具,它提供了一些功能来帮助开发者更好地了解 Vue 应用程序。 Vue DevTools:Unleash Vue Developer Experience. Enhance your Vue development journey with an amazing experience! 典型的功能特征包…

3d云渲染用什么显卡比较好?3d云渲染显卡推荐

3D云渲染能加快渲染速度,是众多公司的首选方案,作为公司负责人,选择哪个平台值得思考,今天我就说下我的选择吧。 首先我们要了解云渲染的渲染方式,云渲染的渲染方式分两种,一种是CPU渲染,一种是…

linux下编译ffmpeg 以及交叉编译并引入Android

linux下编译ffmpeg 下载: http://ffmpeg.org/download.html 支持mp3编码:ffmpeg自身只支持mp3的解码但是不支持mp3的编码,如果希望格式转换为mp3,我们可以先安装支持库lame:(使用时: ffmpeg -i audio.wav -acodec libmp3lame audio.mp3) #…

克服大模型(LLM)部署障碍,全面理解LLM当前状态

近日,CMU Catalyst 团队推出了一篇关于高效 LLM 推理的综述,覆盖了 300 余篇相关论文,从 MLSys 的研究视角介绍了算法创新和系统优化两个方面的相关进展。 在人工智能(AI)的快速发展背景下,大语言模型&…

从文本文件或 csv 文件读取信息的示例

如下表格说明文本文件或 csv 文件中的信息如何在 WinCC (TIA Portal) 中显示。 IO 域用作于显示,只有最有一个条目被输出。 注意 在此例中由于最后一条条目被搜索,脚本的运行系统会随着文件的尺寸增长而增长。先前示例中的配置在该示例中不是必须的。但是…

手把手教你使用Django如何连接Mysql

目录 一、引言 二、准备工作 三、配置Django连接MySQL 1、安装MySQL驱动: 2、配置数据库设置: 3、 创建数据库迁移: 四、编写Django模型和视图函数 1、编写模型: 2. 编写视图函数: 3. 编写模板: …

开关电源如何覆铜

开关电源如何覆铜 开关电源覆铜是一个很重要的技术方法,如果没有很好的覆铜,就有可能会造成开关电源芯片的损坏。先介绍常见的开关电源电路: 图 1开关电源电路 从左到右分别是非同步整流Buck电路和同步整流Buck电路,第二排从左到…

MIinW-W64交叉编译找不到‘mutex‘问题解决

问题 在linux下安装mingw-w64来交叉编译Windows的程序和库. 就像我之前的一篇博客提到的来进行mingw的交叉编译 这样默认安装的线程模型是win32模型.这个线程模型不支持mutex. 一般查找问题的过程: 线程模型通常包含互斥锁(mutex)作为线程同步的基本工…

Arduino快速上手esp8266方案开发

认识ESP8266 ESP8266 是 Espressif Systems 生产的 Wi-Fi 片上系统 (SoC)。它非常适合物联网和家庭自动化项目,目前有非常高的市场普及率,还有更加高端的同时支持wifi和蓝牙的双核心芯片ESP32,可以在乐鑫官网查看完整的芯片列表。 ESP8266芯…

Keepalived双机热备

学会构建双机热备系统学会构建LVSHA高可用群集 1.1 Keepalived概述及安装 Keepalived的官方网站位于http://www.keepalived.org/,本章将以yum方式讲解Keepalived的安装、配置和使用过程。在非LVS群集环境中使用时,Keepalived也可以作为热备软件使用 1.…

解决PS“暂存盘已满”错误

问题:PS“暂存盘已满”错误 原因: PS在运行时会将文件的相关数据参数保存到暂存区。当提醒暂存盘满时,说明你当前PS运行的使用盘符空间不足,所以在运行时一定要保留有足够的盘符空间来运行PS。 效果图 解决方案 注意: 我们在使用P…

光纤和光缆有何不同之处?

很多人会有这样的疑问,光纤和光缆有何不同之处?主要是因为光纤和光缆这两个名词容易引起混淆。在严格的定义下,光纤和光缆是两种不同的东西,然而在现实生活中,许多人仍然会混淆这两者。为了更好地理解光纤和光缆之间的…

Dubbo 模块探秘:深入了解每个组件的独特功能【二】

欢迎来到我的博客,代码的世界里,每一行都是一个故事 Dubbo 模块探秘:深入了解每个组件的独特功能 前言Dubbo-common公共逻辑模块Dubbo-remoting 远程通讯模块Dubbo-rpc 远程调用模块Dubbo-cluster 集群模块Dubbo-registry 注册中心模块Dubbo-…

【LeetCode】202. 快乐数(简单)——代码随想录算法训练营Day06

题目链接:202. 快乐数 题目描述 编写一个算法来判断一个数 n 是不是快乐数。 「快乐数」 定义为: 对于一个正整数,每一次将该数替换为它每个位置上的数字的平方和。然后重复这个过程直到这个数变为 1,也可能是 无限循环 但始终…

Nginx 配置反向代理 - part 3

继承上文: Nginx location 配置 - Part 2 之前 介绍了 nginx 配置web服务器, 但是用nginx 多的情况下是作为反向代理。 本问就是介绍如何利用nginx 配置反向代理服务。 什么是 反向代理 和 正向代理 一张图很清楚地表达了 正向代理 所谓正向代理就是…