QLoRA论文概述

QLoRA论文概述

news/2025/7/13 23:11:48/文章来源:https://blog.csdn.net/qq128252/article/details/134884456

QLORA: Efficient Finetuning of Quantized LLMs

QLoRA论文概述
- 前言（省流版本）
- 摘要
- 论文十问
- 实验
- - 实验1
  - - 数据集和模型
    - 实验结论
  - 实验2
  - - 数据集和模型
    - 实验结论
- 局限性
- - 模型尺度
  - 数据集
  - 其他微调方法

QLoRA论文概述

前言（省流版本）

微调需要大量显存资源。

之前工作的量化大都是在推理而非训练。

实验中发现数据的质量比数量重要。

评估采用人类和GPT-4相结合。

提出了三个技术方案实现单个GPU微调65B模型，达到和16位微调任务相同的性能

4-bit NormalFloat（NF4）量化：QLORA使用一种新的数据类型NF4，它在信息理论上最适合正态分布的权重，并在实践中优于4-bit整数和4-bit浮点数。
双量化：QLORA采用双量化方法，对量化常数进行第二次量化，从而减少每个参数的内存占用。
分页优化器：QLORA引入了分页优化器，在梯度检查点时防止内存溢出错误。这个方法使用NVIDIA统一内存特性，在CPU和GPU之间自动进行页面到页面的传输，以便在GPU内存不足时进行无错误的GPU处理。优化器状态分配分页内存，然后在GPU运行内存不足时自动逐出到CPU RAM，并在优化器更新步骤中重新分页到GPU内存。

摘要

我们提出了QLORA，这是一种有效的微调方法，它减少了内存使用，足以在单个48GB GPU上微调65B参数模型，同时保留完整的16位微调任务性能。

QLORA通过冻结的4位量化预训练语言模型将梯度反向传播到低秩适配器(Low Rank Adapters, LoRA)。我们最好的模型家族，我们命名为Guanaco，在Vicuna基准上优于之前所有公开发布的模型，达到ChatGPT性能水平的99.3%，而只需要在单个GPU上进行24小时的微调。

QLORA引入了许多创新来节省内存而不牺牲性能:(a) 4位NormalFloat (NF4)，这是一种新的数据类型，理论上对正态分布权重是最优的;(b)双量化，通过量化量化常量来减少平均内存占用;©分页优化器来管理内存峰值。

我们使用QLORA对1000多个模型进行了微调，提供了8个指令数据集、多种模型类型(LLaMA、T5)和常规微调无法运行的模型规模(例如33B和65B参数模型)上的指令跟随和聊天机器人性能的详细分析。

我们的结果表明，即使使用比以前的SoTA更小的模型，在小的高质量数据集上进行QLoRA微调也可以得到最先进的结果。我们提供了基于人类和GPT-4评估的聊天机器人性能的详细分析，表明GPT-4评估是人类评估的廉价和合理的替代方案。

此外，我们发现目前的聊天机器人基准并不值得信赖，无法准确评估聊天机器人的性能水平。一个柠檬分析显示了与ChatGPT相比，Guanaco失败的地方。我们发布了所有的模型和代码，包括用于4位训练的CUDA内核

论文十问

论文试图解决什么问题？

这篇论文试图解决大规模语言模型微调(finetuning)所需的巨大GPU内存问题,以使这类模型能在单GPU上进行微调。

这是否是一个新的问题？

是的,这是一个新的问题。以前的工作主要集中在推理时的量化,而没有研究过训练和微调过程中的量化。

这篇文章要验证一个什么科学假设？

这篇论文的核心科学假设是4比特量化微调可以不损失性能地实现16比特完全微调的效果。

有哪些相关研究？如何归类？谁是这一课题在领域内值得关注的研究员？

相关研究包括语言模型量化、低秩适配器微调等。值得关注的研究员有Tim Dettmers、Luke Zettlemoyer等。

论文中提到的解决方案之关键是什么？

关键的解决方案是提出了4比特NormalFloat数据类型,以及双量化和分页优化器等技术。这些技术协同工作,实现了高精度的4比特量化。

论文中的实验是如何设计的？

设计了不同模型结构、数据集和模型规模的比较实验,通过学术基准测试验验证了方法的有效性。

用于定量评估的数据集是什么？代码有没有开源？

使用的数据集包括GLUE、Super-Natural Instructions等,代码已在GitHub上开源。

论文中的实验及结果有没有很好地支持需要验证的科学假设？

是的,详细的实验结果充分验证了4比特量化微调能够不损失性能地实现16比特完全微调的效果这个核心科学假设。

这篇论文到底有什么贡献？

这篇论文的主要贡献是首次证明了4比特量化微调的有效性,并在此基础上训练出新状态的聊天机器人模型。

下一步呢？有什么工作可以继续深入？

后续可继续研究不同bit精度下的量化微调效果、在更大模型尺寸下的验证,以及在其他任务上的探索等。

实验

实验1

数据集和模型

GLUE、Super-Natural Instructions

RoBERTa-large 、T5

实验结论

我们的结果一致表明，具有NF4数据类型的4位QLORA在学术基准测试中具有良好的评估设置，与16位全调优和16位LoRA调优性能相匹配。我们还表明NF4比FP4更有效，双量化不会降低性能。综合起来，这形成了令人信服的证据，证明4位QLORA调优可靠地产生与16位方法相匹配的结果。

在这里插入图片描述

实验2

数据集和模型

MMLU:这是一个选择题基准，涵盖57个任务，包括小学数学、美国历史、计算机科学、法律等。

Alpaca、FLAN V2

实验结论

在Alpaca和FLAN v2上对不同数据类型的适配器进行微调后，LLaMA 7-65B模型的平均5次MMLU测试精度。总体而言，具有双量化(DQ)的NF4与BFloat16性能相当，而FP4始终比两者落后一个百分点。

在这里插入图片描述

局限性

模型尺度

在33B和65B模型尺度上，QLORA可能无法完全匹配16位全微调性能。这主要是由于资源成本巨大

数据集

虽然在MMLU、Vicuna基准和OA基准上进行了评估，但在BigBench、RAFT和HELM等其他基准上没有进行评估，因此无法确保评估结果推广到这些基准。

其他微调方法

除了LoRA之外，还有各种各样的参数有效微调(PEFT)方法没有参与到评估中。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/208043.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

期末速成数据库极简版【查询】（2）

期末速成数据库极简版【查询】（2）

目录 select数据查询----表【1】筛选列【2】where简单查询【3】top-n/distinct/排序的查询【4】常用内置函数常用日期函数常用的字符串函数【5】模糊查询【6】表数据操作——增/删/改插入更新删除【7】数据汇总聚合分类 🙂&#…

阅读更多...

人大金仓（kingbase）数据库常用sql命令

人大金仓（kingbase）数据库常用sql命令

一. 字段 1. 添加 alter table book add column book_id varchar not null, book_title varchar(10) default ;2. 删除 alter table book drop book_id, book_title;// 外键时 alter table book drop book_id, book_title cascade;3. 修改类型 alter table book alter colu…

阅读更多...

分享十几个适合新手练习的软件测试项目

分享十几个适合新手练习的软件测试项目

说实话，在找项目的过程中，我下载过（甚至付费下载过）N多个项目、联系过很多项目的作者，但是绝大部分项目，在我看来，并不适合你拿来练习，它们或多或少都存在着“问题”，比如…

阅读更多...

12v转48v升压电源芯片：参数、特点及应用领域

12v转48v升压电源芯片：参数、特点及应用领域

12v转48v升压电源芯片：参数、特点及应用领域随着电子设备的日益普及，电源芯片的需求也在不断增长。今天我们将介绍一款具有广泛应用前景的升压电源芯片——12v转48v升压电源芯片。该芯片具有宽输入电压范围、高效率、固定工作频率等特点，适…

阅读更多...

android 13.0 系统属性控制音量键功能是否可用开关(屏蔽音量加减功能)

android 13.0 系统属性控制音量键功能是否可用开关(屏蔽音量加减功能)

1.概述在13.0的系统定制化开发中，要求屏蔽掉音量+ 音量-的功能，根据系统属性来判断是否响应音量加减的功能，在系统上层中是由PhoneWindowManage来管理音量键的功能，所以就要看是PhoneWindowManage.java中怎么处理的音量键的功能首选看的源码关于音量键的处理 2.系统属…

阅读更多...

mp3的播放

mp3的播放

1.这段vue代码会播放声音，但是会有audio标签 <template><div><audio id"myAudio" controls><source src"./test.mp3" type"audio/mp3" />Your browser does not support the audio tag.</audio></…

阅读更多...

ubuntu22.04安装过程记录

ubuntu22.04安装过程记录

安装双系统ubuntu22.04 【双系统】如何安装ubuntu22.04系统_ubuntu安装教程-CSDN博客更换清华源打开清华源官网，搜索对应系统版本的镜像源码 https://mirrors.tuna.tsinghua.edu.cn/help/ubuntu/ 原文件备份 sudo cp /etc/apt/sources.list /etc/apt/source…

阅读更多...

库卡LBR_iisy_3_R760协作机器人导入到coppeliasim

库卡LBR_iisy_3_R760协作机器人导入到coppeliasim

1.从库卡官网xpert下载模型一般载都是这个step文件格式，其他的好像不太好用。coppeliasim导入格式用的是stl,需要用freeCAD打开重新转换一下。下载下来后，很多都是一个整体，在freeCAD导入中，导入选择要不勾选合并。下载完用CAD …

阅读更多...

正则表达式详细讲解

正则表达式详细讲解

目录一、正则表达式概念二、八元素 1、普通字符： 2、元字符： 3、通配符 .： 4、字符类 []： 5、量词： 6、锚点 ^ 和 $： 7、捕获组 ()： 8、转义字符 \： 三、日常使用的正则…

阅读更多...

markdown记录

markdown记录

文章目录基础操作使用一级列表、二级列表博文链接基础操作使用一级列表、二级列表博文链接 CSDN-Markdown语法集锦 CSDN-markdown语法之如何使用LaTeX语法编写数学公式 CSDN Markdown简明教程1-关于Markdown CSDN Markdown简明教程2-基本使用 CSDN Markdown简明教程3-表…

阅读更多...

Bash脚本调用百度翻译API进行中文到英文的翻译

Bash脚本调用百度翻译API进行中文到英文的翻译

写一个bash脚本调用百度翻译API进行中文到英文的翻译，首先需要进行相关的申请。看百度给出的文档链接: 百度翻译API文档需要先注册一个百度账号，然后申请APPID。脚本中会用到appid和key这两个值。按照文档给出的提示可以获得。如下是脚本： #…

阅读更多...

使用VBA创建Excel条件格式

使用VBA创建Excel条件格式

实例需求：数据总行数不确定，现需要将Category区域（即C列到J列）中第3行开始的区域设置条件格式，规则如下： 只对部分指定单元格应用色阶条件格式（3色）指定单元格应满足条件&#xff1…

阅读更多...

移动距离

移动距离

//偶数行需要反转，判断行数时,最后一个需要特判,可以用向上取整 //也可以把传入的值减一,下标从0开始 import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader;public class Main{static int w,m,n;static BufferedReader i…

阅读更多...

大数据技术1：大数据发展简史

大数据技术1：大数据发展简史

前言：学习大数据技术，知道会用已经够了，但是要想走得更远，应该了解它发展的来龙去脉，为何会有新的技术/工具的出现，相比老的技术有什么样的进步。 1、传统数据处理系统存在的问题随着信息时代互联网技术爆…

阅读更多...

JDBC简介及快速入门-黑马（P1）

JDBC简介及快速入门-黑马（P1）

黑马视频b站链接： 01-JDBC简介&快速入门_哔哩哔哩_bilibili 🐶一、JDBC 简介 JDBC 概念： JDBC 就是使用 Java 语言操作关系型数据库的一套 API。全称（Java DataBase Connectivity） Java 数据库连接 JDBC 本质…

阅读更多...

React 笔记 jsx

React 笔记 jsx

严格约定：React 组件必须以大写字母开头，而 HTML 标签则必须是小写字母。 React JSX JSX 是由 React 推广的 JavaScript 语法扩展。用于表达组件的特殊语法的 js 函数要求标签必须闭合；返回的组件必须包裹在一个父标签内； …

阅读更多...

鸿蒙4.0开发笔记之ArkTS语法基础之数据传递与共享详细讲解（十八）

鸿蒙4.0开发笔记之ArkTS语法基础之数据传递与共享详细讲解（十八）

文章目录一、路由数据传递（router）1、路由数据传递定义2、路由数据传递使用方法3、数据传递两个页面的效果二、页面间数据共享（EntryAbility）1、定义2、实现案例3、避坑点三、数据传递练习一、路由数据传递（router…

阅读更多...

PaaS（平台即服务）——云计算服务模型（特点，应用场景，优点和缺点，示例）

PaaS（平台即服务）——云计算服务模型（特点，应用场景，优点和缺点，示例）

PaaS（平台即服务）是云计算的一种服务模型，它提供了一个平台，允许客户开发、运行和管理应用程序，而无需建立和维护通常与这些过程相关的复杂基础设施。PaaS 是作为服务交付的一种方式，它提供了一套工具和服务…

阅读更多...

网卡学习资料整理

网卡学习资料整理

GMAC网卡相关介绍与分析 https://www.cnblogs.com/forwards/p/17101438.html https://www.eefocus.com/article/1635234.html Linux Phy 驱动解析_linux phy驱动-CSDN博客 GMAC接口五篇 https://blog.csdn.net/dkmknjk/category_11837422.html 以太网扫盲（一&am…

阅读更多...

麒麟V10服务器安装Apache+PHP

麒麟V10服务器安装Apache+PHP

安装PHP yum install php yum install php-curl php-gd php-json php-mbstring php-exif php-mysqlnd php-pgsql php-pdo php-xml 配置文件 /etc/php.ini 修改参数 date.timezone Asia/Shanghai max_execution_time 60 memory_limit 1280M post_max_size 200M file_upload…

阅读更多...

最新文章