预训练大模型LLM的微调PEFT（概述）

预训练大模型LLM的微调PEFT（概述）

news/2025/4/17 0:29:43/文章来源:https://blog.csdn.net/duzm200542901104/article/details/136219213

前言

大模型现在已经不是什么新奇玩意了，大家都耳熟能详，我们都知道大模型要从头到尾的训练，需要巨大的人力物力，如此高昂的费用小公司是难以承受的，那么我们是否可以像牛顿一样，站在巨人的肩膀上，利用已经训练好的大模型进行二次训练以适用于我们自己的应用呢？回答当然是肯定的，我们只需要极少量的训练数据和资源，就能将大模型改造以适应我们的应用。

微调的分类

对大模型进行二次训练的操作我们通常称为微调（Fine-Tuning），微调分为两种：

Full-Fine Tuning (FFT)

全参数微调，随着大模型的参数越多，使用FFT进行微调的时候，需要的训练数据和资源就会越多，所以该方法经常用在小尺寸的LLM上面，对于特大尺寸的LLM，如果训练数据过少，直接无法推动模型参数的变更。

Parameter-Efficient Fine-Tuning(PEFT)

参数有效的微调，该微调仅仅微调非常少（额外的）模型参数，而不需要微调模型的所有参数，这将显著的降低计算和存储成本，同时也能产生与完全微调模型相当的性能，这是不是让我们欣喜若狂，实现了我们既要……又要……的夙愿。其实PEFT是一个统称，不同的实现策略让PEFT又有进一步的分类，今天先列出来huggingface的peft包支持的微调方法，后续我再仔细讲解不同的peft方法的异同和相应的微调代码：

PROMPT_TUNING
MULTITASK_PROMPT_TUNING
P_TUNING
PREFIX_TUNING
LORA
ADALORA
ADAPTION_PROMPT
IA3
LOHA
LOKR
OFT
POLY

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/693959.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

2000-2022年上市银行相关指标数据

2000-2022年上市银行相关指标数据

2000-2022年上市银行相关指标数据 1、时间：2000-2022年 2、来源：附在文件内，见表格名称 3、指标：证券代码、证券简称、上市日期、上市公司(银行)类型、不良贷款余额、不良贷款拨备覆盖率、不良贷款比率、净利差、净息差、净息差…

阅读更多...

el-button 选择与非选择按钮批量处理

el-button 选择与非选择按钮批量处理

el-button 选择与非选择按钮批量处理 <el-button v-for"(voyage,i) in data[voyages][nowVoyage]":key"i"class"c-work-bts"type"primary":plain"nowWorkSpace!i"click"chooseWorkSpace(i)"size"small&qu…

阅读更多...

判断一个dll/exe是32位还是64位

判断一个dll/exe是32位还是64位

通过记事本判断（可判断C或者C#） 64位、将dll用记事本打开，可以看到一堆乱码，但是找到乱码行的第一个PE，如果后面是d?则为64位 32位、将dll用记事本打开，可以看到一堆乱码，但是找到乱码行的第…

阅读更多...

龙讯旷腾PWmat用户福利，DFTB紧束缚法上线！

龙讯旷腾PWmat用户福利，DFTB紧束缚法上线！

DFTB介绍 DFTB是基于密度泛函理论的紧束缚方法（Density Functional based Tight binding method）。其融合了DFT的准确性和紧束缚方法(TB)的高效性，是一种近似DFT的方法。通过使用预先计算的参数、最小基组、仅考虑最近邻相互作用&#xff0c…

阅读更多...

Prometheus+influxdb1.8实现高可用监控系统

Prometheus+influxdb1.8实现高可用监控系统

背景 Prometheus是业内有名的开源监控工具，我所在的公司也是采用PrometheusGrafana方式构建监控系统，并且不只是监控运维层面的数据，业务层面的服务状态也通过Java代码的客户端micrometer向Prometheus提交数据并在Grafana上配置出图&#xf…

阅读更多...

[小记]shell获取git最近一次提交信息

[小记]shell获取git最近一次提交信息

‘%H’: commit hash ‘%h’: abbreviated commit hash ‘%T’: tree hash ‘%t’: abbreviated tree hash ‘%P’: parent hashes ‘%p’: abbreviated parent hashes ‘%an’: author name ‘%aN’: author name (respecting .mailmap, see git-shortlog[1] or git-bl…

阅读更多...

day2：信号与槽

day2：信号与槽

思维导图使用手动连接，将登录框中的取消按钮使用t4版本的连接到自定义的槽函数中，在自定义的槽函数中调用关闭函数将登录按钮使用qt5版本的连接到自定义的槽函数中，在槽函数中判断u界面上输入的账号是否为"123",密码是否为"…

阅读更多...

【2024软件测试面试必会技能】allure测试报告(3): allure测试报告的用例描述设置

【2024软件测试面试必会技能】allure测试报告(3): allure测试报告的用例描述设置

allure测试报告的用例描述相关方法；如下图 allure标记用例级别severity 在做自动化测试的过程中，测试用例越来越多的时候，如果执行一轮测试发现了几个测试不通过，我们也希望能快速统计出缺陷的等级。 pytest结合allure框架可以对…

阅读更多...

R语言【base】——data.frame()：创建数据框，紧耦合的变量集合，它们共享矩阵和列表的许多属性，被大多数R建模软件用作基本数据结构。

R语言【base】——data.frame()：创建数据框，紧耦合的变量集合，它们共享矩阵和列表的许多属性，被大多数R建模软件用作基本数据结构。

Package base version 4.2.0 Description 创建数据框（data frame），紧耦合的变量集合，它们共享矩阵和列表的许多属性，被大多数R建模软件用作基本数据结构。数据框：一种在统计分析和数据处理中常用的数据结…

阅读更多...

二叉搜索树（二叉排序树、二叉查找树）

二叉搜索树（二叉排序树、二叉查找树）

二叉搜索树（二叉排序树、二叉查找树） 一、定义二、操作（一）中序遍历（二）查找（三）插入（四）删除三、二叉搜索树的应用四、二叉搜索树操作的性能分析五、总结一…

阅读更多...

解锁服务器外联：TinyProxy一键搭建指南

解锁服务器外联：TinyProxy一键搭建指南

引言在服务器需要访问外网的情况下，由于网络安全等原因，许多生产服务器限制了对外网的访问。本文介绍如何通过在一台能够访问外网的服务器上部署TinyProxy来实现代理，使得其他服务器可以通过该代理访问外网。安装 TinyProxy是一个轻量级…

阅读更多...

java异常处理设计

java异常处理设计

异常的继承体系 java 中的异常的超类是 java.lang.Throwable(后文省略为 Throwable), 他有俩自类Exception和Error，Error是由jvm管理，我们不需要考虑。 RuntimeException是Exception的子类。检查异常（Checked Exceptions）&#…

阅读更多...

【kubernetes】认识K8S基础理论

【kubernetes】认识K8S基础理论

目录一、k8s是什么？ 二、为什么要用k8s？ 三、k8s的主要功能四、k8s的集群架构和组件 4.1k8s的集群架构介绍 4.2k8s的master的核心组件 ①kube-apiserver：作为所有服务请求的统一访问入口 ②kube-controller-manager：控制…

阅读更多...

腾讯云域名解析

腾讯云域名解析

腾讯云域名解析 1.登录腾讯云控制台，点击“云产品”，选择“云解析”，进入云解析界面；2.在此界面可以选择购买或者添加新的域名，若已经购买了域名，则在域名列表处选择需要解析的域名，点击“解析…

阅读更多...

用Python实现学生成绩数据分析

用Python实现学生成绩数据分析

我的代码使用了pygal库来创建一个简单的折线图，并将其保存为SVG格式的文件。下面是对您代码的分析： 学生成绩数据分析表： 分析代码： 导入库：您导入了pygal库，这是一个用于生成可缩放矢量图形（S…

阅读更多...

Chrome插件精选 — 颜色拾取

Chrome插件精选 — 颜色拾取

Chrome实现同一功能的插件往往有多款产品，逐一去安装试用耗时又费力，在此为某一类型插件挑选出比较好用的一款或几款，尽量满足界面精致、功能齐全、设置选项丰富的使用要求，便于节省一个个去尝试的时间和精力。 1. ColorZilla 下…

阅读更多...

Java 判断字符/字符串相等

Java 判断字符/字符串相等

通过判断相等的字符举例： import java.util.*;public class Main {public static void main(String[] args) {Scanner sc new Scanner(System.in);char ch sc.next().charAt(0);if (ch M)System.out.print("");elseSystem.out.print("不等于…

阅读更多...

vue保留用户在列表的操作记录， beforeRouteLeave离开当前组件缓存数据即可

vue保留用户在列表的操作记录， beforeRouteLeave离开当前组件缓存数据即可

最近遇到一个需求，用户在列表页的查询输入框输入条件后，点击查询，然后此时切换菜单，再回到之前的页面，希望能停留在上一次输入的结果上，如下例子，用户管理页面，输入yangfan这个关键词搜索后，结果如下图：当我此时点击权限管理后，再点击用户管理切回来，结果依旧如上…

阅读更多...

【leetcode题解C++】452.用最少数量的弓箭引爆气球 and 435.无重叠区间

【leetcode题解C++】452.用最少数量的弓箭引爆气球 and 435.无重叠区间

452. 用最少数量的弓箭引爆气球有一些球形气球贴在一堵用 XY 平面表示的墙面上。墙面上的气球记录在整数数组 points ，其中points[i] [xstart, xend] 表示水平直径在 xstart 和 xend之间的气球。你不知道气球的确切 y 坐标。一支弓箭可以沿着 x 轴从不同点完全…

阅读更多...

07.STL单调栈

07.STL单调栈

单调栈的特点： 1.自顶向下一次递增，也就是上小下大的栈单调栈代码： 算法思想：将不符合单调栈性质的弹出，符合的输入 #include<iostream> #include <stack> #include<queue> using namespace std…

阅读更多...

最新文章