大模型参数高效微调学习笔记

大模型参数高效微调学习笔记

github地址
billbill链接

1.分类

在这里插入图片描述
图中有五个大类:

  1. selective(选择性微调):BitFit,Attention Tuning
  2. soft prompts(提示微调):Prompt-tuning,P-tuning,Prefix-Tuning
  3. reparametrization-based(重参数化微调):Lora
  4. additive(增量微调):IA3
  5. adapters(适配器微调):Adapters

2.代表性的方法介绍

1.BitFit
将模型的所有偏置bias设为可训练的参数,其他部分设置为不可训练的。

2.Attention Tuning
将模型的所有注意力层Attention设为可训练的参数,其他部分设置为不可训练的。

3.Prompt-tuning
在模型的输入的prompt前面加入一个可训练Prompt embedding向量,模型的整个部分全部冻结,如下图。
在这里插入图片描述
如果Prompt embedding向量参数是随机初始化的,则是soft prompt,如果使用一段文本初始化(例如,“下面是一个情感任务”),则是hard prompt。

4.P-tuning
在Prompt-tuning的基础上,使用一个LSTM/MLP(或其他一个小的神经网络)获得Prompt embedding向量。除了LSTM/MLP部分,其他部分均冻结,即原模型的整个部分全部冻结。
在这里插入图片描述
5.Prefix-Tuning
在Transformers模型的每一层网络的前面都加一个可训练的past_key_values向量,原模型的整个部分全部冻结。
在这里插入图片描述
5.Lora
原模型的整个部分全部冻结,新增一部分参数W_lora,W_lora之后可以与原模型的参数进行合并。
在这里插入图片描述
在这里插入图片描述
6.IA3

通过训练一个向量,修改网络的激活值实现。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/32784.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微信小程序表单

在我们的课程中,我们深入探讨了微信小程序表单的开发和应用。以下是我们课程的主要内容和收获: 一、课程目标 本课程旨在帮助学生掌握微信小程序表单的基本概念、开发流程和最佳实践。学生将学习如何创建和配置表单组件,处理表单数据&#xf…

Unity和iOS原生专题四 Unity和iOS原生交互传值内存空间分配问题

一 调用方法一 1.1 Unity代码-Unity调方法传参,有返回值 [DllImport("__Internal")] // 给iOS传string参数,有返回值,返回值通过iOS的return方法返回给Unity private static extern string getIPv6(string mHost, string mPort) 1.2 iOS代码-iOS通过return方法,将…

Selenium进行Web自动化测试

Selenium进行Web自动化测试 SeleniumPython实现Web自动化测试一、环境配置 SeleniumPython实现Web自动化测试 一、环境配置 环境基于win10(X64) 安装Python;安装PyCham安装chomedriver chomedriver下载地址 可以查看本地chrome软件版本下载…

css中的一些符号代表什么选择器

**css中的一些符号代表什么选择器 空格(派生选择器) (相邻/下一个选择器) ~(兄弟选择器 ) 大于号(直接选择器) *(所有后代选择器) 空格(后代…

项目-博客驿站测试报告

测试用例设计 功能测试 该部分主要围绕对于博客系统的增删改查, 文章通过性审核, 关注功能等进行测试, 还进行了其它一些探索性的测试. 以上是作者设计的全部用例. BUG发现: 问题1: 当多端同时操作同一篇文章BUG 环境: Windows11, Edge和Chrome浏览器 复现步骤: 1.先使用Edg…

基于协方差信息的Massive MIMO信道估计算法性能研究

1. 引言 随着移动互联网不断发展,人们对通信的速率和可靠性的要求越来越高[1]。目前第四代移动通信系统已经逐渐商用,研究人员开始着手研究下一代移动通信系统相关技术[2][3]。在下一代移动通信系统中要求下行速率达到10Gbps,这就要求我们使…

BFS:解决多源最短路问题

文章目录 什么是多源最短路问题?1.矩阵2.飞地的数量3.地图的最高点4.地图分析总结 什么是多源最短路问题? 多源最短路问题(Multi-Source Shortest Path Problem,MSSP)是图论中的一个经典问题,它的目标是在…

支付系统的渠道路由架构设计

图解支付系统的渠道路由设计 渠道路由是引导流量路径的关键,其设计至关重要。本文详解渠道路由概念、必要性及形态,并分享一个高效实用的基于规则的渠道路由设计方案。 注:有些公司称渠道为通道,都是一个意思,为方便起…

【React】ref

概述 使用 ref 引用值 – React 中文文档 希望组件“记住”某些信息,但又不想让这些信息更新时 触发新的渲染 时,可以使用 ref 。 也就是说 ref 对象 包裹的值 React 追踪不到的,他像是用来存储组件信息的秘密“口袋”。 与 state 相同的是…

基于uni-app和图鸟UI开发上门服务小程序

一、技术栈选择 uni-app:我们选择了uni-app作为开发框架,因为它基于Vue.js,允许我们编写一次代码,发布到多个平台,包括iOS、Android、Web以及各种小程序。uni-app的丰富组件库、高效的状态管理以及便捷的预览调试功能&…

【PL理论深化】(3) MI 归纳法:归纳假设 (IH) | 结构归纳法 | 归纳假设的证明

💬 写在前面:所有编程语言都是通过归纳法定义的。因此,虽然编程语言本身是有限的,但用该语言编写的程序数量是没有限制的,本章将学习编程语言研究中最基本的归纳法。本章我们继续讲解归纳法,介绍归纳假设和…

软件设计师笔记-操作系统知识

操作系统的作用 操作系统(Operating System, OS)在计算机系统中扮演着至关重要的角色。通过资源管理提高计算机系统的效率;改善人机界面,向用户提供友好的工作环境。 通过资源管理提高计算机系统的效率: 处理器管理:操作系统负责管理和调度计算机的中央处理器(CPU)资源…

【论文阅读】场景生成及编辑3D定位论文阅读

<div id"content_views" class"htmledit_views" style"user-select: auto;"><div class"kdocs-document"> 前置知识 归纳偏置 关于归纳偏置的理解&#xff1a;首先推荐一篇解释归纳偏置非常好的博客&#xff1a;浅谈归纳…

BASH脚本

先打开一个子bash&#xff0c;然后执行脚本&#xff0c;再退出子bsah { 1.指定解释器的方式 bash ***&#xff08;脚本名或脚本的绝对路径&#xff09; sh ***&#xff08;脚本名或脚本的绝对路径&#xff09; 3.路径方式引用脚本&#xff08;标准的执行命令&#xff0c;需要执…

CEM客户体验管理

客户体验管理&#xff08;Customer Experience Management, CEM&#xff09;智能系统是一种集成 的解决方案&#xff0c;可帮助企业跟踪、分析和管理客户与公司的所有交互&#xff0c;从而提高客户体验和满意度。 系统功能应用 该系统的主要功能有会话质检、客户培训、商品体…

从入门到精通:网络基础(一)

前言 计算机网络是现代信息社会的基石&#xff0c;几乎所有的数字通信和数据交换都依赖于网络。理解网络的基本概念和技术&#xff0c;对于每一个IT从业者来说都是必不可少的。在这篇文章中&#xff0c;我们将从网络的起源和发展开始&#xff0c;逐步深入探讨局域网&#xff0…

Selenium WebDriver - 浏览器交互

本文翻译整理自&#xff1a;https://www.selenium.dev/documentation/webdriver/interactions/ 文章目录 一、获取浏览器信息1、获取头衔2、获取当前URL 二、浏览器导航1、导航到2、后退3、往前4、刷新 三、JavaScript警报、提示和确认1、警报2、确认3、提示 四、使用cookie1、…

STM32学习 修改系统主频

前面时钟树的学习说明单片机的主频是可以修改的&#xff0c;那么怎么更改系统的主频&#xff0c;这里做一个简单的介绍。首先要明白&#xff0c;单片机的程序是如何运行&#xff0c;这里简单说明一下。 对应的代码在startup_stm32....文件里面&#xff0c;这里是复位程序的汇编…

多分类情绪识别模型训练及基于ChatGLM4-9B的评论机器人拓展

你的下一个微博罗伯特何必是罗伯特 这是一篇我在使用开源数据集(Twitter Emotion Dataset (kaggle.com))进行情绪识别的分类模型训练及将模型文件介入对话模型进行应用的过程记录。当通过训练得到了可以输入新样本预测的模型文件后&#xff0c;想到了或许可以使用模型文件对新样…

JavaScript的学习之旅之初始JS

目录 一、认识三个常见的js代码 二、js写入的第二种方式 三、js里内外部文件 一、认识三个常见的js代码 <script>//写入js位置的第一个地方// 控制浏览器弹出一个警告框alert("这是一个警告");// 在计算机页面输入一个内容&#xff08;写入body中&#xff…