【LLM第8篇】Delta Tuning

【LLM第8篇】Delta Tuning

pingmian/2025/7/6 10:34:15/文章来源:https://blog.csdn.net/pearl8899/article/details/140245290

如何对large-scale PLM进行调整呢？

一个有效的方式是delta tuning；只更新PLM中的一小部分参数，其它参数不动。

把解决任务的能力具象化成delta object这样的参数，只需要几十兆参数存储。

过去模型参数是随机的，现在预训练模型，已经学到了一些universal知识，针对下游任务，只需要学习一下将通用支持到专家领域的知识。

有如下几种delta tuning的方式：

1.另外增加一些参数；2.对模型中的特定参数进行学习；3.

增量tuning：

增加两个adapter 层，只需要增加0.5%左右的的参数

简化：不沿着模型做反向传播，在低维条件下进行，节省计算和显存。

优化：增加prefix-tuning，只在输入层增加；不想前面的，每层都加；效果不如前面的方法好。

只微调：bias；简单任务比较好用；复杂任务效果不太好。

Lora把模型的优化，不只是在低维，认为模型的优化是低秩的。

这些事情都是基于一个假设，模型的优化，本质上可以用一个很少代价来完成，可以把它映射到一个低维或者低秩的过程，用很简单的过程完成模型的优化。

adapter、predix tuning、Lora实际上做的事情都是大模型不动，只微调很少部分的参数。可以推导出更加通用的adapter变体。

理论分析：在满足一定边界条件下，低维的空间内，找到低维的表示；

不同的任务，微调方法不同，会有不同的效果，不是一种方法可以使用于所有任务。

delta tunig组合，效果会好一些。但是都不是最优；能否自动搜索找最优呢？

自学习的方法：能够用更少的参数，去完成delta tuning。

delta tuning方法具有迁移性。不同任务之间可以迁移。

batch size越大，节省越少？

总结：

1.用很少的参数，优化模型

2.参数越多，模型的结构越不重要。

论文和工具包：

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/pingmian/42428.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【MySQL】逻辑架构与存储引擎

【MySQL】逻辑架构与存储引擎

一、逻辑架构 1、MySQL逻辑架构我们可以根据上图来对sql的执行过程进行分析第一步：客户端与服务器建立一个连接，从连接池中分配一个线程处理SQL语句第二步：SQL接口接受SQL指令第三步：如果是5.7版本，就会先去缓存中…

阅读更多...

Git 一种分布式版本控制系统

Git 一种分布式版本控制系统

Git 是一种分布式版本控制系统，用于管理和追踪文件的修改历史。它具有以下基本概念和使用方式： 仓库（Repository）：Git 将文件存储在仓库中，并记录文件的修改历史。仓库可以是本地仓库或远程仓库&#xff0c…

阅读更多...

Python字符串处理常用的30种操作

Python字符串处理常用的30种操作

我们平时编写代码时，经常需要对字符串进行处理，本文详细介绍Python处理字符串常用的30种操作，并给出了对应的代码。分割使用split()方法将字符串按照指定的分隔符进行分割。 s "Hello,World" result s.split(","…

阅读更多...

国产AI芯片被撕下遮羞布，宁买阉割八成性能的NVIDIA，也不买国产

国产AI芯片被撕下遮羞布，宁买阉割八成性能的NVIDIA，也不买国产

曾经有传言指有国产AI芯片大受欢迎，还卖出了100万片，不过半年多时间过去，海外分析机构指出国内的互联网企业纷纷抢购NVIDIA阉割八成性能的H20，至于国产AI芯片则不获欢迎。导致如此结果，在于NVIDIA拥有许多独特的优势&…

阅读更多...

什么是voc数据，和coco数据的区别是什么？

什么是voc数据，和coco数据的区别是什么？

Pascal VOC 数据集格式 Pascal VOC 数据集的标注文件使用 XML 格式，每个图像对应一个 XML 文件，文件内容包含图像的元数据信息和目标的标注信息。XML 文件结构如下： <annotation><folder>VOC2007</folder><filename&g…

阅读更多...

【工具问题】macOS Ventura 下如何开启NTFS移动硬盘读写？

【工具问题】macOS Ventura 下如何开启NTFS移动硬盘读写？

花了半小时，网上检索了各种解决方案，发现还是下面这种方案可行，mark下方便下次遇到问题能更快速解决～ macOS Ventura 下如何开启NTFS移动硬盘读写？

阅读更多...

论文略读： LLaMA Pro: Progressive LLaMA with Block Expansion

论文略读： LLaMA Pro: Progressive LLaMA with Block Expansion

ACL 2024 人类通常在不损害旧技能的情况下获得新技能然而，对于大型语言模型（LLMs），例如从LLaMA到CodeLLaMA，情况正好相反。深度学习笔记：灾难性遗忘-CSDN博客——>论文提出了一种用于LLMs的新的预训练…

阅读更多...

Nettyの源码分析

Nettyの源码分析

本篇为Netty系列的最后一篇，按照惯例会简单介绍一些Netty相关核心源码。 1、Netty启动源码分析代码就使用最初的Netty服务器案例，在bind这一行打上断点，观察启动的全过程： 由于某些方法的调用链过深，节约篇幅&#xf…

阅读更多...

昇思MindSpore学习笔记4-03生成式--Diffusion扩散模型

昇思MindSpore学习笔记4-03生成式--Diffusion扩散模型

摘要： 记录昇思MindSpore AI框架使用DDPM模型给图像数据正向逐步添加噪声，反向逐步去除噪声的工作原理和实际使用方法、步骤。一、概念 1. 扩散模型Diffusion Models DDPM(denoising diffusion probabilistic model) （无）条件…

阅读更多...

【嵌入式DIY实例-ESP8266篇】-LCD ST7735显示BMP280传感器数据

【嵌入式DIY实例-ESP8266篇】-LCD ST7735显示BMP280传感器数据

LCD ST7735显示BMP280传感器数据文章目录 LCD ST7735显示BMP280传感器数据1、硬件准备与接线2、代码实现本文介绍如何将 ESP8266 NodeMCU 板 (ESP-12E) 与 Bosch Sensortec 的 BMP280 气压和温度传感器连接。 NodeMCU 微控制器 (ESP8266EX) 从 BMP280 传感器读取温度和压力值，…

阅读更多...

普通Java工程如何在代码中引用docker-compose.yml中的environment值

普通Java工程如何在代码中引用docker-compose.yml中的environment值

文章目录一、概述二、常规做法1. 数据库配置分离2. 代码引用配置3. 编写启动类4. 支持打包成可执行包5. 支持可执行包打包成docker镜像6. docker运行三、存在问题分析四、改进措施1. 包含environment 变量的编排文件2. 修改读取配置文件方式3. 为什么可以这样做五、运行效果…

阅读更多...

如何正确使用Redisson实现分布式锁

如何正确使用Redisson实现分布式锁

分布式锁主要用于保证在分布式系统中，对共享资源的互斥访问，防止多个进程同时操作造成数据不一致。Redis实现分布式锁具备高性能和高可靠性的优势。接下来，我将详细描述如何在Spring Boot项目中使用Redis实现分布式锁。常见的共享资源举例 …

阅读更多...

python库（6）：Pygments库

python库（6）：Pygments库

1 Pygments介绍在软件开发和文档编写中，代码的可读性是至关重要的一环。无论是在博客文章、技术文档还是教程中，通过代码高亮可以使程序代码更加清晰和易于理解。而在Python世界中，Pygments库就是这样一个强大的工具，它能够将各…

阅读更多...

ValueError: Expected EmbeddingFunction.__call__ to have the following signature

ValueError: Expected EmbeddingFunction.call to have the following signature

题意： 使用 langchain 时，特别是在定义或调用嵌入函数（Embedding Function）时，签名（函数的参数列表和返回类型）不符合预期问题背景： When I try to pass a Chroma Client to Lang…

阅读更多...

搭建论坛和mysql数据库安装和php安装

搭建论坛和mysql数据库安装和php安装

目录概念步骤安装mysql8.0.30 安装php 安装Discuz 概念搭建论坛的架构： lnmpDISCUZ l 表示linux操作系统 n 表示nginx前端页面的web服务 m 表示 mysql 数据库用来保存用户和密码以及论坛的相关内容 p 表示php 动态请求转发的中间件步骤 &#xff…

阅读更多...

【C++深度探索】：继承(定义赋值兼容转换作用域派生类的默认成员函数)

【C++深度探索】：继承(定义赋值兼容转换作用域派生类的默认成员函数)

✨ 愿随夫子天坛上，闲与仙人扫落花 🌏 📃个人主页：island1314 🔥个人专栏：C学习 🚀 欢迎关注：👍点赞…

阅读更多...

动态数组（java）

动态数组（java）

package arraList;public interface AbstractArray<E> {int size();//元素数量boolean isEmpty();//是否为空boolean contains(E element);//是否包含某个元素void add(E element);//添加元素到最后面E get(int index);//返回index位置对应的元素E set(int index,E eleme…

阅读更多...

CVE-2024-0603 漏洞复现

CVE-2024-0603 漏洞复现

CVE-2024-0603 源码：https://gitee.com/dazensun/zhicms 开题： CVE-2024-0603描述：ZhiCms up to 4.0版本的文件app/plug/controller/giftcontroller.php中存在一处未知漏洞。攻击者可以通过篡改参数mylike触发反序列化，从而远程…

阅读更多...

【c++设计模式20】行为模式5：备忘录模式（Memento Pattern）

【c++设计模式20】行为模式5：备忘录模式（Memento Pattern）

【c++设计模式20】行为模式5：备忘录模式（Memento Pattern）一、定义二、适用场景三、过程四、备忘录模式类图五、C++示例代码六、使用注意事项原创作者：郑同学的笔记原创地址：https://zhengjunxue.blog.csdn.net/article/details/132766604 qq技术交流群：921273910 类型…

阅读更多...

python脚本“文档”撰写——“诱骗”ai撰写“火火的动态”python“自动”脚本文档

python脚本“文档”撰写——“诱骗”ai撰写“火火的动态”python“自动”脚本文档

“火火的动态”python“自动”脚本文档，又从ai学习搭子那儿“套”来，可谓良心质量👍👍。 (笔记模板由python脚本于2024年07月07日 15:15:33创建，本篇笔记适合喜欢钻研python和页面源码的coder翻阅) 【学习的细节是欢悦…

阅读更多...

最新文章