Parameter-Efficient Fine-Tuning for Large Models: A Comprehensive Survey阅读笔记

Parameter-Efficient Fine-Tuning for Large Models: A Comprehensive Survey

综述阅读笔记
仅记录个人比较感兴趣的部分

基本知识

  1. PEFT的三种分类:additive, selective, reparameterized, and hybrid fine-tuning
    selective fine-tuning 不需要任何额外的参数,它从主干模型中选择一小部分参数,并且仅使它们可调,同时保持大多数参数在对下游任务进行微调期间保持不变。
    在这里插入图片描述

  2. LLM Evaluation的下游任务
    (1) the first type is the General Language Understanding Evaluation (GLUE) benchmark
    (2) the other type of dataset that has been used in recent LLM papers is common sense reasoning which integrated into our study caters to a variety of research facets: OpenBookQA, PIQA, Social IQA, HellaSwag, BoolQ, WinoGrande, ARC-easy, ARC-challenges

  3. PEFT的评估基准
    based on criteria such as performance, convergence, efficiency, combinability, scalability, and transferability.
    ShareGPT & Microsoft Azure Function Trace & Gamma process

PEFT的分类

  1. Additive PEFT
    (1) adapters
    比较感兴趣的的是CoDA
    【CoDA采用稀疏激活机制来提高推理效率。具体而言,CoDA使用软top-k选择过程,识别每层中的k个重要token,这些令牌将由冻结的预训练Transformer层和适配器分支处理,以保持模型准确性。相比之下,那些不重要的token只由适配器分支处理,而跳过繁重的预训练层,因此在不影响整体性能的情况下优化推理效率。】
    ✘没代码
    (2) soft prompt

  2. Selective PEFT
    (1)unstructured mask
    Diff pruning 将可学习的掩码应用于模型权重
    PaFi 选择具有最小绝对值大小的权重作为可训练的
    FishMask 使用Fisher信息近似决定参数的重要性
    Fish-Dip 相比于增加了每个训练周期的动态重计算
    LTSFT 引入Lottery Ticket Hypothesis确定参数重要性
    SAM使用二阶逼近确定掩码
    (2)structured mask
    SPT 使用一阶泰勒展开计算敏感参数

  3. Reparameterized PEFT
    LoRA
    NOAH --> NAS

PEFT的设计

  1. KV缓存
    SLoRA在统一内存池中采用统一分页机制,以分页的方式动态分配和管理内存

  2. 内存高效的PEFT方法

PEFT的系统设计挑战

PEFT的系统设计

  1. PEFT serving systems的系统性能的评价指标:
    System throughout
    Memory footprint :内存利用率来自于模型参数与kv cache
    Accuracy performance
    Quality of services
  2. PEFT training systems的有效性的评估指标:
    Accuracy performance :微调模型对下游任务的性能
    Compute cost :云服务器和边缘设备上前向和反向传播操作期间的计算成本
    Communication cost :指在云服务器和边缘设备之间传输中间数据过程中涉及的数据量

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/882139.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Axure横向菜单高级交互

亲爱的小伙伴,在您浏览之前,烦请关注一下,在此深表感谢! 课程主题:横向菜单高级交互 主要内容:横向菜单左右拖动、选中效果 应用场景:app横向菜单、pc后台动态区域 案例展示: 演…

SpringBoot技术的车辆管理流程自动化

4系统概要设计 4.1概述 本系统采用B/S结构(Browser/Server,浏览器/服务器结构)和基于Web服务两种模式,是一个适用于Internet环境下的模型结构。只要用户能连上Internet,便可以在任何时间、任何地点使用。系统工作原理图如图4-1所示: 图4-1系统工作原理…

uniapp-实现天地图以及行政区划图层覆盖

前言: 在uniapp中,难免会遇到使用地图展示的功能,但是百度谷歌这些收费的显然对于大部分开源节流的开发者是不愿意接受的,所以天地图则是最佳选择。 此篇文章,详细的实现地图展示功能,并且可以自定义容器宽…

探索 Jupyter 笔记本转换的无限可能:nbconvert 库的神秘面纱

文章目录 探索 Jupyter 笔记本转换的无限可能:nbconvert 库的神秘面纱背景:为何选择 nbconvert?库简介:nbconvert 是什么?安装指南:如何安装 nbconvert?函数用法:简单函数示例应用场…

安装vue发生异常:npm ERR! the command again as root/Administrator.

一、异常 npm ERR! The operation was rejected by your operating system. npm ERR! Its possible that the file was already in use (by a text editor or antivirus), npm ERR! or that you lack permissions to access it. npm ERR! npm ERR! If you believe this might b…

安卓开发中轮播图和其指示器的设置

在安卓开发中,轮播图(Carousel)是一种常见的UI组件,用于展示一系列图片或内容,用户可以左右滑动来切换不同的视图。轮播图通常用于展示广告、新闻、产品图片等。 轮播图的指示器(Indicator)则是…

大模型生图安全疫苗注入赛题解析(DataWhale组队学习)

引言 大家好,我是GISer Liu😁,一名热爱AI技术的GIS开发者。本系列文章是我跟随DataWhale 2024年10月实践赛的大模型生图安全疫苗注入赛道;本文主要整理本次赛事的基本流程和优化方法。💕💕😊 一…

IEC104规约的秘密之九----链路层和应用层

104规约从TCP往上,分成链路层和应用层。 如图,APCI就是链路层,ASDU的就是应用层 我们看到报文都是68打头的,因为应用层报文也要交给链路层发送,链路层增加了开头的6个字节再进行发送。 完全用于链路层的报文每帧都只有…

好用,易用,高效,稳定 基于opencv 的 图像模板匹配 - python 实现

在定位、搜索固定界面图块时,经常用到模板匹配,opencv自带的图像模板匹配好用,易用,高效,稳定,且有多种匹配计算方式。 具体示例如下: 模板图: 待搜索图: 具体实现代码…

FreeRTOS - 任务管理

在学习FreeRTOS过程中,结合韦东山-FreeRTOS手册和视频、野火-FreeRTOS内核实现与应用开发、及网上查找的其他资源,整理了该篇文章。如有内容理解不正确之处,欢迎大家指出,共同进步。 参考:https://rtos.100ask.net/zh/…

SpringColoud GateWay 核心组件

优质博文:IT-BLOG-CN 【1】Route路由: Gateway的基本构建模块,它由ID、目标URL、断言集合和过滤器集合组成。如果聚合断言结果为真,则匹配到该路由。 Route路由-动态路由实现原理: 配置变化Apollo 服务地址实例变化…

H3C设备连接方式

Console线本地连接 协议Serial,接口com口,波特率9600(设备管理器中查看com口) 适用于设备初次调试 使用Telnet远程访问 适用于设备上架配置好后的维护管理 使用SSH远程访问 数据传输过程加密,安全的远程访问

洞察数字化营销的本质

数字化营销,即借助互联网、移动互联网、社交媒体等数字技术与渠道实现营销目标。涵盖市场调研、品牌推广、产品销售到客户服务全过程。 其特点显著。精准定位是一大优势,利用大数据分析和人工智能,深入了解客户需求、兴趣和行为,精…

AdmX_new

0x00前言 因为环境问题,此次靶场都放在vm上。都为NAT模式。 靶机地址: https://download.vulnhub.com/admx/AdmX_new.7z 需要找到两个flag文件。 0x01信息搜集 搜集IP 确认目标IP为172.16.8.131,进一步信息搜集 获取端口开放情况,版本信…

多模态大语言模型(MLLM)-Blip3/xGen-MM

论文链接:https://www.arxiv.org/abs/2408.08872 代码链接:https://github.com/salesforce/LAVIS/tree/xgen-mm 本次解读xGen-MM (BLIP-3): A Family of Open Large Multimodal Models 可以看作是 [1] Blip: Bootstrapping language-image pre-training…

stm32 bootloader写法

bootloader写法: 假设app的起始地址:0x08020000,则bootloader的范围是0x0800,0000~0x0801,FFFF。 #define APP_ADDR 0x08020000 // 应用程序首地址定义 typedef void (*APP_FUNC)(void); // 函数指针类型定义 /*main函数中调用rum_app&#x…

【从零开始的LeetCode-算法】504. 七进制数

给定一个整数 num&#xff0c;将其转化为 7 进制&#xff0c;并以字符串形式输出。 示例 1: 输入: num 100 输出: "202"示例 2: 输入: num -7 输出: "-10"提示&#xff1a; -107 < num < 107 我的解答 class Solution {public String convertT…

大数据存储计算平台EasyMR:大数据集群动态扩缩容,快速提升集群服务能力

在当今的数据驱动时代&#xff0c;组织面临着数据量的爆炸性增长。为了有效管理和存储这些数据&#xff0c;许多组织依赖于 Hadoop 这样的分布式存储系统。Hadoop 集群通过在多个节点上存储数据的冗余副本&#xff0c;提供了高可靠性和可扩展性。然而&#xff0c;随着数据量的不…

ChatGPT国内中文版镜像网站整理合集(2024/10/06)

一、GPT中文镜像站 ① yixiaai.com 支持GPT4、4o以及o1&#xff0c;支持MJ绘画 ② chat.lify.vip 支持通用全模型&#xff0c;支持文件读取、插件、绘画、AIPPT ③ AI Chat 支持GPT3.5/4&#xff0c;4o以及MJ绘画 1. 什么是镜像站 镜像站&#xff08;Mirror Site&#xff…

Spring Boot在线考试系统:JavaWeb技术的应用案例

2相关技术 2.1 MYSQL数据库 MySQL是一个真正的多用户、多线程SQL数据库服务器。 是基于SQL的客户/服务器模式的关系数据库管理系统&#xff0c;它的有点有有功能强大、使用简单、管理方便、安全可靠性高、运行速度快、多线程、跨平台性、完全网络化、稳定性等&#xff0c;非常…