Parameter-Efficient Fine-Tuning for Large Models: A Comprehensive Survey阅读笔记

Parameter-Efficient Fine-Tuning for Large Models: A Comprehensive Survey

综述阅读笔记
仅记录个人比较感兴趣的部分

基本知识

  1. PEFT的三种分类:additive, selective, reparameterized, and hybrid fine-tuning
    selective fine-tuning 不需要任何额外的参数,它从主干模型中选择一小部分参数,并且仅使它们可调,同时保持大多数参数在对下游任务进行微调期间保持不变。
    在这里插入图片描述

  2. LLM Evaluation的下游任务
    (1) the first type is the General Language Understanding Evaluation (GLUE) benchmark
    (2) the other type of dataset that has been used in recent LLM papers is common sense reasoning which integrated into our study caters to a variety of research facets: OpenBookQA, PIQA, Social IQA, HellaSwag, BoolQ, WinoGrande, ARC-easy, ARC-challenges

  3. PEFT的评估基准
    based on criteria such as performance, convergence, efficiency, combinability, scalability, and transferability.
    ShareGPT & Microsoft Azure Function Trace & Gamma process

PEFT的分类

  1. Additive PEFT
    (1) adapters
    比较感兴趣的的是CoDA
    【CoDA采用稀疏激活机制来提高推理效率。具体而言,CoDA使用软top-k选择过程,识别每层中的k个重要token,这些令牌将由冻结的预训练Transformer层和适配器分支处理,以保持模型准确性。相比之下,那些不重要的token只由适配器分支处理,而跳过繁重的预训练层,因此在不影响整体性能的情况下优化推理效率。】
    ✘没代码
    (2) soft prompt

  2. Selective PEFT
    (1)unstructured mask
    Diff pruning 将可学习的掩码应用于模型权重
    PaFi 选择具有最小绝对值大小的权重作为可训练的
    FishMask 使用Fisher信息近似决定参数的重要性
    Fish-Dip 相比于增加了每个训练周期的动态重计算
    LTSFT 引入Lottery Ticket Hypothesis确定参数重要性
    SAM使用二阶逼近确定掩码
    (2)structured mask
    SPT 使用一阶泰勒展开计算敏感参数

  3. Reparameterized PEFT
    LoRA
    NOAH --> NAS

PEFT的设计

  1. KV缓存
    SLoRA在统一内存池中采用统一分页机制,以分页的方式动态分配和管理内存

  2. 内存高效的PEFT方法

PEFT的系统设计挑战

PEFT的系统设计

  1. PEFT serving systems的系统性能的评价指标:
    System throughout
    Memory footprint :内存利用率来自于模型参数与kv cache
    Accuracy performance
    Quality of services
  2. PEFT training systems的有效性的评估指标:
    Accuracy performance :微调模型对下游任务的性能
    Compute cost :云服务器和边缘设备上前向和反向传播操作期间的计算成本
    Communication cost :指在云服务器和边缘设备之间传输中间数据过程中涉及的数据量

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/882139.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Axure横向菜单高级交互

亲爱的小伙伴,在您浏览之前,烦请关注一下,在此深表感谢! 课程主题:横向菜单高级交互 主要内容:横向菜单左右拖动、选中效果 应用场景:app横向菜单、pc后台动态区域 案例展示: 演…

SpringBoot技术的车辆管理流程自动化

4系统概要设计 4.1概述 本系统采用B/S结构(Browser/Server,浏览器/服务器结构)和基于Web服务两种模式,是一个适用于Internet环境下的模型结构。只要用户能连上Internet,便可以在任何时间、任何地点使用。系统工作原理图如图4-1所示: 图4-1系统工作原理…

uniapp-实现天地图以及行政区划图层覆盖

前言: 在uniapp中,难免会遇到使用地图展示的功能,但是百度谷歌这些收费的显然对于大部分开源节流的开发者是不愿意接受的,所以天地图则是最佳选择。 此篇文章,详细的实现地图展示功能,并且可以自定义容器宽…

儿童服装CPC认证的测试项目有哪些

儿童服装CPC认证的测试项目主要包括以下几个方面: 一、物理性能测试 小零件测试:检查产品是否含有小零件,避免对3岁及以下儿童造成窒息风险。这包括检查服装上的纽扣、拉链、装饰物等小部件是否牢固,以及是否容易脱落。锐点&…

探索 Jupyter 笔记本转换的无限可能:nbconvert 库的神秘面纱

文章目录 探索 Jupyter 笔记本转换的无限可能:nbconvert 库的神秘面纱背景:为何选择 nbconvert?库简介:nbconvert 是什么?安装指南:如何安装 nbconvert?函数用法:简单函数示例应用场…

安装vue发生异常:npm ERR! the command again as root/Administrator.

一、异常 npm ERR! The operation was rejected by your operating system. npm ERR! Its possible that the file was already in use (by a text editor or antivirus), npm ERR! or that you lack permissions to access it. npm ERR! npm ERR! If you believe this might b…

安卓开发中轮播图和其指示器的设置

在安卓开发中,轮播图(Carousel)是一种常见的UI组件,用于展示一系列图片或内容,用户可以左右滑动来切换不同的视图。轮播图通常用于展示广告、新闻、产品图片等。 轮播图的指示器(Indicator)则是…

LlamaIndex 针对数据集表格数据的Pandas 查询引擎

Pandas简介 Pandas 是一个强大的数据处理和分析库,广泛应用于 Python 数据科学和机器学习领域。它提供了丰富的数据结构和数据操作工具,使得数据清洗、转换、合并、重塑、选择等任务变得更加简单高效。以下是 Pandas 的一些主要特点和常用功能&#xff…

大模型生图安全疫苗注入赛题解析(DataWhale组队学习)

引言 大家好,我是GISer Liu😁,一名热爱AI技术的GIS开发者。本系列文章是我跟随DataWhale 2024年10月实践赛的大模型生图安全疫苗注入赛道;本文主要整理本次赛事的基本流程和优化方法。💕💕😊 一…

IEC104规约的秘密之九----链路层和应用层

104规约从TCP往上,分成链路层和应用层。 如图,APCI就是链路层,ASDU的就是应用层 我们看到报文都是68打头的,因为应用层报文也要交给链路层发送,链路层增加了开头的6个字节再进行发送。 完全用于链路层的报文每帧都只有…

好用,易用,高效,稳定 基于opencv 的 图像模板匹配 - python 实现

在定位、搜索固定界面图块时,经常用到模板匹配,opencv自带的图像模板匹配好用,易用,高效,稳定,且有多种匹配计算方式。 具体示例如下: 模板图: 待搜索图: 具体实现代码…

FreeRTOS - 任务管理

在学习FreeRTOS过程中,结合韦东山-FreeRTOS手册和视频、野火-FreeRTOS内核实现与应用开发、及网上查找的其他资源,整理了该篇文章。如有内容理解不正确之处,欢迎大家指出,共同进步。 参考:https://rtos.100ask.net/zh/…

【C++刷题】力扣-#219-存在重复元素II

题目描述 给定一个整数数组 nums 和一个整数 k,判断数组中是否存在两个不同的索引 i 和 j 使得 nums[i] nums[j] 且 i! j。也就是说,不能有重复的元素。 示例 示例 1: 输入: nums [1,2,3,1], k 3 输出: true示例 2: 输入: nums [1,2,3,1,2,4], k …

SpringColoud GateWay 核心组件

优质博文:IT-BLOG-CN 【1】Route路由: Gateway的基本构建模块,它由ID、目标URL、断言集合和过滤器集合组成。如果聚合断言结果为真,则匹配到该路由。 Route路由-动态路由实现原理: 配置变化Apollo 服务地址实例变化…

H3C设备连接方式

Console线本地连接 协议Serial,接口com口,波特率9600(设备管理器中查看com口) 适用于设备初次调试 使用Telnet远程访问 适用于设备上架配置好后的维护管理 使用SSH远程访问 数据传输过程加密,安全的远程访问

洞察数字化营销的本质

数字化营销,即借助互联网、移动互联网、社交媒体等数字技术与渠道实现营销目标。涵盖市场调研、品牌推广、产品销售到客户服务全过程。 其特点显著。精准定位是一大优势,利用大数据分析和人工智能,深入了解客户需求、兴趣和行为,精…

AdmX_new

0x00前言 因为环境问题,此次靶场都放在vm上。都为NAT模式。 靶机地址: https://download.vulnhub.com/admx/AdmX_new.7z 需要找到两个flag文件。 0x01信息搜集 搜集IP 确认目标IP为172.16.8.131,进一步信息搜集 获取端口开放情况,版本信…

多模态大语言模型(MLLM)-Blip3/xGen-MM

论文链接:https://www.arxiv.org/abs/2408.08872 代码链接:https://github.com/salesforce/LAVIS/tree/xgen-mm 本次解读xGen-MM (BLIP-3): A Family of Open Large Multimodal Models 可以看作是 [1] Blip: Bootstrapping language-image pre-training…

TCP/IP 寻址

TCP/IP 寻址 概述 TCP/IP(传输控制协议/互联网协议)是一组用于数据网络的通信协议。它们定义了数据如何在网络上从一个设备传输到另一个设备。在TCP/IP网络中,每个设备都有一个唯一的地址,称为IP地址,用于标识网络上的设备。本文将深入探讨TCP/IP寻址的概念、类型、分配…

Lua脚本的原子性

Lua脚本之所以被认为是原子性的,主要源于Redis的内部实现机制和Lua脚本的执行方式。以下是对Lua脚本原子性的详细解释: 一、Redis的单线程模型 Redis是一个基于内存、可基于Key-Value等多种数据结构的存储系统,它使用单线程模型来处理客户端的请求。这意味着在任何给定的时…