【大模型】7 天 AI 大模型学习

因为想先快速把 llama 模型学习了,所以跳了两次课,这是这两次课的主要内容,后面有时间会补充上的 ~ 主要内容有:一些微调技术(Alpaca、AdaLoRA、QLoRA)、Prefix Tuning、Quantization


1. Alpaca

Alpaca 是一个由斯坦福大学开发的项目,用来微调大型语言模型(LLM)的工具。它基于 Meta 的 LLaMA 模型并通过微调使模型能够更好地完成指令跟随任务。
Alpaca 模型的训练特点:

  • 使用类似于 OpenAI 的 InstructGPT 风格的指令-响应数据集。
  • 通过成本较低的方式,生成了高质量的训练数据(使用 ChatGPT 来生成指令数据)。
  • 在中小规模模型上实现了较好的性能。

2. AdaLoRA (Adaptive LoRA)

AdaLoRA 是 LoRA(Low-Rank Adaptation of Large Language Models)的一种改进方法。LoRA 通过减少需要训练的参数数量,实现高效且低资源消耗的模型微调。AdaLoRA 的关键特点是:

  • 自适应性: 动态分配低秩分解的秩(rank)以适应模型不同部分的重要性。
  • 高效性: 在保持性能的同时进一步减少参数需求。
  • 应用: 在资源受限场景下对大型语言模型进行微调。

3. QLoRA (Quantized LoRA)

QLoRA 是 LoRA 的进一步优化版本,它结合了量化技术,降低了显存占用和计算成本。其特点包括:

  • 4-bit 量化: 对基础模型进行 4-bit 量化,显著减少内存和计算需求。
  • 结合 LoRA: 在量化后的模型上应用 LoRA 技术进行微调。
  • 性能: 在保持模型性能的同时,大幅降低了硬件资源需求。

4. Prefix Tuning

Prefix Tuning 是一种轻量级微调方法,主要用于生成任务(如自然语言生成)。其核心思想是:

  • 添加前缀向量: 为语言模型的输入添加可训练的前缀向量,而不修改原始模型参数。
  • 参数效率: 仅优化前缀参数,避免了大规模微调整个模型。
  • 应用: 在对话生成、机器翻译等任务中表现优异。

5. Quantization

量化(Quantization)是指将模型的权重和计算从高精度(如 32-bit 浮点数)降低到低精度(如 4-bit 或 8-bit)的过程,以加速推理并减少模型大小。常见方法包括:

  • Post-Training Quantization (PTQ): 在模型训练完成后进行量化。
  • Quantization-Aware Training (QAT): 在训练过程中考虑量化影响,从而提升性能。
    Quantization01 和 Quantization02 可能是指不同量化方法或优化策略的比较。

6. Quantization Methods for LLM

这部分可能介绍了针对大型语言模型(LLM)进行量化的具体方法和挑战:

  • Static Quantization(静态量化): 在推理前量化所有权重和激活。
  • Dynamic Quantization(动态量化): 推理时动态地量化激活值。
  • Mixed-Precision Quantization(混合精度量化): 在模型的不同层使用不同的量化精度(如 8-bit 和 16-bit 混合)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/66240.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网关如何识别和阻止网络攻击

网关在识别和阻止网络攻击方面扮演着关键角色,它通过多种技术和机制来确保网络的安全。以下是网关如何识别和阻止网络攻击的一些主要方法: 1.深度包检测(DPI) 网关可以对经过的数据包进行深度分析,检查数据包的头部、负…

解决 ffmpeg “Unknown encoder ‘hevc_nvenc‘“

目录 项目场景: 问题描述 原因分析: 解决方案: 项目场景: ffmpeg 剪切视频 问题描述 详细报错: [vost#0:0 @ 0x46ae00] Unknown encoder hevc_nvenc 原因分析: ffmpeg 安装错误 解决方案: 重新安装ffmpeg: conda install ffmpeg 检查当前安装的 FFmpeg 是否支…

# 设计一个 ATM 机器(LeetCode 第2241题)

设计一个 ATM 机器(LeetCode 第2241题) 在本篇博客中,我们将深入探讨如何设计一个 ATM 机器,以满足存取钞票的需求。这个问题来源于 LeetCode 的第2241题,旨在考察如何高效地管理不同面额的钞票并处理用户的存取请求。…

操作系统复习(理论版)

目录 只会在选择填空出现类型 第一章:操作系统导论 操作系统介绍 不得不知道的概念 可能出现在答题的类型 第二章:进程调度 进程管理: 处理机调度: 进程同步: 死锁: 预防死锁: 避免死…

概述(讲讲python基本语法和第三方库)

我是北子,这是我自己写的python教程,主要是记录自己的学习成果方便自己日后复习, 我先学了C/C,所以这套教程中可能会将很多概念和C/C去对比,所以该教程大概不适合零基础的人。 it seems that python nowadays 只在人工…

Linux(Centos 7.6)命令详解:ls

1.命令作用 列出目录内容(list directory contents) 2.命令语法 Usage: ls [OPTION]... [FILE]... 3.参数详解 OPTION: -l,long list 使用长列表格式-a,all 不忽略.开头的条目(打印所有条目,包括.开头的隐藏条目&#xff09…

详解MySQL SQL删除(超详,7K,含实例与分析)

文章目录 前言1. 删除表中的所有记录基本语法使用场景注意事项运用实例分析说明2. 删除特定记录基本语法使用场景注意事项运用实例分析说明3. 删除单条记录基本语法使用场景注意事项运用实例分析说明4. 删除违反引用完整性的记录基本语法使用场景注意事项运用实例分析说明5. 删…

[图形渲染] 【Unity】UnityShader操作基础6-OpenGL与DirectX中的纹理坐标差异及语法差异分析

在现代图形编程中,OpenGL和DirectX作为两大主流图形API,各自有其独特的处理方式和语法规范。尽管它们的功能和目的相似,但在某些细节上却存在显著差异,尤其是在纹理坐标和着色器编程的相关操作上。本文将探讨OpenGL与DirectX在纹理坐标、语法以及语义上的差异,并给出一些跨…

numpy数组学习

前言 有时看到数组,容易被绕晕,不知道每个列表的数字分别代表什么,因此记录下来,用于后续参考。 1.轮廓点坐标 (n, 1, 2) 格式解释 (n, 1, 2): n:表示轮廓上的点数。每个点都是轮廓的一部分。 1&#x…

改善 Kibana 中的 ES|QL 编辑器体验

作者:来自 Elastic Marco Liberati 随着新的 ES|QL 语言正式发布,Kibana 中开发了一种新的编辑器体验,以帮助用户编写更快、更好的查询。实时验证、改进的自动完成和快速修复等功能将简化 ES|QL 体验。 我们将介绍改进 Kibana 中 ES|QL 编辑器…

Mono里运行C#脚本25—mono_codegen

前面分析怎么样找到主函数Main的入口点功能,也就是说已经找到了这个函数的CIL代码。虽然找到了代码,但是还不能执行它的,因为它是一种虚拟机的代码。也就是说它是假的代码,不是现实世界存在的机器的代码,因此不能直接执行,必须经过后端编译器的再次编译才能真正运行它。下…

基于Spring Boot的紧急物资管理系统

基于Spring Boot的紧急物资管理系统是一个非常实用的应用,特别是在应对自然灾害、公共卫生事件等情况下。该系统可以帮助管理者有效地追踪和分配物资,确保资源能够及时到达需要的地方。以下是一个基本的实现思路和一些关键组件: 项目规划 需…

mini-dog-c编译器之词法分析

mini-dog-c 是一个小型的 C 语言编译器,是我学习和理解编译器基本工作原理的实践项目。其词法分析器能够识别 C 语言的基本语法元素,包括常见的标识符、整数和浮点数字面量、布尔字面量以及字符串字面量。此外,它还支持基本的算术和逻辑操作符…

机器学习基础-概率图模型

(一阶)马尔科夫模型的基本概念 状态、状态转换概率、初始概率 状态转移矩阵的基本概念 隐马尔可夫模型(HMM)的基本概念 条件随机场(CRF)的基本概念 实际应用中的马尔科夫性 自然语言处理: 在词…

力扣hot100——链表

160. 相交链表 class Solution { public:ListNode *getIntersectionNode(ListNode *headA, ListNode *headB) {set<ListNode*> s;ListNode* h headA;while (h ! NULL) {s.insert(h);h h->next;}h headB;while (h ! NULL){if (s.find(h) ! s.end()) {return h;}h …

Qt打包为exe文件

个人学习笔记 选择release 进入项目文件夹&#xff0c;查看releas生成的文件 releas文件路径 进入release看到exe文件&#xff0c;但是无法执行 将exe文件单独放到一个文件夹内 选择MinGW 用CD 进入存放exe文件的路径&#xff0c;输入下面指令 cd J:\C\Qt\test4-3-1 windeploy…

VScode怎么重启

原文链接&#xff1a;【vscode】vscode重新启动 键盘按下 Ctrl Shift p 打开命令行&#xff0c;如下图&#xff1a; 输入Reload Window&#xff0c;如下图&#xff1a;

小屏幕下通过css自动实现上下位置颠倒例子

<!DOCTYPE html> <html><head><meta charset"utf-8"><meta name"viewport" content"widthdevice-width, initial-scale1"><title>Demo</title><!-- 请勿在项目正式环境中引用该 layui.css 地址 --…

下列指标组合中,不能用于系统性评价缺陷识别模型精度的指标

19 下列指标组合中&#xff0c;不能用于系统性评价缺陷识别模型精度的指标为&#xff1a; A 检出率和准确率 B 检出率和误报比 C 平均精确率 D 准确率和误报比 对于评价一个缺陷识别模型的精度&#xff0c;检出率、准确率、检出率和误报比等指标常被用来系统性地评估模型的效…

Web安全 - “Referrer Policy“ Security 头值不安全

文章目录 概述原因分析风险说明Referrer-Policy 头配置选项1. 不安全的策略no-referrer-when-downgradeunsafe-url 2. 安全的策略no-referreroriginorigin-when-cross-originsame-originstrict-originstrict-origin-when-cross-origin 推荐配置Nginx 配置示例 在 Nginx 中配置 …