【大模型】7 天 AI 大模型学习

因为想先快速把 llama 模型学习了，所以跳了两次课，这是这两次课的主要内容，后面有时间会补充上的～主要内容有：一些微调技术（Alpaca、AdaLoRA、QLoRA）、Prefix Tuning、Quantization

Alpaca 是一个由斯坦福大学开发的项目，用来微调大型语言模型（LLM）的工具。它基于 Meta 的 LLaMA 模型并通过微调使模型能够更好地完成指令跟随任务。
Alpaca 模型的训练特点：

AdaLoRA 是 LoRA（Low-Rank Adaptation of Large Language Models）的一种改进方法。LoRA 通过减少需要训练的参数数量，实现高效且低资源消耗的模型微调。AdaLoRA 的关键特点是：

QLoRA 是 LoRA 的进一步优化版本，它结合了量化技术，降低了显存占用和计算成本。其特点包括：

Prefix Tuning 是一种轻量级微调方法，主要用于生成任务（如自然语言生成）。其核心思想是：

量化（Quantization）是指将模型的权重和计算从高精度（如 32-bit 浮点数）降低到低精度（如 4-bit 或 8-bit）的过程，以加速推理并减少模型大小。常见方法包括：

Post-Training Quantization (PTQ): 在模型训练完成后进行量化。
Quantization-Aware Training (QAT): 在训练过程中考虑量化影响，从而提升性能。
Quantization01 和 Quantization02 可能是指不同量化方法或优化策略的比较。

这部分可能介绍了针对大型语言模型（LLM）进行量化的具体方法和挑战：

Static Quantization（静态量化）： 在推理前量化所有权重和激活。
Dynamic Quantization（动态量化）： 推理时动态地量化激活值。
Mixed-Precision Quantization（混合精度量化）： 在模型的不同层使用不同的量化精度（如 8-bit 和 16-bit 混合）。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/bicheng/66240.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！