llamafactory的包安装

cuda版本12.1，python版本3.10，torch版本2.4.0，几个关键包版本如下：

torch==2.4.0+cu121
transformers==4.48.3
triton==3.0.0
flash-attn==2.7.1.post4
xformers==0.0.27.post2
vllm==0.6.3.post1
vllm-flash-attn==2.6.1
unsloth==2025.3.18
unsloth_zoo==2025.3.16

具体安装过程：

安装虚拟环境：conda create -n llama python=3.10
在Cuda Toolkit | Anaconda.org找到对应的cuda版本的安装命令，我的是conda install nvidia/label/cuda-12.1.0::cuda-toolkit（最简单的是conda install cudatoolkit=12.1，但截至目前好像只支持到11.8）
安装torch2.4.0，注意不要直接pip install torch==2.4.0，会装成cpu版本的（经典错误了属于是），有几种安装方法，除了官方推荐的pip install torch==2.4.0 --index-url https://download.pytorch.org/whl/cu121，还可以在https://download.pytorch.org/whl/torch/等网站先下载对应版本的whl再进行安装（注意whl文件名要包含cu121）。由于与主线无关，此处不多赘述。
安装好torch后就是安装其他包了，由于安装其他包时可能会重新安装torch，而用--no-deps或--ignore-installed命令又可能导致版本不匹配，所以我一般都会同步安装各个包，例如pip install transformers==4.48.3 triton==3.0.0 xformers==0.0.27.post2 flash_attn==2.7.1.post4 torch==2.4.0+cu121，由于命令中指定安装已有的torch==2.4.0+cu121，它就不会覆盖安装新的torch了。

vllm和unsloth安装失败率较高。我安装vllm是使用了下面两种方式，第二种是我已知对应版本能够匹配上，如果不确定能否匹配上则应使用第一种。

pip install git+https://github.com/vllm-project/vllm.git transformers==4.48.3 triton==3.0.0 torch==2.4.0+cu121
pip install vllm==0.6.3.post1 vllm-flash-attn==2.6.1 transformers==4.48.3 triton==3.0.0 torch==2.4.0+cu121

安装unsloth：pip install unsloth==2025.3.18 transformers==4.48.3 triton==3.0.0 torch==2.4.0+cu121 unsloth==2025.3.18 xformers==0.0.27.post2
安装llamfactory：pip install -e ".[torch,metrics]" transformers==4.48.3 triton==3.0.0 torch==2.4.0+cu121 unsloth==2025.3.18 xformers==0.0.27.post2

安装后由于vllm版本低可能出现模块不存在问题：

File "/usr/local/miniconda3/envs/llama/lib/python3.10/site-packages/unsloth_zoo/vllm_lora_worker_manager.py", line 16, in <module>from vllm.lora.peft_helper import PEFTHelper
ModuleNotFoundError: No module named 'vllm.lora.peft_helper'

可参照博客ModuleNotFoundError: No module named ‘vllm.lora.peft_helper‘原因和解决方式进行解决

2025.4.22 更新
支持torch2.4.0的vllm版本最多到0.6.3.post1，但要到0.6.4才支持bitsandbytes动态量化，因此新装了包：

torch==2.5.1+cu121
triton==3.1.0
xformers==0.0.28.post3
vllm==0.7.3

其余关键包不变

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/pingmian/77684.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

llamafactory的包安装

相关文章

Redis专题

【Rust 精进之路之第7篇-函数之道】定义、调用与参数传递：构建代码的基本单元

文件有几十个T，需要做rag，用ragFlow能否快速落地呢？

安卓的桌面 launcher是什么

【学习笔记】计算机网络（九）—— 无线网络和移动网络

无线网络入侵检测系统实战 | 基于React+Python的可视化安全平台开发详解

速通FlinkCDC3.0

B+树节点与插入操作

C# 检查字符串是否包含在另一个字符串中

珈和科技遥感赋能农业保险创新入选省级卫星应用示范标杆

深入理解 React 组件的生命周期：从创建到销毁的全过程

缓存 --- Redis性能瓶颈和大Key问题

Python爬虫与代理IP：高效抓取数据的实战指南

Nginx HTTP 414 与“大面积”式洪水攻击联合防御实战

【上位机——MFC】运行时类信息机制

Maven插件管理的基本原理

卷积神经网络--手写数字识别

大文件分片上传进阶版（新增md5校验、上传进度展示、并行控制，智能分片、加密上传、断点续传、自动重试），实现四位一体的网络感知型大文件传输系统‌

C# 点击导入，将需要的参数传递到弹窗的页面

android的 framework 是什么