如何使用 LLaMA-Factory 微调 LLaMA3

【LLaMa3微调】使用 LLaMA-Factory 微调LLaMA3

实验环境
1.1 机器
- 操作系统：Windows 10 或 Ubuntu
- PyTorch 版本：2.1.0
- Python 版本：3.10（针对Ubuntu 22.04）
- Cuda 版本：12.1
- GPU 配置：p100 (16GB) * 2
- CPU 配置：12 vCPU Intel® Xeon® Platinum 8352V CPU @ 2.10GHz

1.2 基座模型

基于中文数据训练过的 LLaMA3 8B 模型：shenzhi-wang/Llama3-8B-Chinese-Chat

可选配置：hf 国内镜像站，使用以下命令安装和配置：

pip install -U huggingface_hub
export HF_ENDPOINT=https://hf-mirror.com
huggingface-cli download --resume-download shenzhi-wang/Llama3-8B-Chinese-Chat --local-dir /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1

LLaMA-Factory 框架

2.1 安装

使用以下命令克隆并安装LLaMA-Factory：

git clone https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e .

2.2 准备训练数据

训练数据示例：fruozhiba_qaswift_train.json，可以去魔搭社区下载
将训练数据放置在 LLaMA-Factory/data/ 目录下，例如：LLaMA-Factory/data/ruozhiba_qaswift_train.json

修改数据注册文件：LLaMA-Factory/data/dataset_info.json，添加数据集的配置信息，例如：

"fintech": {"file_name": "ruozhiba_qaswift_train.json","columns": {"prompt": "instruction","query": "input","response": "output","history": "history"}
}

2.3 启动 Web UI
在 LLaMA-Factory 目录下执行以下命令启动 Web UI：
bash cd LLaMA-Factory llamafactory-cli webui

2.4 微调模型

使用 Web UI 或命令行进行微调。

命令行微调示例：构建配置文件 cust/train_llama3_lora_sft.yaml，内容示例如下：

 cutoff_len: 1024dataset: ruozhiba_qaswift_traindataset_dir: datado_train: truefinetuning_type: loraflash_attn: autofp16: truegradient_accumulation_steps: 8learning_rate: 0.0002logging_steps: 5lora_alpha: 16lora_dropout: 0lora_rank: 8lora_target: q_proj,v_projlr_scheduler_type: cosinemax_grad_norm: 1.0max_samples: 1000model_name_or_path: /root/autodl-tmp/models/Llama3-8B-Chinese-Chatnum_train_epochs: 10.0optim: adamw_torchoutput_dir: saves/LLaMA3-8B-Chinese-Chat/lora/train_XXXX-XX-XX-XX-XX-XXpacking: falseper_device_train_batch_size: 2plot_loss: truepreprocessing_num_workers: 16report_to: nonesave_steps: 100stage: sfttemplate: llama3use_unsloth: truewarmup_steps: 0

使用以下命令执行微调

 ```bashllamafactory-cli train cust/train_llama3_lora_sft.yaml```

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/899715.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

如何使用 LLaMA-Factory 微调 LLaMA3

【LLaMa3微调】使用 LLaMA-Factory 微调LLaMA3

相关文章

使用Java ApI 实现Hadoop文件上传

喜讯 | 耘瞳科技视觉检测与测量装备荣膺“2024机器视觉创新产品TOP10”

数据可视化（matplotlib）-------图表样式美化

202518 | Ngnix

WP Mail 邮件发送：WordPress Mail SMTP设置

小智机器人关键函数解析：MqttProtocol::SendAudio()对输入的音频数据进行加密处理，通过UDP发送加密后的音频数据

Hadoop 常用命令集总览

mac m4 Homebrew安装MySQL 8.0

GoLand 2024.3 中文 GO语言开发工具

Excel去掉单元格里面的换行的方法

React 中的 Props

基于简单神经网络的线性回归

‌19.思科路由器：OSPF协议引入直连路由的实验研究

USB——删除注册表信息

如何快速解决django报错：cx_Oracle.DatabaseError: ORA-00942: table or view does not exist

从 0 到跑通的 Qt + OpenGL + VS 项目的完整流程

鸿蒙开发03样式相关介绍（二）

装饰器模式与模板方法模式实现MyBatis-Plus QueryWrapper 扩展

05-031-自考数据结构（20331）- 哈希表 - 例题分析

rustdesk 自建服务器 key不匹配