从头开始微调Llama 3.1模型

image.png

在今天的科技专栏中,我们将深入探讨如何微调Llama 3.1模型,以使其更好地适应您的特定领域数据。微调大型语言模型(如Llama)的主要目的是为了在特定领域的数据上表现更好,从而生成更符合您需求的输出。以下是我们将要介绍的五个主要步骤:

  1. 安装必要的软件包
  2. 准备数据集
  3. 训练模型
  4. 进行推理
  5. 保存模型

第一步:安装必要的软件包

首先,我们需要安装一些必要的软件包unsloth和torch,我们将使用它来训练模型,以及acceleratebitsandbytes等其他工具。值得一提的是,我们使用的是Google Colab提供的免费T4 GPU,这意味着您可以在无需花费任何费用的情况下训练您的模型,这无疑是一个很棒的功能。

!pip install "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.git"
!pip install --no-deps "trl<0.9.0" peft accelerate bitsandbytes

第二步:准备数据集

在这一部分,我们将加载并准备我们的Llama 3.1模型。首先,我们需要导入必要的软件包,如UNS slothtorch,并设置最大序列长度、数据类型等参数。

import unsloth import FastLanguageModel
import torchmax_sequence_length = 2048
dtype = None
load_in_4bit = True

接下来,我们将从UNS sloth加载模型,并使用Laura技术来只更新1%到10%的参数。这样做的好处是能够更高效地进行训练。

model,tokenizer = FastLanguageModel.from_pretrained(model_name="unsloth/Meta-Llama-3.1-8B",max_seq_length = max_sequence_length ,dtype = dtype,load_in_4bit = load_in_4bit
)

第三步:训练模型

现在我们已经准备好了数据集,可以开始训练模型了。在这一步中,我们将配置训练参数,并使用Alpaca数据集来进行训练。

from datasets import load_datasetdata = load_dataset('alpaca', split='train')
data = data.rename_column('output', 'response')

接下来,我们将配置训练参数,并开始训练模型。

from transformers import Trainer, TrainingArgumentstraining_args = TrainingArguments(output_dir='./results',num_train_epochs=3,per_device_train_batch_size=8,save_steps=10_000,save_total_limit=2,
)trainer = Trainer(model=model,args=training_args,train_dataset=data,
)trainer.train()

训练完成后,我们可以查看训练的内存和时间统计信息。

print(trainer.state.log_history)

第四步:进行推理

训练完成后,我们可以进行推理。首先,我们需要加载模型并对输入进行标记化处理。然后,我们将生成模型的输出。

from transformers import pipelineinference_pipeline = pipeline('text-generation', model=model)
input_text = "请介绍一下Llama 3.1模型的应用场景。"
outputs = inference_pipeline(input_text)for i, output in enumerate(outputs):print(f"Output {i+1}: {output['generated_text']}")

此外,我们还可以使用Hugging Face的新功能——TextStreamer进行实时流式输出,这样我们就无需等待最终结果。

from transformers import TextStreamerstreamer = TextStreamer(model=model)
input_text = "请介绍一下Llama 3.1模型的应用场景。"
streamer(input_text)

第五步:保存模型

最后,我们需要保存已经训练好的模型。最好的方法是将其推送到Hugging Face Hub,这样就可以随时访问和使用模型。

model.save_pretrained('path_to_your_model')
tokenizer.save_pretrained('path_to_your_tokenizer')from huggingface_hub import HfApiapi = HfApi()
api.upload_folder(folder_path='path_to_your_model',path_in_repo='your_repo_name',repo_id='your_username/your_repo_name',token='your_huggingface_token'

如果您希望以不同的格式(如16位、4位或更低的适配器)保存模型,也可以进行相应的配置。

总结

通过以上五个步骤,我们已经完成了Llama 3.1模型的微调。从安装必要的软件包到准备数据集,再到训练模型、进行推理,最后是保存模型,每一步都至关重要。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/49754.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

链表的中间结点 - 力扣(LeetCode)C语言

876. 链表的中间结点 - 力扣&#xff08;LeetCode&#xff09;( 点击前面链接即可查看题目) /*** Definition for singly-linked list.* struct ListNode {* int val;* struct ListNode *next;* };*/ struct ListNode* middleNode(struct ListNode* head) {struct Lis…

如何实现一个大模型在回答问题时同时提供相关内容链接

通义生成 为了让大模型在回答问题时能够提供相关内容链接&#xff0c;通常采用的方法是结合检索增强生成&#xff08;Retrieval-Augmented Generation, RAG&#xff09;的技术。这种方法可以让大模型在生成答案的同时&#xff0c;从外部知识源中检索相关信息&#xff0c;并将这…

SpringBoot知识笔记

一、基本概念 1.1 特性 起步依赖 自动配置 其它特性:内嵌的Tomcat、Jetty(无需部署WAR文件),外部配置,不需要XML配置(properties/yml)。 1.2 配置文件 SpringBoot提供了多种属性配置方式 //application.properties server.port=9090 server.servlet.context-path…

状态模式与订单状态机的实现

状态模式 状态模式&#xff08;State Design Pattern&#xff09;是一种行为设计模式&#xff0c;用于在对象的内部状态改变时改变其行为。这种模式可以将状态的变化封装在状态对象中&#xff0c;使得对象在状态变化时不会影响到其他代码&#xff0c;提升了代码的灵活性和可维…

Python爬虫知识体系-----Urllib库的使用

数据科学、数据分析、人工智能必备知识汇总-----Python爬虫-----持续更新&#xff1a;https://blog.csdn.net/grd_java/article/details/140574349 文章目录 1. 基本使用2. 请求对象的定制3. 编解码1. get请求方式&#xff1a;urllib.parse.quote&#xff08;&#xff09;2. ur…

邦布带你从零开始实现图书管理系统(java版)

今天我们来从零开始实现图书管理系统。 图书管理系统 来看我们的具体的实现&#xff0c;上述视频。 我们首先来实现框架&#xff0c;我们要实现图书管理系统&#xff0c;首先要搭框架。 我们首先定义一个书包&#xff0c;在书包中定义一个书类和一个书架类&#xff0c;再定义…

数据库之常用函数

目录 一、数值函数 1.求绝对值函数 2.求余函数 3.用于获取整数的函数 4.获取随机数的函数 5.四舍五入函数 6.截取小数函数 二、字符串函数 1.返回字符串长度和字符串中字符个数的函数 2.合并字符串的函数 3.替换字符串的函数 4.字母大小写转换函数 5.获取指定长度…

Webpack、Vite区别知多少?

前端的项目打包&#xff0c;我们常用的构建工具有Webpack和Vite&#xff0c;那么Webpack和Vite是两种不同的前端构建工具,那么你们又是否了解它们的区别呢&#xff1f;我们在做项目时要如何选择呢&#xff1f; 一、工具定义 1、Webpack&#xff1a;是一个强大的静态模块打包工…

用Java手写jvm之实现查找class

写在前面 完成类加载器加载class的三阶段&#xff0c;加载&#xff0c;解析&#xff0c;初始化中的加载&#x1f600;&#x1f600;&#x1f600; 源码 。 jvm想要运行class&#xff0c;是根据类全限定名称来从特定的位置基于类加载器来查找的&#xff0c;分别如下&#xff1a;…

go语言与UPX

源自&#xff1a;压缩工具之upx_51CTO博客_za压缩工具 下面是直接copy的&#xff1a; 在golang项目中, 最终运行的是打包好的二进制文件,如何才能让这个文件尽可能的小呢? 1.编译阶段的参数处理 go build使用的是静态编译&#xff0c;会将程序的依赖一起打包&#xff0c;这…

【SQL 新手教程 2/20】关系模型 -- 主键

&#x1f497; 关系数据库建立在关系模型上⭐ 关系模型本质上就是若干个存储数据的二维表 记录 (Record)&#xff1a; 表的每一行称为记录&#xff08;Record&#xff09;&#xff0c;记录是一个逻辑意义上的数据 字段 (Column)&#xff1a;表的每一列称为字段&#xff08;Colu…

【算法】二进制常用操作

二进制常用操作 求n的二进制中第k位数字&#xff1a; n > > k & 1 n>>k\& 1 n>>k&1​ lowbit(x)的用法:返回x中最后一个1&#xff0c; l o w b i t ( x ) x & ( − x ) lowbit(x)x\&(-x) lowbit(x)x&(−x)​ 输入一个 32 位整数&a…

java如何同时继承接口和抽象类

java中要同时继承接口和抽象&#xff0c;需要用到的语句是 class 类名 extends 抽象类名 implements 接口 示例代码如下 interface Animal02{public String Name"牧羊犬";public void shout();public void info(); } abstract class Action01{public abstract voi…

解锁Vue的潜力:封装递归组件的经验之谈(网站导航层架嵌套)

最近在使用BootstrapVue写一个网站(我也不知道为啥要用这个&#x1f602;)&#xff0c;使用到了NavBarDropDown等一些组件的组合,可以自动创建一个响应式的效果&#xff0c;还不错。But…,这个DropDown只支持到二级。有人2019年就在Github上提了issue- dropdown submenu并且作者…

WebKit的CSS Aspect Ratio Box:重塑响应式设计

WebKit的CSS Aspect Ratio Box&#xff1a;重塑响应式设计 在响应式网页设计中&#xff0c;保持元素的宽高比是一个常见需求。幸运的是&#xff0c;CSS提供了一个名为aspect-ratio的属性&#xff0c;它允许开发者为元素定义一个理想的宽高比。在WebKit中&#xff0c;这个属性得…

吴恩达的TranslationAgent学习

TranslationAgent构成 整个[TranslationAgent (github.com)]在流程上分为短文本的一次性翻译和长文本的分chunk翻译&#xff08;按照Token进行划分&#xff09;。 但是不论长文本翻译还是短文本翻译&#xff0c;总体流程遵循执行、纠正再执行的逻辑循环实现。 这种按照自省思路…

数据库DDL | 增 删 改 操作 | 对数据库数据表

DDL建库建表(操作数据库/表)⭐️⭐️⭐️ 数据库 创建库 //create database 库名 create database xiaozhao2;查看库 //查看所有的库 show databases;删除库(危险操作) //drop database 库名 drop database xiaozhao2;使用库\切换库 //use 库名 use xiaozhao2;查看库数据…

【数字IC/FPGA】使用Verdi对比两个波形

步骤一&#xff1a; 使用verdi打开第一个波形 bsub verdi -ssf 1.fsdb添加需要观察的信号&#xff0c;如下图所示&#xff1a; 步骤二&#xff1a; 新建容器&#xff0c;依次点击Window --> Dock to --> New Container Window。 然后输入容器的名字&#xff0c;如下图所…

SQL数据库:通过在视频监控平台服务器上直接使用SQL存储过程,在海量记录中查询特定时间段内-某个摄像头的所有视频片段

目录 一、背景 1、存储过程 2、视频监控系统 二、需求和数据表 1、具体要求 2、数据表 3、部分数据 三、实现 1、目标 2、创建存储过程 &#xff08;1&#xff09;存储过程代码 &#xff08;2&#xff09;创建成功 3、存储过程的解释 4、SQL命令调用方式 5、调用…

Java----队列(Queue)

目录 1.队列&#xff08;Queue&#xff09; 1.1概念 1.2队列的使用 1.3队列的模拟实现 1.4循环队列 1.4.1循环队列下标偏移 1.4.2如何区分队列是空还是满 1.5双端队列 (Deque) 1.队列&#xff08;Queue&#xff09; 1.1概念 队列&#xff1a;只允许在一端进行插入数据…