Llama微调测试记录

Llama微调测试记录

web/2025/4/8 22:48:28/文章来源:https://blog.csdn.net/qq_45734745/article/details/143659811

使用llama模型（Atom-7B-Chat）

参考github：https://github.com/LlamaFamily/Llama-Chinese
conda安装python3.11的环境
运行pip install -r requirements.txt
从huggingface的下载Atom-7B-Chat模型，此处推荐一个好用的镜像：https://hf-mirror.com/FlagAlpha/Atom-7B-Chat
使用Atom-7B-Chat模型进行推理创建一个名为 quick_start.py 的文件，并将以下内容复制到该文件中(较官网有所修改)

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
device_map = "cuda:4" if torch.cuda.is_available() else "auto"
model = AutoModelForCausalLM.from_pretrained('Atom-7B-Chat',device_map=device_map,torch_dtype=torch.float16,load_in_8bit=True,trust_remote_code=True,use_flash_attention_2=True)
model =model.eval()
tokenizer = AutoTokenizer.from_pretrained('Atom-7B-Chat',use_fast=False)
tokenizer.pad_token = tokenizer.eos_token
input_ids = tokenizer(['<s>Human: 介绍一下中国\n</s><s>Assistant: '], return_tensors="pt",add_special_tokens=False).input_ids
if torch.cuda.is_available():input_ids = input_ids.to('cuda'

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/web/59415.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

测试实项中的偶必现难测bug--苹果支付丢单问题

测试实项中的偶必现难测bug--苹果支付丢单问题

问题描述： app支付后，由于某种原因（可能是网络、流量不稳定、或者用户快速频繁操作。。。)会造成一定概率性的回调苹果支付结果失败的情况出现，表现的直观现象就是客户反馈已经支付了，包括苹果支付也是有记录，但是我们的后台显示的是已取消状态的订单验证难点：测试和…

阅读更多...

Java:JVM

Java:JVM

1.JVM内存区域的划分一个Java写的程序跑起来,就得到了一个Java进程 JVM 上面运行的字节码指令; 进程:操作系统资源分配的基本单位; 内存区域的划分: 1.程序计数器在内存空间里(比较小的空间),保存了下一个要执行的指令的内存地址(元数据区的地址); 这里的"下一条…

阅读更多...

常见git命令记录

常见git命令记录

记录一些常见的git操作下载代码下载 git clone [代码连接] 切分支 git branch -b [分支名] 提交代码添加 git add [需要提交的代码路径] 提交 git commit -m "一些骚话" push git push origin HEAD:refs/for/[仓名称] 通过diff文件，同步修…

阅读更多...

快递物流查询API接口如何用PHP调用

快递物流查询API接口如何用PHP调用

在现代商业中，供应链的协同运作至关重要。快递物流查询API接口可以实现供应商、电商平台、物流企业和消费者之间的信息无缝对接，各方能够及时获取快递物流信息，从而更好地协调生产、销售和配送等环节，提高整个供应链的效率和效益…

阅读更多...

Java GC 学习笔记

Java GC 学习笔记

Java GC 第一章 JVM内存模型方法区栈区堆区程序计数器第二章常用回收算法 2.1 什么情况下需要回收？ 2.2 什么时候需要回收？ 2.3 怎样回收？ ParallelNew （Young） CMS （Old&#xff09…

阅读更多...

Overleaf数学符号乱码等问题

Overleaf数学符号乱码等问题

Overleaf使用XeLatex编译时，公式中数学符号非法显示，如下图，属于∈符号显示错误： 原因：一般是文内中文引起的，警惕是否有中文标点等。 XeLatex编译图片标题是中文原因：用了UTF-8编码&#x…

阅读更多...

【MySQL 保姆级教学】事务的隔离级别（详细）--下（13）

【MySQL 保姆级教学】事务的隔离级别（详细）--下（13）

事务的隔离级别 1. 如何理解事务的隔离性2. 事务隔离级别的分类3. 查看和设置事务隔离级别3.1 全局和会话隔离级别3.2 查看和设置隔离级别 4. 事务隔离级别的演示4.1 读未提交（Read Uncommitted）4.2 读已提交（Read Committed）4.3 …

阅读更多...

响应式网页设计--html

响应式网页设计--html

一，HTML 文档的基本结构一个典型的 HTML 文档包含了几个主要部分，基本结构如下(本文以下出现的所有代码都可以套入下面示例进行测试)： <!DOCTYPE html> <html lang"zh"> <head><meta charset"UTF-8&q…

阅读更多...

git版本工具使用教程

git版本工具使用教程

git版本工具使用教程 1. 安装 GitWindowsmacOSLinux 2. 配置 Git全局配置 3. 基本命令初始化仓库克隆仓库添加文件到暂存区提交变更查看状态查看提交历史切换分支创建新分支合并分支推送变更到远程仓库拉取远程仓库的最新变更查看差异撤销修改撤销提交 4. 进阶操作标签&#xf…

阅读更多...

ANDROIDWORLD: A Dynamic Benchmarking Environment for Autonomous Agents论文学习

ANDROIDWORLD: A Dynamic Benchmarking Environment for Autonomous Agents论文学习

这个任务是基于androidenv的。这个环境之前学过，是一个用来进行强化学习的线上环境。而这篇文章的工作就是要给一些任务加上中间的奖励信号。这种训练环境的优点就是动态，与静态的数据集（比如说我自己的工作）不同，因此…

阅读更多...

构建现代 Python Web 应用的最佳实践：从 FastAPI 到 Tortoise ORM20241113

构建现代 Python Web 应用的最佳实践：从 FastAPI 到 Tortoise ORM20241113

构建现代 Python Web 应用的最佳实践：从 FastAPI 到 Tortoise ORM 随着现代 Web 开发技术的快速演进，Python 的生态系统涌现出了诸多优秀的框架和工具，FastAPI 和 Tortoise ORM 就是其中的佼佼者。这篇博客将围绕如何使用这两款工具构建高效、…

阅读更多...

从0开始学习机器学习--Day24--核函数

从0开始学习机器学习--Day24--核函数

核函数(Kernelsl function) 非线性数据的决策边界对于非线性问题来说，决策边界在很多时候都是曲线，需要我们在假设函数中加入高阶多项式来拟合原始数据，这对于算法来说需要很长的运行时间去计算这些高阶多项式，那么有没有更高效…

阅读更多...

charles简单使用

charles简单使用

一、安装&配置 1、安装通过官网下载稳定版的charles。说明：官网下载也可以免费使用，不用到处找破解版，还不安全。官网下载的也能用半小时，然后重启一下还能继续用。如果有钱就买个服务，如果不原因花钱就动一动…

阅读更多...

VMware和CentOS 7.6 Linux操作系统的安装使用

VMware和CentOS 7.6 Linux操作系统的安装使用

1. 安装VMware 安装VMware之前，有些电脑是需要去BIOS里修改设置开启cpu虚拟化设备支持才能安装。如果运气不好在安装过程中安装不了的话就自行百度吧。打开 VMware 的官网: https://www.vmware.com/ 点击 product，往下滑找到 see desktop hypeerviso…

阅读更多...

OCP证书如何下载？

OCP证书如何下载？

访问Oracle CertView网站： 打开网址 https://certview.oracle.com/ ，这是Oracle官方提供的证书查询平台。登录账号： 使用您的Oracle账号和密码登录CertView。如果您不记得密码，可以通过注册账号时预留的邮箱重置密码。查看成…

阅读更多...

电信数据清洗案例：利用MapReduce实现高效数据预处理

电信数据清洗案例：利用MapReduce实现高效数据预处理

电信数据清洗案例：利用MapReduce实现高效数据预处理在大数据时代，电信行业积累了大量的用户通话、短信、上网等行为数据。在数据分析和机器学习模型训练前，对这些数据进行清洗是至关重要的一步。MapReduce 是一种高效的数据处理模型&#x…

阅读更多...

将vscode的终端改为cygwin terminal

将vscode的终端改为cygwin terminal

现在终端是默认的power shell，没有显示cygwin 接下来选择默认配置文件找到cygwin的选项即可然后提示可能不安全什么的，点是，就有了

阅读更多...

html+js+css实现拖拽式便签留言

html+js+css实现拖拽式便签留言

前些日子在网上冲浪时，看到一个便签式留言墙，让人耳目一新。心想这个看着不错，额想要。于是便开始搜寻是否有相应开源插件，想将其引入自己的博客中。但是搜寻了一圈，都没有符合预期的,要么功能不符合。有的功能符合&am…

阅读更多...

Linux编程：基于 Unix Domain Socket 的进程/线程间通信实时性优化

Linux编程：基于 Unix Domain Socket 的进程/线程间通信实时性优化

文章目录 0. 引言1. 使用 epoll 边缘触发模式非不要不选择阻塞模式边缘触发（ET）模式优点示例 2. 使用实时调度策略3. CPU 绑定4. 使用无锁缓冲区5. 优化消息传递的大小和频率6. 使用 SO_RCVTIMEO 和 SO_SNDTIMEO7. 示例代码其他阅读 0. 引言前几天被问…

阅读更多...

LeetCode【0039】组合总和

LeetCode【0039】组合总和

本文目录 1 中文题目2 求解方法：回溯法2.1 方法思路2.2 Python代码2.3 复杂度分析 3 题目总结 1 中文题目给定一个无重复元素的整数数组 candidates 和一个目标整数 target ，找出 candidates 中可以使数字和为目标数 target 的所有不同组合 &#…

阅读更多...

最新文章