llamma笔记：部署Llama2

llamma笔记：部署Llama2

news/2025/4/27 9:05:46/文章来源:https://blog.csdn.net/qq_40206371/article/details/136738424

1 申请Llama2 许可

Download Llama (meta.com)

地址似乎不能填中国

1.1 获取url

提交申请后，填的那个邮箱会受到一封meta发来的邮件，打码部分的url，之后会用得上

2 ubuntu/linux 端部署Llama2

2.1 git clone Llama2的github 仓库

 bash git clone https://github.com/facebookresearch/llama.git

2.2 安装Llama2运行所需要的依赖

pip install -e .

2.3 下载模型权重

bash download.sh

随后命令行要求验证URL，将刚刚邮件中的打码的那一部分复制进去。
然后输入你要下载的模型【如果下载多个，逗号分隔】

3 测试demo

 torchrun --nproc_per_node 1 example_chat_completion.py     --ckpt_dir llama-2-7b-chat/     --tokenizer_path tokenizer.model     --max_seq_len 512 --max_batch_size 6 >1.txt 2>&1

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/748161.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

每日一题第五期洛谷图的遍历

每日一题第五期洛谷图的遍历

图的遍历题目描述给出 N N N 个点， M M M 条边的有向图，对于每个点 v v v，求 A ( v ) A(v) A(v) 表示从点 v v v 出发，能到达的编号最大的点。输入格式第 1 1 1 行 2 2 2 个整数 N , M N,M N,M，表示点数…

阅读更多...

Vue3 使用vite进行调试

Vue3 使用vite进行调试

通过此篇可以学到： 如何在vue3vite中代理到服务端地址如何修改项目本地启动的端口如何可以使用本机ip进行访问本地地址修改vite.config.ts文件 import { fileURLToPath, URL } from node:urlimport { defineConfig } from vite import vue from vitejs/…

阅读更多...

git基础命令（四）之分支命令

git基础命令（四）之分支命令

目录基础概念git branch-r-a-v-vv-avv重命名分支删除分支git branch -h git checkout创建新的分支追踪远程分支同时切换到该分支创建新的分支并切换到该分支撤销对文件的修改，恢复到最近的提交状态：丢弃本地所有修改git checkout -h git merge合并指定分…

阅读更多...

log4rs测试

log4rs测试

引入crate： log4rs {version "1.3.0"} log {version "0.4.20"} 配置文件和Cargo.toml同级创建log4rs.yml，内容如下： refresh_rate: 30 seconds appenders:stdout:kind: consolerollingfile:kind: rolling_filep…

阅读更多...

【yolo检测模型出现大量误报】

【yolo检测模型出现大量误报】

文章目录 1.可能需要针对以下几个方面进行优化和调整：2.出现大量误报会直接导致精确率和准确率明显下降。3.解决办法，采用最简单的样本均衡3.1.样本均衡3.2.添加负样本 1.可能需要针对以下几个方面进行优化和调整： 数据集质量： 确…

阅读更多...

ASP.NET Mvc+FFmpeg+Video实现视频转码

ASP.NET Mvc+FFmpeg+Video实现视频转码

目录首先，做了视频上传的页面： FFmpeg：视频转码 FFmpegHelper工作类： 后台控制器代码： 前端视图代码： 参考文章： 首先，做了视频上传的页面： 借鉴了这篇文章 ASP.…

阅读更多...

D. Tandem Repeats?

D. Tandem Repeats?

思路：首先我们要枚举长度，然后从前往后遍历，判断是否存在改长度的重复串。代码： void solve(){string s;cin >> s;int n s.size();int ans 0;for(int len n / 2;len > 1;len --){int t 0;for(int i 0;i len <…

阅读更多...

【Qt问题】解决UI设计显示和运行显示界面大小不一致问题

【Qt问题】解决UI设计显示和运行显示界面大小不一致问题

问题描述： 在我自己第一次用Qt Creator的时候，发现老师的每次ui界面是多大，运行出来的窗口就是多大，而我自己的每次大小都对不上，所以我每次都要去手动调整窗口大小，非常痛苦。经过多方查找发现这是由于…

阅读更多...

TSINGSEE青犀AI智能分析网关V4酿酒厂安全挂网AI检测算法

TSINGSEE青犀AI智能分析网关V4酿酒厂安全挂网AI检测算法

在酿酒行业中，安全生产一直是企业经营中至关重要的一环。为了确保酒厂生产过程中的安全，TSINGSEE青犀AI智能分析网关V4的安全挂网AI检测算法发挥了重要作用。 TSINGSEE青犀AI智能分析网关V4的安全挂网检测算法是针对酒厂里酒窖挂网行为进行智能检测与识…

阅读更多...

Qt按回车键实现确定/发送按钮功能

Qt按回车键实现确定/发送按钮功能

构造函数中，添加如下代码 connect(ui->lineEdit,SIGNAL(returnPressed()),ui->pushButton_send, SIGNAL(clicked()),Qt::UniqueConnection) 当光标在lineEdit上时，输入完毕直接按回车键（大/小都可以）， //就会…

阅读更多...

个人简历主页搭建系列-03：Hexo+Github Pages 介绍，框架配置

个人简历主页搭建系列-03：Hexo+Github Pages 介绍，框架配置

今天的更新内容主要是了解为什么选择这个网站搭建方案，以及一些前置软件的安装。 Why Hexo? 首先我们了解一下几种简单的网站框架搭建方案，看看对于搭建简历网站的需求哪个更合适。在 BuiltWith（网站技术分析工具）上我们可以…

阅读更多...

【矩阵】73. 矩阵置零【中等】

【矩阵】73. 矩阵置零【中等】

矩阵置零给定一个 m x n 的矩阵，如果一个元素为 0 ，则将其所在行和列的所有元素都设为 0 。请使用原地算法。示例 1： 输入：matrix [[1,1,1],[1,0,1],[1,1,1]] 输出：[[1,0,1],[0,0,0],[1,0,1]] 解题思路 1、…

阅读更多...

SpringCloud Bus 消息总线

SpringCloud Bus 消息总线

一、前言接下来是开展一系列的 SpringCloud 的学习之旅，从传统的模块之间调用，一步步的升级为 SpringCloud 模块之间的调用，此篇文章为第八篇，即介绍 Bus 消息总线。二、概述 2.1 遗留的问题在上一篇文章的最后，我…

阅读更多...

汇编语言(Assemble Language)学习笔记（更新中）

汇编语言(Assemble Language)学习笔记（更新中）

零.学习介绍和使用工具【1】我们使用的教材是机械工业出版社的《32位汇编语言程序设计第二版》。指导老师是福州大学的倪一涛老师。这门课程教授的是Intel 80*86系列处理器的32位汇编。我们现在的处理器都兼容这个处理器。这篇博客只是大二下汇编语言学习的总结&#xff…

阅读更多...

数据结构顺序表的操作，窗口界面（c语言版）

数据结构顺序表的操作，窗口界面（c语言版）

// 准备头文件 #include <stdio.h> #include <stdlib.h>#define InitSize 10 // 动态顺序表的初始默认长度// 定义C语言的bool变量 #define bool char #define true 1 #define false 0/* 定义数据元素的数据类型 */ typedef int ElemType; // 方便更改// 动态顺…

阅读更多...

sui move动态字段练习（5）- 总结与思考

sui move动态字段练习（5）- 总结与思考

引言之前几篇文章，我们用sui move动态字段模拟solidity映射，实现了一个类似erc20的代币，这使我更加深刻地理解了sui move和solidity编程特性和编程思想的区别。下面是我的总结与思考。总结首先，sui与solidity的编程特性有很…

阅读更多...

css 各种方位计算 - client系列 offset系列 scroll系列 x/y 系列

css 各种方位计算 - client系列 offset系列 scroll系列 x/y 系列

offset系列 HTMLElement.offsetTop - Web API 接口参考 | MDN 一文读懂offsetHeight/offsetLeft/offsetTop/offsetWidth/offsetParent_heightoffset-CSDN博客 client系列搞清clientHeight、offsetHeight、scrollHeight、offsetTop、scrollTop-CSDN博客 scroll系列秒懂scr…

阅读更多...

2024年，如何使用chatgpt4.0为工作赋能？

2024年，如何使用chatgpt4.0为工作赋能？

ChatGPT 4.0的工作原理和功能 ChatGPT 4.0的工作原理和功能可以从以下几个方面进行详细说明： 工作原理 ChatGPT 4.0的工作原理主要基于深度学习技术，特别是Transformer模型的应用。它通过大量的文本数据进行训练，学习语言的模式和规律&…

阅读更多...

Android 启动service(Kotlin)

Android 启动service(Kotlin)

一、使用startForegroundService()或startService（）启用service **Activity //启动service val intent: Intent Intent(ServiceActivitythis,MyService::class.java) //Build.VERSION_CODES.O 26 // Android8以后，不允许后台启动Service i…

阅读更多...

波特图笔记

波特图笔记

波特图相关知识介绍波特图之前，首先要介绍放大电路的复频域分析的相关概念。增益函数放大器工作在小信号时，晶体管可以用线性模型近似。忽略温度等参数对元件的影响，认为放大器是一个线性是不变系统。输入信号和输出信号之间关系可以用线性常系数微分方程来进行描述。…

阅读更多...

最新文章