从 0 到 1 安装运行 Qwen2

环境信息:
PyTorch 2.0.0
Python 3.8(ubuntu20.04)
Cuda 11.8
RTX 3090(24GB) * 1
模型
/home/zhangwei/llm
源码
/usr/local/project/conda/Qwen/Qwen

mkdir -p /usr/local/project/conda/Qwen  #【用来存放Qwen2源码】
mkdir -p /home/zhangwei/llm  #【用来存放Qwen2模型】cd  /usr/local/project/conda/Qwen #【进入文件夹】
git clone https://github.com/QwenLM/Qwen.git #[下载Qwen源码】cd /usr/local/project/conda/Qwen/Qwenpip install -r requirements.txtpip install -r requirements_web_demo.txtcd  /home/zhangwei/llm #【进入模型文件夹】#安装modelscope
pip install modelscope opencv-python#下载模型
modelscope download --model 'qwen/Qwen-7B-Chat-Int4'  --cache_dir '/home/zhangwei/llm'
#下载模型
modelscope download --model 'qwen/Qwen2-72B-Instruct-GPTQ-Int4'  --cache_dir '/home/zhangwei/llm'#如果提示缺AutoGPTQ就安装AutoGPTQ,cuda 11.7
#对于 CUDA 11.7: 
pip install auto-gptq --extra-index-url https://huggingface.github.io/autogptq-index/whl/cu117/
#对于 CUDA 11.8: 
pip install auto-gptq --extra-index-url https://huggingface.github.io/autogptq-index/whl/cu118/
#对于 RoCm 5.4.2: 
pip install auto-gptq --extra-index-url https://huggingface.github.io/autogptq-index/whl/rocm542/#运行时选择自己想要用的模型
#提示缺什么就用pip装什么,需要注意的是版本 cuda 、python 等版本的兼容问题
#web运行
#--server-port 指定运行端口
#--server-name 指定 IP
#-c 指定模型目录
python web_demo.py --server-port 6006 --server-name 0.0.0.0 -c /home/zhangwei/llm/qwen/Qwen-7B-Chat-Int4 #命令行运行
#-c 指定模型目录
python cli_demo.py -c /home/zhangwei/llm/qwen/Qwen-7B-Chat-Int4 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/40436.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

机器人典型的交互任务、阻抗控制的示意图、内涵、意义、存在的交互控制科学问题

机器人典型的交互任务 机器人在实际应用中经常需要完成与环境的交互任务,这些任务包括但不限于: 装配任务:在制造业中,机器人需要准确地操控和组装各种零部件,包括不同形状、大小和材质的物体。搬运任务:…

科普文:一文搞懂nginx原理和实战

1. Nginx简介与核心架构 1.1 Nginx简介 Nginx (engine x) 是一个高性能的 HTTP 和反向代理服务器,也是一个 IMAP/POP3/SMTP 邮件代理服务器。 由 Igor Sysoev 于2004年首次发布,其设计目标是解决 C10K 问题,即在一台服务器上同时处理一万个并…

The Sandbox 人物化身每月奖励: 七月版来了!

人物化身的持有者可以从 The Sandbox 领取自己的队服! 视频:https://youtu.be/tSo5FPL7DhE 我们又推出了人物化身所有者月度奖励!在七月,我们将通过 The Sandbox 队服来弘扬体育竞技精神。穿上这些时尚的元宇宙队服,代…

Java:HashMap底层原理

一、前言 在Java 7及之前的版本中,HashMap的底层数据结构主要是数组加链表,在Java 8中,HashMap的底层数据结构是数组链表红黑树的组合。 二、底层数据结构 1. 数组 初始化和扩容:HashMap首先会初始化一个指定长度的数组&#xf…

单机多网卡互通——问题跟踪+工具分析

一、背景 想搭建soft ROCE(RXE)与实体ROCE设备互联的测试环境&#xff0c;为了节省机器以及使用方便&#xff0c;预想在配备ROCE卡的主机上&#xff0c;用另一个网卡绑定soft ROCE&#xff0c;然后互通。 [ETH1 ROCE] <--------------------> [ETH2 RXE] 二、问题跟…

Appium元素定位(全网详细讲解)(二)

1.appium inspector&#xff08;定位元素的工具&#xff09;使用方法 详细介绍&#xff1a; 详细解释&#xff1a; 图标名称说明1Show Element Handles是否显示元素句柄2Select Elements选择元素定位3Tap/Swipe By Coordinates按坐标点击/滑动4Download Screenshot下载屏幕截…

2024机器遗忘(Machine Unlearning)技术分类-思维导图

1 介绍 机器遗忘&#xff08;Machine Unlearning&#xff09;是指从机器学习模型中安全地移除或"遗忘"特定的数据点或信息。这个概念源于数据隐私保护的需求&#xff0c;尤其是在欧盟通用数据保护条例&#xff08;GDPR&#xff09;等法规中提出的"被遗忘的权利…

【漏洞复现】飞企互联-FE企业运营管理平台——SQL注入

声明&#xff1a;本文档或演示材料仅供教育和教学目的使用&#xff0c;任何个人或组织使用本文档中的信息进行非法活动&#xff0c;均与本文档的作者或发布者无关。 文章目录 漏洞描述漏洞复现测试工具 漏洞描述 飞企互联-FE企业运营管理平台是一个基于云计算、智能化、大数据…

【8】相关补充

【8】相关补充 文章目录 前言一、不同模型在测试集上的精度二、实验记录三、SNP位点筛选及其它python脚本四、总结五、后续安排总结 前言 存放一些有关这个项目研究的补充。 三叶青图像识别研究简概 一、不同模型在测试集上的精度 存放了不同识别模型在测试集上精度评估展示…

Java中的时间日期处理与时区管理

Java中的时间日期处理与时区管理 大家好&#xff0c;我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编&#xff0c;也是冬天不穿秋裤&#xff0c;天冷也要风度的程序猿&#xff01; 在现代软件开发中&#xff0c;时间日期处理和时区管理是至关重要的部分。Jav…

Android HWASAN使用与实现原理

一、背景 为了提前检测出Android User Sapce的app或native进程的内存错误问题&#xff0c;帮助研发定位与分析这些问题&#xff0c;基于Android 14版本上对HWASAN做了调研分析。 二、ASAN介绍 HWASAN是在ASAN的基础上做了拓展&#xff0c;因此在介绍HWASAN之前先了解下ASAN.…

ES8.13.0 java client请求响应报错status: 200, [es/search] Failed to decode response

最近在做商城项目使用ES8.13.0做商品复杂的检索功能时&#xff0c;遇到一个报错如下&#xff1a; 2024-07-05 10:47:53.994 ERROR 10708 --- [nio-7500-exec-1] com.tfq.exception.RRExceptionHandler : co.elastic.clients.transport.TransportException: node: http://1…

WBCE CMS v1.5.2 远程命令执行漏洞(CVE-2022-25099)

前言 CVE-2022-25099 是一个影响 WBCE CMS v1.5.2 的严重安全漏洞&#xff0c;具体存在于 /languages/index.php 组件中。该漏洞允许攻击者通过上传精心构造的 PHP 文件在受影响的系统上执行任意代码。 技术细节 受影响组件&#xff1a;/languages/index.php受影响版本&…

如何在 Odoo 16 中向新视图添加字段

例如,让我们看看如何在新视图或新操作窗口中创建“many2one”字段。 请考虑下面的屏幕截图,它表示不包含任何字段的新视图类型或客户端操作窗口。 我们现在可以将与“res.partner”关联的“多对一”字段引入到我们的新视图或客户端操作窗口中。 为了实现这一点,在 XML 模板…

ShardingSphere

ShardingSphere 是一个开源的分布式数据库中间件生态系统&#xff0c;由 Apache 基金会孵化和维护。它的主要目标是帮助开发者解决分库分表、分布式事务和数据加密等分布式数据库应用中的常见问题。ShardingSphere 提供了多种组件&#xff0c;如 Sharding-JDBC、Sharding-Proxy…

Using a text embedding model locally with semantic kernel

题意&#xff1a;在本地使用带有语义核&#xff08;Semantic Kernel&#xff09;的文本嵌入模型 问题背景&#xff1a; Ive been reading Stephen Toubs blog post about building a simple console-based .NET chat application from the ground up with semantic-kernel. Im…

idea中maven全局配置

配置了就不需要每次创建项目都来设置maven仓库了。 1.先把项目全关了 2. 进入全局设置 3.设置maven的仓库就可以了

SpringBoot实现多数据源切换

1. 概述 随着项目规模的扩大和业务需求的复杂化&#xff0c;单一数据源已经不能满足实际开发中的需求。在许多情况下&#xff0c;我们需要同时操作多个数据库&#xff0c;或者需要将不同类型的数据存储在不同的数据库中。这时&#xff0c;多数据源场景成为必不可少的解决方案。…

【CentOS7.6】docker部署EMQX教程,本地镜像直接导入(附下载链接),没法在云服务器上魔法拉取镜像的快来

总览 先把下载链接放在这里吧&#xff0c;这是 EMQX 的 tar 包&#xff0c;能够直接导入 CentOS 的 docker&#xff1a; 链接&#xff1a;https://pan.baidu.com/s/1rSGSLoVvj83ai6d5oolg8Q?pwd0108 提取码&#xff1a;0108 一、安装配置教程 1.将 EMQX-latest.tar 包导入…

服务器重装系统时数据丢失?有哪些方法可以避免

为了避免在服务器重装系统时数据丢失&#xff0c;可以采取以下预防措施&#xff1a; 1. 数据备份&#xff1a;在重装系统之前&#xff0c;备份所有重要的数据和配置文件。备份可以通过以下方式进行&#xff1a; - 使用外部存储设备(如USB硬盘、NAS等)进行备份。 - 利用备份软件…