大模型【Qwen2-7B本地部署(WEB版)】(windows)

大模型系列文章目录


Qwen2-7B本地部署(WEB版)

前言

大模型是截止2024年上半年最强的AI,Qwen2是刚出来的号称国内最强开源大模型。这是大模型系列的第一篇文章,旨在快速部署看看最近出来的大模型效果怎么样,效果ok的话就微调自己的GPTs了。

一、Ollama下载安装

  1. 进入官网
  2. 点击Download
  3. 选择Windos,点击Download for Windows (Preview),这里fq会快很多
  4. 默认安装

二、Qwen2下载安装

1.下载Qwen2

  1. 进入官方教程:https://qwen.readthedocs.io/zh-cn/latest/getting_started/installation.html
  2. 先在最下面点击效率评估,看下各个模型占的显存,选择适合自己的,比如我的显卡是4070,有12G显存,我选择的模型就是Qwen2-7B-Instruct GPTQ-Int4请添加图片描述
  3. 进入下载链接
  4. 会看到不同的后缀,q”+ 用于存储权重的位数(精度)+ 特定变体,数字越大性能越强。
  5. 数字越大,精度越高,k是在所有的attention和feed_forward张量上将精度提升2位,m是在一半的attention和feed_forward张量上将精度提升2位。
  6. 根据自己的需求选择模型,我这里直接选了q8。

2.运行Qwen2

  1. 新建一个文件夹,自己取个英文名(qwen),把qwen2-7b-instruct-q8_0.gguf移到文件夹里。
  2. 在文件夹里新建一个名为Modelfile的文件,里面填
FROM ./qwen2-7b-instruct-q8_0.gguf
  1. 然后用命令行通过ollama创建Qwen2-7B模型:
ollama create Qwen2-7B -f ./Modelfile

出现success代表创建成功

  1. 运行,输入命令
ollama run Qwen2-7B

出现对话框就可以聊天啦
请添加图片描述

如果要看本地有哪些大模型:ollama list
如果要删除这个模型的话:ollama rm xxx
如果要看运行了哪些大模型:ollama ps

但是在dos中聊天总感觉在上世纪的聊天方式一样,所以为了找到GPT的感觉,接下来我们继续在web中实现。

三、Node.js

1.Node.js下载安装

  1. 进入Node官网下载Node,安装
  2. 验证node的版本:
node -v

v20以上就没问题

  1. 下载ollama-webui代码
  2. 进入ollama-webui文件夹,设置国内镜像源提速:
npm config set registry http://mirrors.cloud.tencent.com/npm/
  1. 安装Node.js依赖:
npm install

如果报错说要audit,则依次进行即可:

npm audit
npm audit fix
  1. 启动Web界面:
npm run dev

打开Web页面,选择你的模型即可开始对话:
请添加图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/45257.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Maven 项目编译提示 unparseable pom 的解决方法

【问题描述】 手动下载了个项Java Web 项目,导入在 eclipse 开发工具里。然后一股脑地右键 “maven clean” 。然后发现操作 maven 什么东西都提示 "unparseable POM"字眼。结果就是根本更新不了本地的 maven 仓库。 【答案】 找到 eclipse 的 “windo…

算法学习day11

一、用最少数量的箭引爆气球() 一支弓箭可以沿着 x 轴从不同点 完全垂直 地射出。在坐标 x 处射出一支箭,若有一个气球的直径的开始和结束坐标为 xstart,xend, 且满足 xstart ≤ x ≤ xend,则该气球会被 引爆 。 输入&#xff…

Xcode持续集成之道:自动化构建与部署的精粹

标题:Xcode持续集成之道:自动化构建与部署的精粹 在快节奏的软件开发中,持续集成(Continuous Integration, CI)是提升开发效率和软件质量的关键实践。Xcode作为苹果生态中的核心开发工具,提供了与多种持续…

上机算法刷题暑期篇(一) —— AcWing 3692. 最长连续公共子序列(西电)

题目链接 AcWing 3692. 最长连续公共子序列 题目详情 题目解析 我们一看到题目,最长和连续子串,我们第一反应应该是什么?没错,就是dp,一般来说,子串问题常见的解法有两种: 双指针 dp 这道题无疑就是一道最常见的dp问题,而dp问…

昇思25天学习打卡营第11天 | FCN图像语义分割

昇思25天学习打卡营第11天 | FCN图像语义分割 文章目录 昇思25天学习打卡营第11天 | FCN图像语义分割FCN模型数据处理下载数据集创建训练集可视化训练集 网络构建网络结构张量操作 训练准备导入VGG-16部分预训练权重:损失函数模型评估指标 模型训练模型评估模型推理…

练习:随机点名器5

题目: TxT文件中事先准备好一些学生信息,每个学生的信息独占一行。,要求1:每次被点到的学生,再次被点到的概率在原先的基础上降低一半。 举例:80个学生,点名5次,每次都点到小A,概率…

网络规划设计师考试大纲

网络规划设计师考试大纲 网络规划设计师一年考一次,下半年开考,共有三个科目:综合知识、案例分析、论文。 科目包括: (1)网络规划与设计综合知识,考试时间为150分钟,笔试,选择题; (2)网络规划与…

常见 Web漏洞分析与防范研究

前言: 在当今数字化时代,Web应用程序扮演着重要的角色,为我们提供了各种在线服务和功能。然而,这些应用程序往往面临着各种潜在的安全威胁,这些威胁可能会导致敏感信息泄露、系统瘫痪以及其他不良后果。 SQL注入漏洞 …

《昇思25天学习打卡营第16天|基于MindNLP+MusicGen生成自己的个性化音乐》

MindNLP 原理 MindNLP 是一个自然语言处理(NLP)框架,用于处理和分析文本数据。 文本预处理:包括去除噪声、分词、词性标注、命名实体识别等步骤,使文本数据格式化并准备好进行进一步分析。 特征提取:将文…

【C++】CMake入门

CMake 是一个跨平台的构建系统生成工具,可以生成用于编译和链接应用程序的构建文件(如 Makefile 或 Visual Studio 工程文件)。 安装 CMake Windows 可以从 CMake官网 下载并安装 Windows 版本的 CMake。安装完成后,确保将 CMak…

5 MySql

5 MySql 一、简介二、SQL语言2.1 导入外部SQL文件2.2 显示表结构2.3 与创建数据库相关的语句2.4 与表相关的语句2.5 操作表中的数据2.6 7种基本的sql查询 三、SQL的注意点3.1 与集合函数相关3.2 SQL语句的书写与执行过程 四、约束 constraint4.1 作用4.2 功能分类4.3 自增 五、…

【web、DNS综合实验】

题目: 创建两个用户www.zhangsan.com 加密,www.lisi.com 目录:/www/zahngsan /www/lisi 主服务器做 dns web 从服务器做dns 在从服务器上能实现curl -k https://www.zhangsan.com ok,curl http://www.lisi.com ok 思路&#…

python爬虫学习(三十三天)---多线程上篇

hello,小伙伴们!我是喔的嘛呀。今天我们来学习多线程方面的知识。 目录 一、了解多线程 (1)大概描述 (2)多线程爬虫的优势 (3)多线程爬虫的实现方式 (4&#xff09…

头歌资源库(25)地图着色

一、 问题描述 任何平面区域图都可以用四种颜色着色,使相邻区域颜色互异。这就是四色定理。要求给定区域图,排出全部可能的着色方案。例如,区域图如下图所示: 要求用四种颜色着色。 则输入: 10 4 (分别表示…

【ZhangQian AI模型部署】目标检测、SAM、3D目标检测、旋转目标检测、人脸检测、检测分割、关键点、分割、深度估计、车牌识别、车道线识别

在模型部署落地(主要部署到rk3588)折腾了这么多年,把这些年折腾过的模型整理了一下,所有的流程说明、代码模型都完全开放的,欢迎交流学习。有的是为了项目、有的是为了学习、还有的是为了找点事做、有的完全是为了安抚…

字节码编程bytebuddy之实现抽象类并并添加自定义注解

写在前面 本文看下使用bytebuddy如何实现抽象类,并在子类中添加自定义注解。 1:代码 1.1:准备基础代码 类和方法注解 package com.dahuyou.bytebuddy.cc.mine;import java.lang.annotation.ElementType; import java.lang.annotation.Re…

Open3D 提取点云的重叠区域和非重叠区域

目录 一、概述 二、代码实现 三、实现效果 3.1原始点云 3.2处理后点云 一、概述 在点云处理中,提取点云的重叠区域和非重叠区域可以提供有价值的信息,用于多种应用。以下是详细解释及其作用: 配准质量评估:在多视角点云拼接或配准过程中,通过分析重叠区域,可…

python-27-零基础自学python

学习内容:《python编程:从入门到实践》第二版 知识点: 统计文本单词数、 解决问题: gbk codec cant decode byte 0x9d in position 995: illegal multibyte sequence” 练习内容: 练习10-10:常见单词 …

【北京迅为】《i.MX8MM嵌入式Linux开发指南》-第一篇 嵌入式Linux入门篇-第二十六章 安装超级终端软件

i.MX8MM处理器采用了先进的14LPCFinFET工艺,提供更快的速度和更高的电源效率;四核Cortex-A53,单核Cortex-M4,多达五个内核 ,主频高达1.8GHz,2G DDR4内存、8G EMMC存储。千兆工业级以太网、MIPI-DSI、USB HOST、WIFI/BT…

短视频矩阵系统是什么?怎么搭建短视频矩阵系统?一文了解矩阵模式

在数字时代,短视频已成为信息传播的新宠,而短视频矩阵系统则是品牌和个人在短视频领域取得突破的重要工具。那么,短视频矩阵系统究竟是什么?如何搭建这样一个高效的系统?它又能够解决哪些问题呢?本文将为您…