实习日志2之windows上大模型(qwen2-7b)部署

一、模型部署

1、下载ollama(大模型本地部署工具),并安装

下载网址:https://ollama.com/

ollama是大模型部署方案,对应docker,本质也是基于docker的容器化技术。

2、下载大模型

在命令框,如windows系统在cmd窗口输入命令

ollama run [model name]

模型名称可以去ollama官网搜索,一般来说7b需要8G内存,13b需要16GB的内存,70b需要64GB的内存

至此就可以在命令框和大模型进行交互,但是这种方式太远古了

我们可以使用一个图形化的界面进行操作,可以使用Open WebUI

3、其他

在与模型交互在过程中的命令

结束对话:a. Ctrl+D

Ollama的两种模式

1、聊天模式:对话模式和查询模式

对话模式:大模型会根据给的文档和已有的知识储备综合起来回答问题

查询模式:大模型只是根据文档进行回答

2、服务器模式:让ollama后端去运行大模型,然后它会开放一个端口给到所有的软件,这些软件通过这个端口就能去调用这些大模型的能力

开启服务器模式:在终端里输入 ollama serve

二、图形化界面部署

要安装Open WebUI 需要先安装docker

docker官网:docker-toolbox-windows-docker-for-windows安装包下载_开源镜像站-阿里云

安装注意事项:

直接执行exe文件会出现如下错误:

问题在于,docker desktop部署在windows上运行docker服务是基于windows的Hyper-V服务和WSL2内核的Windows上创建一个子系统(Linux),所以电脑上需要开启Hyper-V服务,并且安装WSL2(Windows下的Linux子系统)。

WSL 是 Windows Subsystem for Linux 的缩写,它是 Windows 10 操作系统的一项功能,使你能够在 Windows 上直接运行 Linux 文件系统,以及 Linux 命令行工具和 GUI 应用程序,并与传统的 Windows 桌面和应用程序一起运行。

  • 需要启动 Windows Hyper-V 和容器特性

直接搜索 启动或关闭Windows功能,勾选Hyper-V相关的功能

如果没有Hyper-V这个选项,需要新建一个文件命名为Hyper.cmd,文件中输入以下内容: 然后以管理员身份运行,之后重启电脑就可,window专业版自带Hyper这个功能

pushd "%~dp0"
dir /b %SystemRoot%\servicing\Packages\*Hyper-V*.mum >hyper-v.txt
for /f %%i in ('findstr /i . hyper-v.txt 2^>nul') do dism /online /norestart /add-package:"%SystemRoot%\servicing\Packages\%%i"
del hyper-v.txt
Dism /online /enable-feature /featurename:Microsoft-Hyper-V-All /LimitAccess /ALL

安装wsl,在命令行(以管理员身份运行)执行

wsl --updatewsl --install

一定要确保电脑已经开启了虚拟化

docker类似于一个虚拟的容器,它会把所有需要的依赖、资源全部打包在这个容器里,然后再放到系统上去运行。需要执行如下命令

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

会弹出如下web UI的界面,如果没有,可以尝试在地址栏输入loaclhost:3000

webUI除了包含基本的聊天功能外,还包含RAG能力,无论是网页还是文档都可以作为参考资料给到大模型

如果希望谷大模型读取网页,需要在链接前面加#号

可以点击+号上传文档

在对话框中输入#可以出现导入的文档

三、Anything LLM(搭建知识库)

启动ollama服务器模式,将ollama base url对应的链接镰刀Anything LLM软件里

这个时候软件就会通过链接读取可以加载的模型,这些模型都是用来生成内容的模型

下载地址:Download AnythingLLM for Desktop

第一步:选择模型,可以是商用大模型也可以是本地模型,这里选ollama

第二步:选嵌入模型,这里选默认AnythingLLM Embedder

第三步:选向量数据库,这里选默认lanceDB

第四步:输入workspace的名字,workspace就是将不同的知识库分隔成一个个工作区,可以点击上传按钮,上传文档、网页等

两个关键

1、嵌入模型

把上传的文本,表格数据处理成数字形式的一种低维嵌入向量数据,就是负责把高维度的数据转化为低维度的嵌入空间,这个数据处理的过程在RAG中非常重要

2、向量式数据库

专门用来高效处理大规模的向量数据

四、外部访问

1、安装ngrok(内网穿透工具)

给open WebUI 生成一个可以访问的地址,允许在外网的情况下能够访问

打开cmd,以管理员身份运行

choco install ngrok choco -v

注意:

如果执行choco install ngrok报错,说明电脑上还没有安装此工具

需要先执行如下命令安装

Set-ExecutionPolicy Bypass -Scope Process -Force; [System.Net.ServicePointManager]::SecurityProtocol = [System.Net.ServicePointManager]::SecurityProtocol -bor 3072; iex ((New-Object System.Net.WebClient).DownloadString('https://community.chocolatey.org/install.ps1'))

执行choco,出现如下代表安装成功

2、获取身份令牌

登录ngrok官网,选择Your Authtoken

粘贴认证令牌,复制到终端

3、指定外部需要访问的端口

ngrok http http://localhost:3000

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/51885.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

笔试练习day1

目录 数字统计题目解析解法(枚举数字拆分)代码 两个数组的交集题目解析解法哈希表代码 点击消除题目解析解法栈代码 感谢各位大佬对我的支持,如果我的文章对你有用,欢迎点击以下链接 🐒🐒🐒 个人主页 🥸🥸&#x1f97…

开源AI智能名片小程序源码在对立型定位策略中的应用与深入探索

摘要:在当今数字化营销风起云涌的时代,开源AI智能名片小程序源码作为技术创新的前沿阵地,为中小企业及后发创业品牌提供了实现差异化竞争与市场突破的利器。本文旨在深入探讨开源AI智能名片小程序源码如何有效融入对立型定位策略之中&#xf…

二进制部署k8s集群之master节点和etcd数据库集群(上)

目录 1.操作系统初始化配置 2.升级Linux内核 3.部署docker引擎 4.部署etcd集群 4.1 了解etcdctl工具对etcd做增删改查 4.2 通过etcdctl工具实现数据库的备份和恢复 5.部署Master组件 6.部署 Worker Node 组件 二进制搭建 Kubernetes v1.20 k8s集群master01&#xff1a…

【Cyber RT】Apollo Cyber RT安装, 环境搭建,test ok

一、下载源码 克隆Apollo 源码仓库 git clone https://gitee.com/ApolloAuto/apollo.git (耗时30min) 二、启动Apollo Docker 开发容器 进入到Apollo源码根目录,执行下述命令以启动Apollo Docker开发容器 cd apollo ./docker/scripts/dev_start.sh 如果只是使用Cyber…

经典文献阅读之--GraphAD(端到端自动驾驶的交互场景图)

Tip: 如果你在进行深度学习、自动驾驶、模型推理、微调或AI绘画出图等任务,并且需要GPU资源,可以考虑使用UCloud云计算旗下的Compshare的GPU算力云平台。他们提供高性价比的4090 GPU,按时收费每卡2.6元,月卡只需要1.7元每小时&…

使用IPIDEA海外代理助力宠物跨境电商1.1

3.如何获取具体分类的数据? 以前我们做选品,通常会招聘多个运营专员,每隔几小时去亚马逊平台上查看猫狗商品数据,然后人工把数据一条一条复制粘贴下来。通常一遍做下来,1-2小时就过去了(根据数据样本的大小…

【2024最新华为OD-C/D卷试题汇总】[支持在线评测] 围棋的气(100分) - 三语言AC题解(Python/Java/Cpp)

🍭 大家好这里是清隆学长 ,一枚热爱算法的程序员 ✨ 本系列打算持续跟新华为OD-C/D卷的三语言AC题解 💻 ACM银牌🥈| 多次AK大厂笔试 | 编程一对一辅导 👏 感谢大家的订阅➕ 和 喜欢💗 🍿 最新华为OD机试D卷目录,全、新、准,题目覆盖率达 95% 以上,支持题目在线…

Spring-原理篇-DispatcherServlet 初始化 怎么和IOC进行了打通?

委托模式的体现,在初始化醒目的时候Spring MVC为我们提供了一个DispatcherServlet,映射了所有的路径,所有的请求都会先到达这里然后被转发到具体的Controller 进行处理,此文来探索一下,DispatcherServlet 初始化的时候…

Hive之扩展函数(UDF)

Hive之扩展函数(UDF) 1、概念讲解 当所提供的函数无法解决遇到的问题时,我们通常会进行自定义函数,即:扩展函数。Hive的扩展函数可分为三种:UDF,UDTF,UDAF。 UDF:一进一出 UDTF:一进多出 UDAF&#xff1a…

架构分析(CPU:ARM vs RISC-V)

ARM N2 ARM V2 对比 N2和V2,整体架构具有一致性。保证 SiFive P870 P870 Pipeline Veyron V1

MATLAB画散点密度图(附代码和测试数据的压缩包)

1. 有关 Matlab 获取代码关注公众号WZZHHH回复关键词,或者咸鱼关注:WZZHHH123 怀俄明探空站数据解算PWV和Tm:怀俄明探空站数据解算PWV和Tm 怀俄明多线程下载探空站数据(包括检查和下载遗漏数据的代码):怀俄…

【C++深度探索】深入解析AVL树的底层实现机制

🔥 个人主页:大耳朵土土垚 🔥 所属专栏:C从入门至进阶 这里将会不定期更新有关C/C的内容,欢迎大家点赞,收藏,评论🥳🥳🎉🎉🎉 前言 AV…

阿里云 服务器安装rabbit

现在我们去服务器安装一个rabbit 进入home 创建一个rabbit文件夹 /home/rabbit vim deployRabbit.sh 脚本内容 #!/bin/bash docker run -d \ --name dev.rabbit \ --network dev-net \ -p 15672:15672 \ -v ./data:/var/lib/rabbitmq \ --hostname dev.rabbit \ rabbitmq:…

反射和游戏场景

主要内容 1.Unity中的反射机制运用 2.游戏场景本质 回顾一下反射的概念 程序正在运行时没有查看其它程序集或者自身的元数据,一个运行的程序查看本身或者其它程勋的元数据的行为就叫做反射。 在程序运行时,通过反射可以得到其它程序集或者自己程序集…

UCOS-III 互斥锁接口详解

在实时操作系统uC/OS-III中,互斥锁(Mutex)是一种用于管理对共享资源的访问的同步机制。互斥锁通过保证在任何时刻只有一个任务可以持有锁,从而防止资源竞争问题。同时,uC/OS-III还实现了递归锁定和优先级继承机制&…

2024杭电多校第三场

目录 1001-深度自同构 1003-游走 1007-单峰数列 1008-比特跳跃 1011-抓拍 1012-死亡之组 1001-深度自同构 每个数的答案其实与它的各个因数有关&#xff0c;正向递推一下 #include <bits/stdc.h> using namespace std; #define int long long const int N1e65; co…

51 单片机的Keil5软件

1. KEIL C51 软件获取 博主网盘下载&#xff1a;链接&#xff1a;https://pan.baidu.com/s/1YBfrRh2L7SIehS5xLQkAow?pwd4211 提取码&#xff1a;4211 也可以在 KEIL 的官网上下载&#xff1a;http:// https://www.keil.com/download/product/ 打开界面如下图所示&#xff1…

读零信任网络:在不可信网络中构建安全系统04最小特权

1. 公钥基础设施 1.1. PKI 1.2. 数字证书本身并不能解决身份认证问题 1.2.1. 需要一种方法来验证获得的公钥的确属于某人 1.2.2. 公钥基础设施&#xff08;PKI&#xff09;解决了这个问题 1.3. PKI定义了一组角色及其职责&#xff0c;能够在不可信的网络中安全地分发和验证…

AMQP-核心概念-终章

本文参考以下链接摘录翻译&#xff1a; https://www.rabbitmq.com/tutorials/amqp-concepts 连接&#xff08;Connections&#xff09; AMQP 0-9-1连接通常是长期保持的。AMQP 0-9-1是一个应用级别的协议&#xff0c;它使用TCP来实现可靠传输。连接使用认证且可以使用TLS保护…

观远BI经验总结

观远BI经验总结 观远BI&#xff08;Galaxy platform&#xff09;简介 ​ 观远数据是一站式智能分析平台&#xff0c;为企业提供数据分析可视化与智能决策服务&#xff0c;打通数据采集-数据接入-数据管理-数据开发-数据分析-AI建模-AI模型运行-数据应用全流程&#xff0c;全方…