本地部署大模型并使用知识库Windows下Ollama+Docker+MaxKB安装的记录

概要

本文介绍本地部署大模型和知识库的小白方法,可以运行较多种类的大模型,使用的软件为docker和ollama以及MaxKb作为知识库前端。

下载

各安装包可以百度去官网或者github下载或使用,也可以点击下面的的链接和我下载相同的版本。

 ollama

docker

MaxKB

安装docker

打开安装包然后一路默认即可。

选择它推荐的配置。

安装ollama

然后安装ollama。双击然后一路默认。

d3b94e787a35486c8433b76e8970b760.png

 

 安装完成:

win+R输入cmd进入命令行,输入ollama

678a73c792dd413599735174ee80fce1.png

去挑一个你能带动的模型点击去:

下载模型并运行

library (ollama.com)

点进去,左边选参数大小,右边复制命令。win+R输入cmd回车。右键粘贴。

468105c328d64936a95eaa2118950f4b.png

我是2060,和我差不多普通人建议7B以下。

运行 7B 模型需要至少 8GB 的 RAM,运行 13B 模型需要 16GB RAM,运行 33B 模型需要 32GB RAM。我是32gb,但是显卡不够强,我会一步步提高参数量看看能运行到哪一个为止。

各位同学任意选一个即可。

比如:

ollama run qwen2

管理命令:

serve:启动 Ollama
create:从 Modelfile 创建模型
show:显示模型信息
run:运行模型
pull:从注册表中拉取模型
push:将模型推送到注册表
list:列出模型
ps:列出正在运行的模型
cp:复制模型
rm:删除模型
help:查看任何命令的帮助

下载之后:


>>> 你是谁?
I am a virtual assistant.>>> 你能用中文回答我吗?
Yes, I can assist you in Chinese as well as English.>>> 从现在开始使用中文
Of course! Please let me know if there is anything else I can help with.>>> ok,给我把这句话翻译成中文:你是谁
Sure, I'd be happy to help you translate that sentence into Chinese for you. 你是谁?>>> ok,给我把这句话翻译成中文:i am wuyi
I'm sorry, but I don't have that information in my system. Would you like me to find it for you?>>> yes
Okay, let me see what I can do. Please give me a moment.

我下的是比较一般的模型,我们试一试另外一个:

 千问数学版:

ollama run qwen2-math

f92d9902152e45359cadb888f2cd0f77.png

好吧,好像还是很呆。 

llama3.1的8b版本 

ollama run llama3.1

c74f38483a9344e584ae3f7b50805662.png

也是错了。可能是我电脑性能限制?

总之我们的模型测试的差不多了。

按ctrl+d退出问答。

安装MaxKB

接着,安装MaxKB。

win+R打开命令行:

docker run -d --name=maxkb -p 8080:8080 -v ~/.maxkb:/var/lib/postgresql/data -v ~/.python-packages:/opt/maxkb/app/sandbox/python-packages cr2.fit2cloud.com/1panel/maxkb

初始: 

# 用户名: admin
# 密码: MaxKB@123..

等待下载完成,之后docker会自动启动。

点击下面的连接,你应该能够看见 ,使用账号密码登录。

 MaxKB

27767eb54a8645c68a6cfcbd386aef93.png

 管理模型:

34693fc1f83c4df3bb3d8f795d116003.png 

添加模型

选择ollama: 

bdffdca1ebd14ee9af89bb4acd63b807.png 

模型名称随意,公私有自己考虑,如果你要给其他人用就用公有。 

 503b0bb2542d4073b3154f1b49754d05.png

模型选择:

在命令行输入:ollama -list

然后复制名字到基础模型那一栏。

f83d7817316e4241a0b8eace4a473973.png

当然了,你直接下拉栏中选择一个也可以哦。 

APi域名

如果你的ollama是安装在容器中,那么你可以直接在api域名处输入你的ip地址加上11434.

注意我们的MaxKB是安装在docker容器中的,所以访问外部的ollama需要使用。

http://host.docker.internal:11434/

apikey随意填写。

创建应用

e20c505b2e9843c29edf5dbcd6aae9ac.png

初次使用:

56d46bd8cec54dff81b52d09e1e652f5.png

创建:选择模型:

00125033393e44d5b2cf9146ff01a3f2.png

请注意,这里这样使用相当于只是多了一个前端,不过你可以对使用进行修改。 

 5e0eed9018a345508368da802670e214.png

切换模型即可得到新模型的回答:

b25c34dabf4f4ae4b6c7f12da59514f9.png

 使用就是这么简单。

创建知识库

ac9d1f066a69407da770d936f8c872ca.png

fa20b27933a1463e86bbc81b74cc935c.png

如果你选择web站点并且填写csdn就会如图所示:

c5a839e29f954240a278047893f5a22b.png

当然了事实上不是这么用的,你得挑选网页上的内容,不能直接把主页扔进去。

一下子多了一百多条:

f0014ba64428496db3cbed852fa29978.png

本地文档上传会更加方便:

31e9f823179348fca395bb2500101d75.png

 点击上传文档,选中文件上传,右下角创建导入:

 

 de119abe92cf45bda1a590033f014f54.png

 

871b29fafeb949eca620ed28329b4441.png

 

 

选择上传文档会进行自动智能分段,右下角导入即可。

导入后如图:

3a3bd1d43f4f4ee5bbb54440bf212b99.png

聊天可以选择关联知识库:

 未关联:

0307fdb45c844694b0e38dd7f4a1d023.png

关联后:

8dcf01524a134dc4a0b60d1c16e26a6b.png

比较难用啊。

换个问题:

这不就来了吗?

ed341a715b9e4a2cba8488ab017cbdaa.png

 创建函数库

f616c95453e2498f8573c276da382054.png

这个就不多介绍了。记录就到这里,通宵有点累了。 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/53925.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Lnux-gcc/g++使用

目录 1.gcc/g介绍 1.什么是 gcc / g 2.gcc/g指令格式 2. gcc / g 实现程序翻译的过程 1.预处理(进行宏替换) 2.编译(生成汇编) 3.汇编(生成机器可识别代码) 4.连接(生成可执行文件或库文件) 1.gcc/g介绍 1.什么…

小明震惊OpenAI 的新模型 01

在硅谷的中心,繁忙的咖啡馆和创业中心周围,年轻的软件工程师小明坐在他的办公桌前,面露困惑。科技界一直在盛传一项新的AI突破,但他持怀疑态度,不敢抱太大希望。他认为AI泡沫即将破灭,炒作列车即将出轨&…

【计算机网络】网络通信中的端口号

文章目录 一、引入端口号二、端口号的作用三、端口号的确定 在TCP/IP协议中,传输层有两个重要的协议:TCP(传输控制协议)和UDP(用户数据报协议)。TCP用于提供可靠的数据传输,而UDP则适合用于广播…

电子电气架构 --- 基于ISO 26262的车载电子软件开发流程

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 屏蔽力是信息过载时代一个人的特殊竞争力,任何消耗你的人和事,多看一眼都是你的不…

《ImageNet Classification with Deep Convolutional Neural Networks》论文导读

版权声明 本文原创作者:谷哥的小弟作者博客地址:http://blog.csdn.net/lfdfhl《ImageNet Classification with Deep Convolutional Neural Networks》是一篇在深度学习领域具有重要影响力的论文,由Alex Krizhevsky、Ilya Sutskever和Geoffrey E. Hinton等人撰写。该论文主要…

golang实现正向代理http_proxy和https_proxy

package mainimport ("bytes""fmt""io""log""net""net/url""strings" )func main() {// tcp 连接,监听 8080 端口l, err : net.Listen("tcp", ":8080")if err ! nil {l…

FTP、SFTP安装,整合Springboot教程

文章目录 前言一、FTP、SFTP是什么?1.FTP2.SFTP 二、安装FTP1.安装vsftp服务2.启动服务并设置开机自启动3.开放防火墙和SELinux4.创建用户和FTP目录4.修改vsftpd.conf文件5.启动FTP服务6.问题 二、安装SFTP1、 创建用户2、配置ssh和权限3、建立目录并赋予权限4、启动…

Wophp靶场寻找漏洞练习

1.命令执行漏洞 打开网站划到最下,此处的输入框存在任意命令执行漏洞 输入命令whoami 2.SQL注入 搜索框存在SQL注入,类型为整数型 最终结果可以找到管理员账户和密码 3.任意文件上传漏洞 在进入管理员后台后,上传木马文件 访问该文件&…

博客系统测试报告

当我们至少完成了一次项目的功能测试后,我们可以写一篇测试报告出来。在这里,我先完成了功能测试,自动化测试,又进行了弱网测试,我们把它们都编入测试报告,来写出一篇简单的博客系统测试报告 Gitee源码&am…

树莓派5上手

1 安装系统 Raspberry Pi OS 是基于 Debian 的免费操作系统,针对 Raspberry Pi 硬件进行了优化。Raspberry Pi OS 支持超过 35,000 个 Debian 软件包。树莓派 5 可以安装各种系统,但是如果对于系统没有特殊的要求,还是安装 Raspberry Pi OS …

uniapp登录页面( 适配:pc、小程序、h5)

<!-- 简洁登录页面 --> <template><view class"login-bg"><image class"img-a" src"https://zhoukaiwen.com/img/loginImg/2.png"></image><image class"img-b" src"https://zhoukaiwen.com/im…

KAN 学习 Day4 —— MultKAN 正向传播代码解读及测试

在KAN学习Day1——模型框架解析及HelloKAN中&#xff0c;我对KAN模型的基本原理进行了简单说明&#xff0c;并将作者团队给出的入门教程hellokan跑了一遍&#xff1b; 在KAN 学习 Day2 —— utils.py及spline.py 代码解读及测试中&#xff0c;我对项目的基本模块代码进行了解释…

『功能项目』怪物的有限状态机【42】

本章项目成果展示 我们打开上一篇41项目优化 - 框架加载资源的项目&#xff0c; 本章要做的事情是按照框架的思想构建项目并完成怪物的自动巡逻状态&#xff0c;当主角靠近怪物时&#xff0c;怪物会朝向主角释放技能 首先新建脚本&#xff1a;BossCtrl.cs (通常把xxxCtrl.cs脚…

SpringBoot2:请求处理原理分析-利用内容协商功能实现接口的两种数据格式(JSON、XML)

文章目录 一、功能说明二、案例实现1、基于请求头实现2、基于请求参数实现 一、功能说明 我们知道&#xff0c;用ResponseBody注解标注的接口&#xff0c;默认返回给页面的是json数据。 其实&#xff0c;也可以返回xml结构的数据给页面。 这一篇就来实现一下这个小功能。 二、…

深入理解数据分析的使用流程:从数据准备到洞察挖掘

数据分析是企业和技术团队实现价值的核心。 5 秒内你能否让数据帮你做出决策&#xff1f; 通过本文&#xff0c;我们将深入探讨如何将原始数据转化为有意义的洞察&#xff0c;帮助你快速掌握数据分析的关键流程。 目录 数据分析的五个核心步骤1. 数据获取常用数据获取方式 2. 数…

【CS110L】Rust语言 Lecture3-4 笔记

文章目录 第三讲 所有权:移动与借用&例1例2例3 错误处理&#xff08;开头&#xff09;为什么空指针如此危险&#xff0c;我们能做什么以应对&#xff1f;— 引出Optionis_none()函数unwrap_or()函数常见用法 第四讲 代码实践:链表Box节点和链表的定义节点和链表的构造函数判…

charls基于夜神模拟器抓取安卓7.0应用程序https请求

charls基于夜神模拟器抓取安卓7.0应用程序https请求 1、安装charls(安装步骤这里就不详细说了)2、下载证书(证书后缀名 xx.pem)3、使用git bash生成证书hash4、上传证书到安卓的系统证书目录下(夜神模拟器方案)5、验证抓包1、安装charls(安装步骤这里就不详细说了) 2、…

【Vue】2

1 Vue 生命周期 Vue生命周期&#xff1a;一个 Vue 实例从 创建 到 销毁 的整个过程 创建(create)阶段&#xff1a;组件实例化时&#xff0c;初始化数据、事件、计算属性等挂载(mount)阶段&#xff1a;将模板渲染并挂载到 DOM 上更新(update)阶段&#xff1a;当数据发生变化时…

数据中台建设(六)—— 数据开发-提取数据价值

数据开发-提取数据价值 数据开发涉及的产品能力主要包括三部分&#xff1a;离线开发、实时开发和算法开发。 离线开发主要包括离线数据的加工、发布、运维管理&#xff0c;以及数据分析、数据探索、在线查询和及时分析相关工作。实时开发主要涉及数据的实时接入和实时处理。算…

网络高级(学习)2024.9.10

目录 一、Modbus简介 1.起源 2.特点 3.应用场景 二、Modbus TCP协议 1.特点 2.协议格式 3.MBAP报文头 4.功能码 5.寄存器 &#xff08;1&#xff09;线圈寄存器&#xff0c;类比为开关量&#xff0c;每一个bit都对应一个信号的开关状态。 &#xff08;2&#xff09…