本地Deepseek添加个人知识库(Page Assist/AnythingLLM)

本地Deepseek两种方法建立知识库

  • 前言 (及个人测试结论)
  • 法一、在Page Assist建立知识库
    • step1 下载nomic-embed-text
    • step2 加载进Page Assist
    • step3 添加知识
    • step4 对话框添加知识库
  • 法二、在AnythingLLM建立知识库
    • 准备工作
      • 1.下载nomic-embed-text
      • 2.下载AnythingLLM
      • 3.创建工作区,进行设置
        • 3.1 聊天设置设置
        • 3.2 向量数据库
        • 3.3 代理配置
      • 4.进入软件设置
        • 4.1 向量数据库
        • 4.2.嵌入首选项
    • 上传文档
    • 测试

前言 (及个人测试结论)

本贴 是在本地部署Deepseek的基础上进行的,部署方法见上一篇帖子win10部署本地deepseek-r1,chatbox,deepseek联网(谷歌网页插件)。

参考视频:【AI】如何用RAG投喂数据给你的deepseek?

想要获得自己的私人助手,需要喂相关的知识(RAG),这就需要建立知识库
建立知识库 需要先有一个量化工具(nomic-embed-text)。

ds的模型越大,回答的越理想。因设备条件差,只能用1.5b的进行测试。
方法一、在谷歌插件Page Assist中投喂数据,较为方便。大pdf可以成功,但是回答的不理想。

方法二、AnythingLLM可以使用pdf、文本、音频、视频(音频、视频我没测试).

注意:刚测试发现pdf的质量 也影响测试结果,扫描的pdf教材之类的影印书籍,他在转化RAG的时候可能就存在问题了。所以影印书籍不适合投喂学习。

法一、在Page Assist建立知识库

step1 下载nomic-embed-text

ollama官网->models->nomic-embed-text在这里插入图片描述
cmd进终端输入(依然默认进了系统盘)

ollama pull nomic-embed-text

下载完成,进Page Assist的设置->RAG设置->文本嵌入模型:nomic-embed-text

在这里插入图片描述
我下了几次,前几次都下完没显示success,只有跳success后,

step2 加载进Page Assist

刷新Page Assist的设置页面,文本嵌入模型 才会有显示
在这里插入图片描述

step3 添加知识

管理知识->添加知识
在这里插入图片描述
我添加了一篇论文,进行测试,添加后,稍等一下,状态就会变成已完成。
在这里插入图片描述

step4 对话框添加知识库

回到首页,添加知识库,
在这里插入图片描述

法二、在AnythingLLM建立知识库

在本地已经部署deepseek的基础上进行。
还需要先去下载一个下载nomic-embed-text。
参考视频:【AI】如何用RAG投喂数据给你的deepseek?
参考:Ollama结合Anything LLM搭建本地AI大模型

准备工作

1.下载nomic-embed-text

ollama官网->models->nomic-embed-text在这里插入图片描述
cmd进终端输入(依然默认进了系统盘)

ollama pull nomic-embed-text

下载完成,进Page Assist的设置->RAG设置->文本嵌入模型:nomic-embed-text

在这里插入图片描述
我下了几次,前几次都下完没显示success,只有跳success后才是真的成功。

2.下载AnythingLLM

下载地址:AnythingLLM
安装速度 比想象中的慢 ~ 很 ~ 多 ~
在这里插入图片描述
安装后,经过一大段导航(不停的点下一页),进入页面。
在这里插入图片描述

3.创建工作区,进行设置

在这里插入图片描述

3.1 聊天设置设置

聊天设置选择ollama,deepseek。
然后要拉到最下面点“Update workspace”
在这里插入图片描述

3.2 向量数据库

向量数据库 :喂给ds的文档,他会变成向量,向量的大小
暂时不设置

3.3 代理配置

选择ollama,自己之前部署的模型,然后点== “Update workspace”==
在这里插入图片描述

4.进入软件设置

设置完模型,还需要一个能够把”文本转变成ds读取的向量“的模型。所以需要回到大的设置
在这里插入图片描述
顺手修改下ds思考的语言。
在这里插入图片描述

4.1 向量数据库

用默认的LanceDB就行在这里插入图片描述

4.2.嵌入首选项

选择ollama, nomic-embed-text。点击保存
在这里插入图片描述

上传文档

在这里插入图片描述
上传60多兆的pdf教材,报错了(我怀疑是 要修改下读取的参数值,我先试试)。
上传几兆的文献成功了。
在这里插入图片描述
点:save and embed
在这里插入图片描述

测试

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/68877.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

记8(高级API实现手写数字识别

目录 1、Keras:2、Sequential模型:2.1、建立Sequential模型:modeltf.keras.Sequential()2.2、添加层:model.add(tf.keras.layers.层)2.3、查看摘要:model.summary()2.4、配置训练方法:model.compile(loss,o…

grpc 和 http 的区别---二进制vsJSON编码

gRPC 和 HTTP 是两种广泛使用的通信协议,各自适用于不同的场景。以下是它们的详细对比与优势分析: 一、核心特性对比 特性gRPCHTTP协议基础基于 HTTP/2基于 HTTP/1.1 或 HTTP/2数据格式默认使用 Protobuf(二进制)通常使用 JSON/…

文字投影效果

大家好,我是喝西瓜汁的兔叽,今天给大家分享一个常见的文字投影效果。 效果展示 我们来实现一个这样的文字效果。 思路分析 这样的效果如何实现的呢? 实际上是两组相同的文字,叠合在一块,只不过对应的css不同罢了。 首先&…

图像处理之图像灰度化

目录 1 图像灰度化简介 2 图像灰度化处理方法 2.1 均值灰度化 2.2 经典灰度化 2.3 Photoshop灰度化 2.4 C语言代码实现 3 演示Demo 3.1 开发环境 3.2 功能介绍 3.3 下载地址 参考 1 图像灰度化简介 对于24位的RGB图像而言,每个像素用3字节表示&#xff0…

【课题推荐】基于t分布的非高斯滤波框架在水下自主导航中的应用研究

水下自主导航系统在海洋探测、环境监测及水下作业等领域具有广泛的应用。然而,复杂的水下环境常常导致传感器输出出现野值噪声,这些噪声会严重影响导航信息融合算法的精度,甚至导致系统发散。传统的卡尔曼滤波算法基于高斯噪声假设&#xff0…

知识库管理系统为企业赋能与数字化转型的关键解决方案分析

内容概要 在当今快速发展的商业环境中,知识库管理系统成为企业进行数字化转型的重要支撑工具。这类系统不仅可以帮助企业高效整合和管理其知识资产,还能提升信息共享与沟通的效率。通过科学的知识管理策略,企业可以在动态市场中实现精益管理…

HTML(快速入门)

欢迎大家来到我的博客~欢迎大家对我的博客提出指导,有错误的地方会改进的哦~点击这里了解更多内容 目录 一、前言二、HTML基础2.1 什么是HTML?2.2 认识HTML标签2.2.1 HTML标签当中的基本结构2.2.2 标签层次结构 2.3 HTML常见标签2.3.1 标题标签2.3.2 段落标签2.3.3…

vue入门到实战 二

目录 2.1 计算属性computed 2.1.1什么是计算属性 2.1.2 只有getter方法的计算属性 2.1.3 定义有getter和setter方法的计算属性 2.1.4 计算属性和methods的对比 2.2 监听器属性watch 2.2.1 watch属性的用法 2.2.2 computed属性和watch属性的对比 2.1 计算属性computed…

Python从0到100(八十六):神经网络-ShuffleNet通道混合轻量级网络的深入介绍

前言: 零基础学Python:Python从0到100最新最全教程。 想做这件事情很久了,这次我更新了自己所写过的所有博客,汇集成了Python从0到100,共一百节课,帮助大家一个月时间里从零基础到学习Python基础语法、Pyth…

Baklib赋能企业实现高效数字化内容管理提升竞争力

内容概要 在数字经济的浪潮下,企业面临着前所未有的机遇与挑战。随着信息技术的迅猛发展,各行业都在加速推进数字化转型,以保持竞争力。在这个过程中,数字化内容管理成为不可或缺的一环。高效的内容管理不仅能够优化内部流程&…

六十分之三十七——一转眼、时光飞逝

一、目标 明确可落地,对于自身执行完成需要一定的努力才可以完成的 1.第三版分组、激励、立体化权限、智能设备、AIPPT做课 2.8本书 3.得到:头条、吴军来信2、卓克科技参考3 4.总结思考 二、计划 科学规律的,要结合番茄工作法、快速阅读、…

实验十 Servlet(一)

实验十 Servlet(一) 【实验目的】 1.了解Servlet运行原理 2.掌握Servlet实现方式 【实验内容】 1、参考课堂例子,客户端通过login.jsp发出登录请求,请求提交到loginServlet处理。如果用户名和密码相同则视为登录成功&#xff0c…

基于springboot+vue的哈利波特书影音互动科普网站

开发语言:Java框架:springbootJDK版本:JDK1.8服务器:tomcat7数据库:mysql 5.7(一定要5.7版本)数据库工具:Navicat11开发软件:eclipse/myeclipse/ideaMaven包:…

【python】四帧差法实现运动目标检测

四帧差法是一种运动目标检测技术,它通过比较连续四帧图像之间的差异来检测运动物体。这种方法可以在一定的程度上提高检测的准确性。 目录 1 方案 2 实践 ① 代码 ② 效果图 1 方案 具体的步骤如下: ① 读取视频流:使用cv2.VideoCapture…

Chapter2 Amplifiers, Source followers Cascodes

Chapter2 Amplifiers, Source followers & Cascodes MOS单管根据输入输出, 可分为CS放大器, source follower和cascode 三种结构. Single-transistor amplifiers 这一章学习模拟电路基本单元-单管放大器 单管运放由Common-Source加上DC电流源组成. Avgm*Rds, gm和rds和…

Linux系统上安装与配置 MySQL( CentOS 7 )

目录 1. 下载并安装 MySQL 官方 Yum Repository 2. 启动 MySQL 并查看运行状态 3. 找到 root 用户的初始密码 4. 修改 root 用户密码 5. 设置允许远程登录 6. 在云服务器配置 MySQL 端口 7. 关闭防火墙 8. 解决密码错误的问题 前言 在 Linux 服务器上安装并配置 MySQL …

14-9-2C++STL的set容器

&#xff08;一&#xff09;函数对象的基本概念 set容器的元素排序 1.set<int,less<int> >setlntA;//该容器是按升序方式排列元素&#xff0c;set<int>相当于set<int,less<int>> 2.set<int,greater<int> >setlntB;//该容器是按降序…

音视频入门基础:RTP专题(8)——使用Wireshark分析RTP

一、引言 通过Wireshark可以抓取RTP数据包&#xff0c;该软件可以从Wireshark Go Deep 下载。 二、通过Wireshark抓取RTP数据包 首先通过FFmpeg将一个媒体文件转推RTP&#xff0c;生成RTP流&#xff1a; ffmpeg -re -stream_loop -1 -i input.mp4 -vcodec copy -an -f rtp …

解决whisper 本地运行时GPU 利用率不高的问题

我在windows 环境下本地运行whisper 模型&#xff0c;使用的是nivdia RTX4070 显卡&#xff0c;结果发现GPU 的利用率只有2% 。使用 import torch print(torch.cuda.is_available()) 返回TRUE。表示我的cuda 是可用的。 最后在github 的下列网页上找到了问题 极低的 GPU 利…

大模型综合性能考题汇总

- K1.5长思考版本 一、创意写作能力 题目1&#xff1a;老爸笑话 要求&#xff1a;写五个原创的老爸笑话。 考察点&#xff1a;考察模型的幽默感和创意能力&#xff0c;以及对“原创”要求的理解和执行能力。 题目2&#xff1a;创意故事 要求&#xff1a;写一篇关于亚伯拉罕…