基于ChromaDB与BGEToward-VectorModel的本地私有化向量检索之路
安装基础环境
包括Python安装、pip安装及镜像设置等网上提供很多资料,这里就不介绍了。
- 安装chromaDB环境安装
pip install chromadb
- 安装pdf解析库
pip install pdfminer.six
- 安装模型库
pip install sentence_transformers
- 下载bge-large-zh-v1.5向量模型
如果能访问huggingface执行程序时自动下载,如果不能访问huggingface,请点击以下网盘链接进行下载:
链接:百度网盘 请输入提取码 提取码: fpej
手动下载模型需解压到项目工程目录,即与MyVectorDb.py在同一目录。
实践
在最后的环节,我们即将把理论化为实践。我们将用Python编写出一套基于chromadb向量数据库和bge-large-zh-v1.5向量模型实现本地向量检索的代码。
- chromadb向量数据部分代码示例
引用
import chromadb
from chromadb.config import