向量数据库Milvas

Milvus是在2019年创建的,其唯一目标是存储、索引和管理由深度神经网络和其他机器学习(ML)模型生成的大规模嵌入向量。

Milvus的概述 – Milvus向量库中文文档 (milvus-io.com)

Milvus 2.0 概述 - 《Milvus 帮助手册-教程 - V2 版本》 - 极客文档 (geekdaxue.co)

核心概念详见这里,其中常见的如下:

实体(Entity),代表现实世界对象的一组字段。在 Milvus 中,每个实体都由唯一的主键表示。同一集合中可以存在重复的主键。

集合(collection),用于存储和管理实体。相当于关系型数据库管理系统(RDBMS)中的表。

字段(field),是组成实体的单元。字段可以是结构化数据(例如数字、字符串)或向量。

Schema(模式),用于定义数据类型和数据属性的元信息。每个集合都有自己的集合 schema,定义集合的字段(field)、启用自动 ID(主键)分配,集合描述、字段名称、数据类型和其他属性的字段模式。简言之就是数据库的组织和结构。

嵌入向量(embedding vector)是对非结构化数据(如电子邮件、IoT 传感器数据、Instagram 照片、蛋白质结构等)的特征抽象。从数学上讲,嵌入向量是一组浮点数或二进制数的数组。

向量索引(vector index)是从原始数据派生出的重新组织的数据结构,可以大大加速向量相似度搜索的过程,如使用欧几里得距离(L2)作为相似度指标构建了一个1,024个簇的IVF_FLAT索引。如果没有在向量上构建索引,Milvus将默认执行暴力搜索。

向量相似度搜索(Vector similarity search)是比较一个向量与数据库中的向量,以找到与目标搜索向量最相似的向量的过程。用于计算向量之间的相似度(similarity)的算法通常采用近似最近邻(ANN)搜索。

检查集合信息
from pymilvus import Collection
collection = Collection("book")  # Get an existing collection.collection.schema                # Return the schema.CollectionSchema of the collection.
collection.description           # Return the description of the collection.
collection.name                  # Return the name of the collection.
collection.is_empty              # Return the boolean value that indicates if the collection is empty.
collection.num_entities          # Return the number of entities in the collection.
collection.primary_field         # Return the schema.FieldSchema of the primary key field.
collection.partitions            # Return the list[Partition] object.
collection.indexes               # Return the list[Index] object.
collection.properties		# Return the expiration time of data in the collection.
使用方法
 以图搜图 - zwbsoft - 博客园 (cnblogs.com)

为AI而生的数据库:Milvus详解及实战_milvus怎么实现混合查询(向量和标量查询)-CSDN博客

可视化工具Attu

Milvus 图形化管理工具 Attu 来袭! - 知乎 (zhihu.com)

注意事项:
  • 搜索参数的设置详见这里,其中主要的参数如下
data用于搜索的向量
anns_field要搜索的字段名称
params用于索引构建的指标类型特定的搜索参数。详情请见向量索引(Vector Index)
offset返回结果中要跳过的结果数。设置过大导致距离小的结果无法返回。
limit要返回的最相似结果的数量

参考文献:

  1. Milvus documentation

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/660154.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C++】 C++入门—内联函数

C入门 1 内联函数1.1 定义1.2 查看方式1.3 注意 Thanks♪(・ω・)ノ谢谢阅读下一篇文章见!!! 1 内联函数 1.1 定义 程序在执行一个函数前需要做准备工作:要将实参、局部变量、返回地址以及若干寄存…

小米商城服务治理之客户端熔断器(Google SRE客户端熔断器)

目录 前言 一、什么是Google SRE熔断器 二、Google SRE 熔断器的工作流程: 三、客户端熔断器 (google SRE 熔断器) golang GRPC 实现 四、客户端熔断器 (google SRE 熔断器) golang GRPC单元测试 大家可以关注个人博客:xingxing – Web Developer …

【C++干货基地】C++引用与指针的区别:深入理解两者特性及选择正确应用场景

🎬 鸽芷咕:个人主页 🔥 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 引入 哈喽各位铁汁们好啊,我是博主鸽芷咕《C干货基地》是由我的襄阳家乡零食基地有感而发,不知道各位的…

Log4j2-11-log4j2 Layout 布局入门介绍

Layout 布局 Appender使用Layout将LogEvent格式化为一种表单,以满足将要消费日志事件的任何需求。 在Log4j中。x和Logback布局被期望将事件转换为字符串。 在Log4j 2布局返回一个字节数组。这使得Layout的结果可以在更多类型的appender中使用。然而,这…

[机器学习]简单线性回归——最小二乘法

一.线性回归及最小二乘法概念 2.代码实现 # 0.引入依赖 import numpy as np import matplotlib.pyplot as plt# 1.导入数据 points np.genfromtxt(data.csv, delimiter,) # points[0,0]# 提取points中的两列数据,分别作为x,y x points[:, 0] y poi…

Netty源码三:NioEventLoop创建与run方法

1.入口 会调用到父类SingleThreadEventLoop的构造方法 2.SingleThreadEventLoop 继续调用父类SingleThreadEventExecutor的构造方法 3.SingleThreadEventExecutor 到这里完整的总结一下: 将线程执行器保存到每一个SingleThreadEventExcutor里面去创建了MpscQu…

ROS2 学习笔记12:使用 colcon 构建软件包

ROS2 学习笔记12:使用 colcon 构建软件包 Background 背景Prerequisites 前提1 Install colcon2 Install ROS 2 Basics 基础1 Create a workspace2 Add some sources3 Source an underlay4 Build the workspace5 Run tests6 Source the environment7 Try a demo Cre…

安卓滚动视图ScrollView

<?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:android"http://schemas.android.com/apk/res/android"android:layout_width"match_parent"android:layout_height"match_parent"android:orientatio…

docker镜像命令

docker images 列表本机上的镜像 - REPOSITORY&#xff1a;表示镜像的仓库源 - TAG&#xff1a;镜像的标签 - IMAGE ID&#xff1a;镜像 - ID CREATED&#xff1a;镜像创建时间 - SIZE&#xff1a;镜像大小 同一仓库源可以有多个 TAG&#xff0c;代表这个仓库源的不同个版本&am…

大洋钻探系列之七中国大洋钻探船梦想号

中国大洋钻探梦想号2021年11月30日开工建造&#xff0c;2023年12月27日在珠江口海域完成首航&#xff0c;预计2024年正式交付使用&#xff0c;从而实现了2011年中国IODP专家咨询委员会提出的我国大洋钻探发展“三步走”战略的第三步建造中国的大洋钻探船。 恰逢IODP新旧计划交替…

vue3 + vite:打包部署后,动态组件渲染404问题解决

问题描述: 当需要渲染动态组件,动态的组件路径配置在数据库中时,如下图,本地运行能正常访问,用vite打包部署后,生产上改路径为404. 起初认为是,vite打包后的文件都是.js, 当页面加载后从数据库拿来的路径是.vue, 并且是src/xxx/xxx.vue 这种绝对路径形式的,所以就找不…

unity打开外部exe,并将其置顶

直接上代码&#xff1a; 调用代码 ProcessStartInfo startinfo1 new ProcessStartInfo(); startinfo1.FileName "E:\\fastdds\\run\\" PlanType ".exe"; startinfo1.Arguments winInfo; pss Process.Start(startinfo1);//做延时的原因是window打开…

【每日一题】 2024年1月汇编

&#x1f525;博客主页&#xff1a; A_SHOWY&#x1f3a5;系列专栏&#xff1a;力扣刷题总结录 数据结构 云计算 数字图像处理 力扣每日一题_ 【1.4】2397.被列覆盖的最多行数 2397. 被列覆盖的最多行数https://leetcode.cn/problems/maximum-rows-covered-by-columns/ 这…

哪个牌子的头戴式耳机好?推荐性价比高的头戴式耳机品牌

随着科技的不断发展&#xff0c;耳机市场也呈现出百花齐放的态势&#xff0c;从高端的奢侈品牌到亲民的平价品牌&#xff0c;各种款式、功能的耳机层出不穷&#xff0c;而头戴式耳机作为其中的一员&#xff0c;凭借其优秀的音质和降噪功能&#xff0c;受到了广大用户的喜爱&…

GO EASY 框架 之 Server 06

目录 1、Overview 2、监听服务接口 3、easy/servers package 3.1、基础类Server 3.2、WWServer 服务 3.3、TcpServer 3.4、KCPServer 4、hookAgent链接钩子 5、创建一个WebScoket监听服务 1、Overview 本节主要介绍&#xff0c;easy的监听服务。例如websocket 监听&a…

Apache Commons

介绍 官网&#xff1a;https://commons.apache.org/ Apache Commons 是一个开源的 Java 项目&#xff0c;旨在提供一组通用的、可复用的 Java 组件。这些组件涵盖了多个领域&#xff0c;包括字符串操作、输入输出、集合操作、数学计算、命令行解析等。 版本 commons-lang 和 …

【面试】MySQL的几种查询方式

书读百遍&#xff0c;其意自现 文章目录 基本查询条件查询排序查询聚合查询分组查询连接查询子查询联合查询 基本查询 最简单的查询形式&#xff0c;用于选择表中的所有行或指定列的数据。例如&#xff1a; SELECT * FROM TableName; -- 选择表中所有列的所有行 SELECT Colu…

蓝桥杯算法赛第4场小白入门赛强者挑战赛

蓝桥杯算法赛第4场小白入门赛&强者挑战赛 小白1小白2小白3强者1小白4强者2小白5强者3小白6强者4强者5强者6 链接&#xff1a; 第 4 场 小白入门赛 第 4 场 强者挑战赛 小白1 直接用C内置函数即可。 #include <bits/stdc.h> using namespace std;#include <bits…

ArrayList在添加元素时报错java.lang.ArrayIndexOutOfBoundException

一、添加单个元素数组越界分析 add源码如下 public boolean add(E e) {ensureCapacityInternal(size 1); // Increments modCount!!elementData[size] e;return true; } size字段的定义 The size of the ArrayList (the number of elements it contains). ArrayList的大…

雷达DoA估计的跨行业应用--麦克风阵列声源定位(Matlab仿真)

一、概述 麦克风阵列&#xff1a; 麦克风阵列是由一定数目的声学传感器&#xff08;麦克风&#xff09;按照一定规则排列的多麦克风系统&#xff0c;而基于麦克风阵列的声源定位是指用麦克风拾取声音信号&#xff0c;通过对麦克风阵列的各路输出信号进行分析和处理&#xff0c;…