与向量相似性搜索不同,向量查询通过基于布尔表达式的标量过滤来检索向量。Milvus支持许多标量字段中的数据类型和各种布尔表达式。布尔表达式过滤标量字段或主键字段,并检索与过滤器匹配的所有结果。
一、单次查询
1.加载集合
2.执行查询
# 使用集合对象的 query 方法来执行查询操作
res = collection.query(expr="book_id in [2,4,6,8]", # 查询表达式,筛选满足条件的文档offset=0, # 结果的偏移量,从结果中的第一个文档开始返回limit=10, # 返回结果的最大数量output_fields=["book_id", "book_intro"] # 指定要从查询结果中检索的字段
)
3.检查输出
sorted_res = sorted(res, key=lambda k: k['book_id'])
sorted_res
4.统计实体
在执行查询时,将输出字段设置为count(*),就会返回检索到的实体数量。此时禁用limit
res = collection.query(# filter entities whose ID is in the specified listexpr="book_id in [2,4,6,8]", output_fields = ["count(*)"],
)print(res)
print(res[0])
二、查询时使用迭代器
1.使用迭代器查询
expr = "600 <= num_pages <= 700"output_fields=[bookID, authors]limit = 5query_iterator = collection.query_iterator(expr, output_fields, limit)while True:# turn to the next pageres = query_iterator.next()if len(res) == 0:print("query iteration finished, close")# close the iteratorquery_iterator.close()breakfor i in range(len(res)):print(res[i])
2.使用迭代器搜索
vectors_to_search = rng.random((SEARCH_NQ, DIM))search_params = {"metric_type": "L2","params": {"nprobe": 10, "radius": 1.0},
}search_iterator = collection.search_iterator(vectors_to_search,search_params,limit=5,output_fields=[bookID, authors]
)while True:# turn to the next pageres = search_iterator.next()if len(res[0]) == 0:print("search iteration finished, close")# close the iteratorsearch_iterator.close()breakfor i in range(len(res[0])):print(res[0][i])