2024年, Milvus 社区的那些事

66a4881aae7b9fef103adaee44f95391.png

4b5513b823700bc6355fab63ad4bd46c.png

随着跨年钟声响起,2024 年告一段落。这一年,Milvus GitHub Stars 正式突破 3 万大关,Docker 下载量突破6700w 次,达到一个新的里程碑,在开源向量数据库领域继续引领前行。在这遥遥领先的数据背后,不妨让我们一起回头看看,今年 Milvus 的社区里都发生了哪些事情,对于每位关心 Milvus 的朋友会有哪些帮助。

01.

2 个大版本,36 个小版本

所有社区的讨论都是围绕 Milvus 展开的,体现社区活跃度的一个关键指标就是版本迭代速度。2024 年,Milvus 社区一共发布了 36 个版本,平均 2 周不到就会发布一个版本,其中包含两个大的版本系列:2.4 和 2.5 。2.4 系列版本中,Milvus 支持了多向量列能力,以及稀疏向量类型,并且引入了丰富的 GPU 索引,使向量搜索的广度,深度以及性能进一步提升。2.5 系列版本中,Milvus 创新性地提出了基于稀疏向量的 BM25 检索能力,通过内置的 Sparse-BM25 对 Lexical 检索提供了原生支持,响应了社区里一直呼声很高的关键词检索需求。关于这两个大版本的详细功能解读,感兴趣的朋友可以参考以下两篇文章:《引领向量数据库技术新变革,Milvus 2.4 正式上线!》《Milvus 2.5:全文检索上线,标量过滤提速,易用性再突破!》。当然,如果您想了解任意一个版本的特性,提升以及 bugfix,Milvus 官网的 Release Note (https://milvus.io/docs/release_notes.md)页面可以找到答案。

版本迭代速度快,可以证明 Milvus 是一个十分活跃的开源社区,不过对于每一位用户来讲,经常会碰到 2 个问题:

版本这么多,我应该选哪个?

我的版本比较老,怎么升级到新版本?

关于版本选择,我的建议一般是这样,只考虑最新的两个大版本,根据功能需求确定大版本,大版本中选择最新的小版本。Milvus 的发版有这样的规律,一些大点的功能,比如,支持 GPU,多向量,全文检索,都会在一个大版本中首次引入,后续的版本都会包含。当一个大版本发布后,会持续发布一些小版本,主要增加一些小的功能和优化以及进行 bugfix。所以,版本号越大的小版本,也就是越新的小版本,它的稳定性一般都会更好,2.4.20 的稳定性就比2.4.1 的稳定性更好。

至于版本升级,Milvus 官网其实已经提供了很完善的升级指导了,https://milvus.io/docs/upgrade_milvus_cluster-operator.md,一般严格按照官网的文档操作不太会出什么问题。如果还是不放心,我们可以在升级之前,对当前集群的数据使用 Milvus Backup(https://github.com/zilliztech/milvus-backup) 做一个备份,即使发生意外情况,依旧可以恢复老集群。

02.

12 场直播,7 场 Meetup

Milvus 社区的常规活动,主要分为线上直播和线下 Meetup 两类。线上直播我们又分为 UserTech 和 DeepDive 两种类型,UserTech 主要聚焦在用户落地案例以及 Milvus 最佳实践分享,一般会邀请社区的资深用户作为嘉宾,DeepDive 则会重点分享 Milvus 的功能架构,创新技术等话题,偏技术解析更多。直播活动一般每个月都会有一次,UserTech 和 DeepDive 轮流登场,满足不同口味的朋友。并且在直播前一周都会在 Milvus 的用户交流群里进行通知,如果您还不在群里,记得扫描文末的二维码或者直接添加 Zilliz 小助手的微信(zilliz-tech)邀请进群。2024 年,Milvus 社区一共做了 12 场直播,既包括,携程、网易、OPPO 这些 Milvus 资深用户带来的 UserTech,也有Milvus 研发团队带来的,Milvus Lite 详解、ScaNN 算法拆解、向量过滤搜索及优化等 DeepDive。如果发现错过了感兴趣的直播,可以去 Zilliz 的公众号和 B 站账号里找一下回放。

除了丰富的线上直播之外,Milvus 社区还有和开发者面对面交流的 Meetup。在今年五月份之前,Milvus 的 Meetup 叫做 Milvus 老友汇,主要会邀请 Milvus 团队的成员和 Milvus 的用户来进行线下分享,话题都是围绕 Milvus 本身。在 Milvus 老友汇举办过程中,我们逐渐收到了一些来自参会朋友的反馈,希望增加一些非结构化数据处理,GenAI 技术的内容,恰好此时,Milvus 海外社区发起的 Unstructured Data Meetup 举行的如火如荼,受到广大开发者的支持和认可。于是,我们对 Milvus 老友汇进行了一次改革,正式变身为 Unstructured Data Meetup,核心差异就是在之前 Milvus 老友汇的基础上,增加了非结构化数据处理和 GenAI 技术的内容,使得 Meetup 的内容更加丰富,满足不同领域开发者的需求。2024 年,Milvus 社区一共举行了 1 场 Milvus 老友汇和 6 场 Unstructured Data Meetup。一些开发者比较多的城市,比如北京,上海,杭州,深圳,一年一次 Meetup 很多朋友表示根本不够。2025 年,随着 Milvus 社区力量的壮大,我们会考虑在这些重点城市提高频次。

新的一年,紧跟时代潮流,我们准备尝试短视频栏目,把社区里大家经常遇到的问题,典型的实践案例,关心的热点话题通过短视频的形式来进行解答和讲解,帮助大家更快地上手避坑,更好更稳地把向量数据库用起来,敬请期待。

03.

2 个重磅项目,北极星计划+黄金写手

一个人可以走得很快,一群人才能走得更远。

Milvus 社区能够发展得如此迅速,离不开每一位社区伙伴的支持。作为一个全球化的开源项目,每天会有上万开发者在使用 Milvus,使用过程中不可避免会遇到一些问题,如果仅靠 Milvus 团队自身的同学,是无论如何都无法支持完这些开发者的。也是在这个时候,我们看到 Github、微信用户交流群以及 Discord 里面,站出来了一些朋友主动地帮助这些遇到问题的开发者,或耐心地分析排查问题,或细致地编写博客分享最佳实践,各自在做一些擅长的事情来帮助别人。他们有的是 Milvus 老用户,有的是狂热的开源爱好者,有的是还在校园的学生,这就是我们希望同行的一群人。

为了将这些志同道合的朋友聚在一起,Milvus 社区发起了北极星计划(https://zilliz.com.cn/northstar)和黄金写手计划(https://zilliz.com.cn/golden-writer),旨在组建团队与我们共同建设 Milvus 社区,一起探讨社区前进的方向。如果您也非常喜爱 Milvus 这个项目,并且希望通过自己的 Coding、沟通、写作、布道等能力来建设运营 Milvus 社区,欢迎加入我们的北极星计划。如果您的文笔特别好,非常擅长技术文章写作,黄金写手计划欢迎您。

北极星计划和黄金写手计划自从 2024 年 3 月发布以来,目前已经集结了 20 多位小伙伴,不乏一些技术大牛,资深布道师,狂热开源分子。在 Milvus 版本发布的背后,每一场活动的背后以及爆款文章的背后,都有这些小伙伴的身影,再一次感谢这些朋友,选择和我们共同前行!

未来已来,AI 的能力正在以天为单位进行突破,Milvus 3.0,一个更加 AI-Friendly 的崭新版本也即将在 2025 年和大家见面。新的一年,Milvus 社区的故事还在继续,还会更精彩,让我们共同见证!

最后,给大家拜个早年,祝每一位 Milvus 社区的朋友新年快乐 🎉

作者介绍

4cd9e97b98adf22ae61353f70fbae1a3.jpeg

李成龙

Zilliz 资深开源布道师

推荐阅读

601feacb545f445753c694c0eeee9958.png

c3d62d3f327e94d32689fdb1ec570521.png

b224d5c71f88817970b9321182e6e73d.png

efcd36e1daf6aa74164cbc58f0a25409.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/66263.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

docker中使用Volume完成数据共享

情景概述 在一个docker中,部署两个MySQL容器,假如它们的数据都存储在自己容器内部的data目录中。这样的存储方式会有以下问题: 1.无法保证两个MySQL容器中的数据同步。 2.容器删除后,数据就会丢失。 基于以上问题,容…

【期末复习】二、进程管理

1.进程的内存结构🍊 程序加载到内存之后就变成了一个进程,进程在内存当中的一个结构有: 文本段(text section):存放程序代码 栈(stack):存放局部变量和函数返回地址 数据段(data section):存放全局变量和静态变量(static) 堆(heap):程序运行时的动态内存分…

Type-C多口适配器:高效充电与连接解决方案

在科技飞速发展的今天,我们的生活已经离不开各种各样的电子设备,如智能手机、平板电脑、智能手表和无线耳机等。这些设备不仅丰富了我们的数字生活,也带来了更多的充电需求。传统的单一充电口已经难以满足现代人对于便捷性和效率的追求&#…

UCAS 24秋网络认证技术 CH10 SSL 复习

TLS字段、参数含义要了解每个消息是什么意思 基本方式只验证服务端,服务端有证书,变形方式加上验证客户端TLS1.3区别 协商过程 背景 Record层使用的各种加密算法参数,均由Handshake协议协商获得。 具体过程 随机数交换 Client/Server相互…

支付宝商家转账到账户余额,支持多商户管理

大家好,我是小悟 转账到支付宝账户是一种通过 API 完成单笔转账的功能,支付宝商家可以向其他支付宝账户进行单笔转账。 商家只需输入另一个正确的支付宝账号,即可将资金从本企业支付宝账户转账至另一个支付宝账户。 该产品适用行业较广&am…

基于Django的旅游信息管理系统(源码+lw+部署文档+讲解),源码可白嫖!

摘要 随着我国经济的高速发展与人们生活水平的日益提高,人们对生活质量的追求也多种多样。尤其在人们生活节奏不断加快的当下,人们更趋向于足不出户解决生活上的问题,线上管理系统展现了其蓬勃生命力和广阔的前景。与此同时,随着…

常见的框架漏洞复现

1.Thinkphp Thinkphp5x远程命令执行及getshell 搭建靶场 cd vulhub/thinkphp/5-rce docker-compose up -d 首页 漏洞根本源于 thinkphp/library/think/Request.php 中method方法可以进行变量覆盖,通过覆盖类的核心属性filter导致rce,其攻击点较为多&…

UE5中实现右键开镜效果

右键之后添加时间轴,然后设置视野即可。Set Field Of View 时间轴设置,第一个点设置0,90度,因为默认的就是90度 第二个点看武器的类型或者倍境来设置,时间就是开镜时间,值越小开镜速度越快,第二个值就是视野…

关于华硕Armoury Crate(奥创中心)安装程序失败、卡进度条问题解决方案

关于华硕Armoury Crate(奥创中心)安装失败解决方案 清理旧版本文件 如果之前安装过Armoury Crate,可能有残留文件导致冲突: 利用官方的卸载工具,卸载旧版本: https://www.asus.com.cn/supportonly/armoury%20crate/…

iOS18 上的 Genmoji

在 WWDC 2025 期间,一种名为Genmoji的新型表情符号问世。 许多用户可能仍然不确定 Genmoji 是什么、它与传统表情符号有何不同、如何使用它以及如何恢复丢失的数据。因此,在本文中,我们将介绍您需要了解的有关 iOS 18 上的 Genmoji 的所有信…

基于等保的安全审计运维系统

摘要 本文研究与设计一种基于等级保护(等保)要求的安全审计运维系统,以适应日益严峻的网络安全形势和不断提高的安全审计需求。随着信息技术的快速发展和应用广泛,信息系统安全面临的威胁也在不断增加,特别是在关键信…

【OAuth2系列】如何使用OAuth 2.0实现安全授权?详解四种授权方式

作者:后端小肥肠 🍇 我写过的文章中的相关代码放到了gitee,地址:xfc-fdw-cloud: 公共解决方案 🍊 有疑问可私信或评论区联系我。 🥑 创作不易未经允许严禁转载。 姊妹篇: 【OAuth2系列】集成微…

传感器与检测技术基础知识

传感器检测系统 检测系统的组成:传感器、信号调理、数握采集、信号处理、信号显示、信号输出、输入设备、稳压电源。 检测系统的基本误差分类:绝对误差、相对误差、引用误差,最大引用误差。 测量系统的误差分类:系统误差、随机误差、粗大误…

决定系数(R²分数)——评估回归模型性能的一个指标

目录 1.定义 2.计算举例 3. 结果分析 1.定义 R(R平方)分数,也称为决定系数,是用来评估回归模型性能的一个指标。它表示自变量解释因变量变异性的比例。R分数的取值范围通常在0到1之间,其值越接近1,说明…

stm32HAL库使LED闪烁

PC13引脚为开漏接法 生成代码时设置为out put open drain gpio out put level 设置为high 1表示熄灭 我们将pa9引脚连接为推挽接法 生成代码时设置为 out put push pull Gpio out put level 设置为low 0 表示熄灭 代码使其亮起再延时0.5秒再熄灭再延时0.5秒

矩阵运算提速——玩转opencv::Mat

介绍:用Eigen或opencv::Mat进行矩阵的运算&#xff0c;比用cpp的vector或vector进行矩阵运算要快吗? 使用 Eigen 或 OpenCV 的 cv::Mat 进行矩阵运算通常比使用 std::vector<int> 或 std::vector<double> 更快。这主要有以下几个原因&#xff1a; 优化的底层实现…

yolo小damo合集

效果如下&#xff1a;这个是图片检测 效果如下&#xff1a;这个是视频检测 效果如下&#xff1a;这个是摄像头检测 1 相关库 除了yolov11所用库之外&#xff0c;本文所用到的额外库为pyqt5&#xff0c;输入指令进行安装 pip install pyqt5 导入所需要的库 import sys fro…

【蓝桥杯研究生组】第14届Java试题答案整理

试题链接&#xff1a;链接 A题 满足条件的答案有&#xff1a;35813116 public class TianShu {public static void main(String[] args) {int ans 0;// 2000.1.1 - 2000000.1.1// 年份是月份的倍数&#xff0c;也是日的倍数for (int year2000; year<2000000; year) {for …

基于Java的超级玛丽游戏的设计与实现【源码+文档+部署讲解】

目 录 1、绪论 1.1背景以及现状 1.2 Java语言的特点 1.3 系统运行环境及开发软件&#xff1a; 1.4 可行性的分析 1.4.1 技术可行性 1.4.2 经济可行性 1.4.3 操作可行性 2、 需求分析 2.1 用户需求分析 2.2功能需求分析 2.3界面设计需求分析…

25考研王道数据机构课后习题-----顺序表链表部分

文章目录 1.顺序表题目2.链表相关题目3.我的个人总结 声明&#xff1a;以下内容来自于B站知名up主白话拆解数据结构&#xff0c;望获悉&#xff1b; 1.顺序表题目 下面的这个说的是&#xff1a;下面的哪一个是组成我们的顺序表的有限序列&#xff0c;这个应该是数据元素&#x…