今年有很多第一次,第一次作为“游客”参加DTCC(中国数据库大会),第一次作为讲师参与ACDU·中国行(成都站),第一次参加OB年度发布会(包含DBA老友会),而这次是第一次参加SACC(中国系统架构师大会)·上海站,而且这次也作为演讲嘉宾在“向量数据库技术探索”专题研讨会中进行了题目为《Oracle AI向量搜索》的主题演讲。
1 向量数据库
作为“向量数据库技术探索”专场的演讲嘉宾,这一堂是我参与最深的两个专场之一。随着ChatGPT的大火,LLM语言大模型的飞速发展,在LLM中出现了幻觉和过时信息的相关问题。通过RAG(检索式增强生成方法),可以让LLM不用重新训练就能够获取最新的信息,基于RAG产生更可靠更专业的输出。实施 RAG 需要向量数据库等技术,这些技术可以快速嵌入(Embedding )新数据,快速搜索数据并输入给LLM。
在这一场我对Oracle在23c正式版中即将发布的Vector数据库中是如何定义向量数据库的存储与使用方式,比如将向量作为一个作为一个新的可配置维度值类型或自适应数据类型引入Oracle数据库中用于存储向量数据,通过一些列新的SQL Embedding函数生成向量数据,一系列新的SQL语法与函数轻松实现表达相似性搜索,并且向量数据可以像传统关系型数据库一样实现DML事务处理,也可以和专用向量数据库一样使用HNSW、IVF等算法对向量进行索引操作。同时作为融合数据库的先驱,向量数据库可以与GIS、文本、JSON、图、关系型数据通过SQL进行融合使用,包含窗口分析函数与存储过程中使用,并且支持JOIN操作。由于目前Oracle 23c还未正式发布,而且相关资料主要源自于Oracle内部,并不能作为最终的产品呈现,所以相关细节我这里就不做分享了。
专场中也有针对专用向量数据库的分享,也做了专用数据库与向量数据库之争的小专题讨论(让我想起了其他的“斗争”),主要在于一下几个点:
- 专用向量数据库确实能在向量这个赛道做到很好的性能与稳定性,而类似于ES插件这种向量支持也能做到快速功能实现。但是由于数据更新操作的缺失,在很多情况下需要,需要预留操作空间给更新操作,且很多产品会出现无用数据(多为过期历史数据)保留的现象,会出现磁盘容量、内存容量方面等问题。(一次全量ChatGPT知识库更新操作的成本是很高的)
- 虽然PG的Vector插件也很火,但是现场多位业内专家也指出了PG在向量方面性能(<60%)与稳定性不佳的问题,对目前情况下通用数据库融合向量提出了质疑。而对于Oracle的向量数据库,虽然从12.1的Inmemory和第一代Exadata开始Oracle就开始使用向量能力来加速通用数据库能力(可以查看数据库管理-第106期 以前版本Oracle数据库中的AI与向量应用(20230921)),向量数据库性能应该会很不错,但是由于没有正式发布与使用,确实没法去判断。
但是大多数向量数据库的使用方也提出了,如果通用数据库能够实现专用数据库80-90%的性能且稳定性没有问题的话,会毫不犹豫转向通用数据库,因为可以不用像专用数据库(主要是不能存放其他类型数据)需要结果的时候在向量数据库查询完成后还需要去其他数据库做匹配的几步走操作;同时完整的事务支持也能很好的对向量数据进行删改,可以极大节省磁盘与内存空间。
薛首席有句总结很好“平时随意拍照肯定用手机,但是婚纱照可能就会找专业照相”,总结下来还是与使用场景和程度有关,因此未来向量数据库何去何从,还得看各家发展情况。
2 成本到底该咋算
参加比较深入的第二场则是主要是给薛首席捧场的“FinOps实践:云成本管理与优化”专题研讨会,同时也被会务组“强制”加入了本场嘉宾行列。(我和薛老师俩搞数据库的,来云相关专场“砸场子”,属实是…干得漂亮)
众所周知,我主要给移动做服务,没有上云机会,而薛首席作为国企…呸!央企,也是没有上云机会的,反而我俩可以更加的…不中立吧。其实FinOps我也是知道点皮毛,听会中来自大佬分享有了进一步的了解,但我有一些疑问吧:
- 不是所有地方都能上云,而FinOps主要还是针对公有云上的成本估算与降本增效(当然B站老师也提到了也想用于自建私有云)
- FinOps目前还主要用于云上的基础设施方面,但是对于研发层面(我认为是包含架构选型、研发质量这些)向上的几乎没有,而且对基础设施本身人力投入这块也是缺失的,我认为需要补齐。
还是最后还是用薛首席的一句话来结束这一节“砍掉不需要的需求比其他方式效果更好吧”。
(注:图文内容无直接关系)
3 扩展与展望
直接上大佬合影图,这次又认识了很多数据库or非数据库方面的大佬,收货良多啊:
今年完成了各种参会的第一次,明年应该还会参加很多,一方面是拓宽自己的眼界,见识更多,结识更多;另一方面也是给公司做做宣传,也希望能从这些会中汲取一些东西能给公司发展提供一些助力。
预告一下,明年DTCC已经报名作为演讲嘉宾,预约了一个专场,就希望到时候薛首席不要仅仅当个主持人。