Oracle 23ai 中的重要新特性 VECTOR 数据类型

Oracle 23ai 中的 VECTOR 数据类型是 Oracle 数据库在 AI 领域的一个重要新特性,它允许用户以向量的形式存储数据,并在这些向量的基础上进行高效的搜索和分析。以下是对 Oracle 23ai VECTOR 数据类型的详细解析:

参考官方文档地址
https://docs.oracle.com/en/database/oracle/oracle-database/23/lnpls/plsql-data-types.html#GUID-160C5139-EDBE-40BE-8DB4-1CA4E8A1CA46

一、基本概念

Oracle 23ai 中的 VECTOR 数据类型是一种用于表示一系列数值的数据类型,这些数值可以代表不同的含义,比如在几何学中代表点的坐标,在机器学习中代表特征向量等。通过向量化技术,可以将文档、图像、视频等非结构化数据转换为向量形式,进而利用这些向量进行高效的相似性搜索和分析。

二、主要特性

  • 集成性:VECTOR 数据类型完全集成在 SQL 和 PL/SQL 中,支持多种客户端和编程语言,并在 python-oracledb、node-oracledb、JDBC 和 ODP.NET 驱动程序中具有原生绑定功能。这种全面的支持提供了跨多个开发环境的无缝向量搜索功能。

  • 高效性:Oracle 23ai 提供了高性能的向量索引,如内存中的邻居图向量索引(In-Memory Neighbor Graph Vector Index)和邻居分区矢量索引(Neighbor Partition Vector Index),这些索引技术能够显著加快向量的搜索速度,提高查询效率。

  • 灵活性:用户可以根据需要自定义向量的维度和精度,以适应不同的应用场景和数据类型。同时,Oracle 23ai 还支持在 JSON 类型中嵌入 VECTOR 数据类型,使得结构化数据和非结构化数据的处理更加灵活。

  • 安全性:Oracle 23ai 提供了强大的安全性保障,包括透明数据加密、Key Vault、Audit Vault 等功能,确保向量数据的安全性和隐私性。

三、应用场景

Oracle 23ai 的 VECTOR 数据类型在多个领域都有广泛的应用前景,包括但不限于:

  • 文档搜索:在文档数据库中,用户可以利用 VECTOR 数据类型对文档进行向量化处理,并通过相似性搜索快速找到相关的文档。
  • 图像识别:在图像处理领域,VECTOR 数据类型可以用于表示图像的特征向量,并通过向量搜索实现图像的快速识别和分类。
  • 推荐系统:在电商、社交媒体等平台上,推荐系统可以利用 VECTOR 数据类型对用户和商品进行向量化处理,并通过计算向量之间的相似度来推荐相关的商品或内容。
  • 生物信息学:在生物信息学领域,VECTOR 数据类型可以用于表示基因序列、蛋白质结构等生物数据的特征向量,并通过向量搜索进行基因相似性分析、疾病预测等研究。

四、使用示例

以下是一个简单的使用示例,展示了如何在 Oracle 23ai 中创建包含 VECTOR 数据类型的表并插入数据:

4.1、简单的使用示例

CREATE TABLE t_orders (  order_id INT,  order_vector VECTOR  
);  INSERT INTO t_orders VALUES (1, '[100, 200]'), (2, '[210, 220]'), (3, '[310, 330]');  TESTUSER@FREEPDB1> SELECT * FROM t_orders;ORDER_ID ORDER_VECTOR
---------- ----------------------------------------------------------------------------------------------------1 [1.0E+002,2.0E+002]2 [2.1E+002,2.2E+002]3 [3.1E+002,3.3E+002]

在这个示例中,我们首先创建了一个名为 orders 的表,该表包含两个字段:order_id(订单ID)和 order_vector(订单向量)。然后,我们向表中插入了三条记录,每条记录的 order_vector 字段都包含了一个二维向量。最后,我们通过 SELECT 语句查询了表中的所有记录。

4.2、将VECTOR数据类型与PL/SQL一起使用

此示例的第一部分演示了如何将向量选择到PL/SQL向量变量中,在本例中,在向量列上使用%TYPE。

CREATE TABLE t_VectorTable (embedding VECTOR(3, float32), id NUMBER);
INSERT INTO t_VectorTable VALUES ('[1.11, 2.22, 3.33]', 1);
INSERT INTO t_VectorTable VALUES ('[4.44, 5.55, 6.66]', 2);
INSERT INTO t_VectorTable VALUES ('[7.77, 8.88, 9.99]', 3);SET SERVEROUTPUT ON;DECLAREv_embedding t_VectorTable.embedding%TYPE;
BEGINSELECT embedding INTO v_embedding FROM t_VectorTable WHERE id=3;DBMS_OUTPUT.PUT_LINE('Embedding is ' || FROM_VECTOR(v_embedding));
END;
/

Result List

Embedding is [7.76999998E+000,8.88000011E+000,9.98999977E+000]PL/SQL procedure successfully completed.

4.2、匿名块使用带有批量获取的游标将VectorTable的向量捕获到表%ROWTYPE

下面的匿名块使用带有批量获取的游标将t_VectorTable的向量和id数据捕获到表%ROWTYPE索引表中。
The following anonymous block uses a cursor with bulk fetch to capture the VectorTable’s vector and id data into a table%ROWTYPE index table.

DECLARETYPE vecTabT IS TABLE OF t_VectorTable%ROWTYPE INDEX BY BINARY_INTEGER;v_vecTabT vecTabT;CURSOR cur IS SELECT * FROM t_VectorTable;
BEGINOPEN cur ;FETCH cur  BULK COLLECT INTO v_vecTabT;CLOSE cur ;-- display the contents of the vector index tableFOR i IN 1 .. v_vecTabT.LAST LOOPDBMS_OUTPUT.PUT_LINE('Embedding ID ' || v_vecTabT(i).id || ': ' ||FROM_VECTOR(v_vecTabT(i).embedding));END LOOP;
END;
/

在这里插入图片描述

4.3、将VECTOR数据类型与PL/SQL触发器一起使用

CREATE TABLE t_vecLogTable 
(
embedding VECTOR(3, float32), 
describe VARCHAR2(25), 
seq NUMBER
);CREATE SEQUENCE seq_vecTrgSeq;CREATE OR REPLACE TRIGGER tr_VectorTable 
BEFORE UPDATE ON t_VectorTable
FOR EACH ROW
BEGININSERT INTO t_vecLogTable VALUES (:old.embedding, 'OLD.VECTRG',seq_vecTrgSeq.NEXTVAL);INSERT INTO t_vecLogTable VALUES (:new.embedding, 'NEW.VECTRG',seq_vecTrgSeq.NEXTVAL);
END;
/UPDATE t_VectorTable SET embedding='[2.88, 4.99, 8.66]' WHERE id=2;
COMMIT;SELECT * FROM t_vecLogTable  ORDER BY seq;

Result List:

TESTUSER@FREEPDB1> col DESCRIBE format aa30
TESTUSER@FREEPDB1> col DESCRIBE format a30
TESTUSER@FREEPDB1> SELECT * FROM t_vecLogTable  ORDER BY seq;EMBEDDING                                                    DESCRIBE                              SEQ
------------------------------------------------------------ ------------------------------ ----------
[4.44000006E+000,5.55000019E+000,6.65999985E+000]            OLD.VECTRG                              1
[2.88000011E+000,4.98999977E+000,8.65999985E+000]            NEW.VECTRG                              2

4.4、将向量距离函数与PL/SQL一起使用

此示例演示了PL/SQL对向量距离函数的支持。

DECLAREv1 VECTOR := TO_VECTOR('[1, 2, 3]');v2 VECTOR := TO_VECTOR('[4, 5, 6]');man_dist NUMBER;euc_dist NUMBER;cos_dist NUMBER;inn_dist NUMBER;ham_dist NUMBER;dot_dist NUMBER;
BEGINman_dist := L1_DISTANCE(v1, v2); --Manhattan Distanceeuc_dist := L2_DISTANCE(v1, v2); --Euclidean Distancecos_dist := COSINE_DISTANCE(v1, v2); --Cosine Distanceinn_dist := INNER_PRODUCT(v1, v2); --Inner Product--The Hamming Distance has no standalone function in PL/SQLham_dist := VECTOR_DISTANCE(v1, v2, HAMMING);--The Negative Inner (Dot) Product has no standalone function in PL/SQLdot_dist := VECTOR_DISTANCE(v1, v2, DOT);DBMS_OUTPUT.PUT_LINE('The Manhattan distance is: ' || man_dist);DBMS_OUTPUT.PUT_LINE('The Euclidean distance is: ' || euc_dist);DBMS_OUTPUT.PUT_LINE('The Cosine distance is: ' || cos_dist);DBMS_OUTPUT.PUT_LINE('The Inner Product is: ' || inn_dist);DBMS_OUTPUT.PUT_LINE('The Hamming distance is: ' || ham_dist);DBMS_OUTPUT.PUT_LINE('The Dot Product is: ' || dot_dist);
END;
/

在这里插入图片描述

4.5、将短距运算符与PL/SQL一起使用

请注意,由于PL/SQL不支持向量的隐式转换,因此必须在变量赋值之前或在同一行中构造向量。这与PL/SQL中的其他距离函数的行为相同。
Note that because PL/SQL does not support implicit conversion with vectors, you must construct the vectors before the variable assignment or in the same line. This is the same behavior as the other distance functions in PL/SQL.

DECLAREv1 VECTOR := VECTOR('[1, 2, 3]');v2 VECTOR := VECTOR('[4, 5, 6]');cos_dist BINARY_DOUBLE;euc_dist BINARY_DOUBLE;dot_dist BINARY_DOUBLE;
BEGINcos_dist := v1 <=> v2;euc_dist := v1 <-> v2;dot_dist := v1 <#> v2;DBMS_OUTPUT.PUT_LINE(cos_dist);DBMS_OUTPUT.PUT_LINE(euc_dist);DBMS_OUTPUT.PUT_LINE(dot_dist);
END;
/

在这里插入图片描述

五、总结

Oracle 23ai 的 VECTOR 数据类型是 Oracle 数据库在 AI 领域的一个重要创新,它为用户提供了强大的向量化数据处理能力,使得用户能够更加方便地进行相似性搜索和分析。随着 AI 技术的不断发展,VECTOR 数据类型的应用前景将越来越广阔。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/44814.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Ubuntu-18.04.6 LTS (Bionic Beaver)】串口无法root登录解决方案

root用户无法再窗口登录 用户界面登录提示 soory that didnot work 解决方案 GDM 配置 /etc/gdm3/custom.conf 中增加或删除注释 [security] AllowRoottrue重启服务 service gdm restart确认 PAM 配置 GDM 使用 PAM 进行认证&#xff0c;可能 PAM 配置中限制了 root 登录…

GitHub网页打开慢的解决办法

有时候看资料絮叨github网页打不开&#xff0c;经百度后&#xff0c;发下下面的方法有效。 1&#xff09;获取github官网ip 我们首先要获取github官网的ip地址&#xff0c;方法就是打开cmd&#xff0c;然后ping 找到github的地址&#xff1a;20.205.243.166 2&#xff09;配…

体验升级!贵州“森林之城”携苏州金龙新V系谱写高端旅运新篇章

自今年出台文旅“四免一多一减”方案以来&#xff0c;贵州省围绕旅游资源&#xff0c;着力打造亮点&#xff0c;不断提升产品供给水平&#xff0c;旅游市场持续火爆。近日&#xff0c;贵州森林之城旅运公司从苏州金龙批量采购50座海格新V系豪华大巴&#xff0c;为贵州高端旅游市…

域名系统DNS的工作原理和服务搭建

文章目录 域名解析和DNSDNS概念 DNS服务工作原理递归查询迭代查询递归和迭代的区别DNS缓存 DNS服务器的安装whoisDNS软件bind DNS主服务器实现1.在主配置文件中定义区域2.定义区域解析库文件各种资源类型解析库记录定义项 3.配置识别区域库文件4.重启named服务启用DNS客户端缓存…

Java--static详解

1.static静态的意义&#xff0c;加在属性面前就为静态属性&#xff1b;加在方法面前就为静态方法 2.如图&#xff0c;定义了一个静态属性age&#xff0c;一个非静态属性score&#xff1b; 输出语句一共四句&#xff0c;其中第三句报错&#xff0c;由于静态和非静态的区别&…

微气象仪的工作原理

型号推荐&#xff1a;云境天合TH-WQX5】风力发电传感器在风力发电系统中起着至关重要的作用&#xff0c;它们能够实时监测和记录各种关键参数&#xff0c;为风力发电机组的控制提供数据支持&#xff0c;从而确保风力发电系统的安全、高效运行。以下是对风力发电传感器的详细解析…

使用Docker制作python项目镜像

各docker桌面版本集合&#xff1a;如果提示新版本系统不支持&#xff0c;可下载旧版本 我也分享在下面。 链接: https://pan.baidu.com/s/1HvaO2wOIE3pNE0bM7Qm3sA?pwdg7ky 提取码: g7ky –来自百度网盘超级会员v2的分享 来源参考&#xff1a;https://zhuanlan.zhihu.com/p/65…

uniapp 九宫格抽奖

<template><view class"container"><view class"navleft" click"navback"><image src"/static/cj/left.png" mode""></image></view><view class"navtitle">抽奖</…

SAP S4 销售组的定义和分配

spro-企业结构-定义-销售与分销-维护销售组 新增一个记录 spro-企业结构-分配-销售与分销-给销售办公室分配销售组

JavaScript-map方法

map可以遍历数组处理数据&#xff0c;并返回新的数组 语法&#xff1a; ​const arr[元素1&#xff0c;元素2&#xff0c;元素3] const newarrarr.map(function(数组的元素,数组的索引)){return 新元素 } const arr[blue,red,green]const newarrarr.map(function(ele,index){co…

应用案例 | 台积电为保证光罩运输质量选择MSR冲击振动记录仪!内含台积电工程师专访

晶圆运输需要注意什么&#xff1f; 晶圆运输是半导体制造过程中极为关键和敏感的一环。在晶圆运输过程中&#xff0c;需要注意以下几点&#xff1a; 1.静电防护 晶圆非常容易受到静电的干扰&#xff0c;因此在运输过程中需要遵守严格的静电防护措施。使用适当的静电防护包装…

Blender 中导出模型fbx

准备模型&#xff1a;确保你的模型已经完成&#xff0c;并且所有的材质、纹理等都已设置好。 应用所有变换&#xff1a; 选择模型&#xff0c;按下 CtrlA&#xff0c;选择 "All Transforms" 以应用所有的变换&#xff08;位置、旋转和缩放&#xff09;。 导出模型&a…

Java面试八股之Redis有哪些数据类型?底层实现分别是什么

Redis有哪些数据类型&#xff1f;底层实现分别是什么 Redis数据类型概述 Redis作为一款键值存储系统&#xff0c;提供了丰富多样的数据类型以满足不同场景的需求。以下是Redis支持的主要数据类型及其基本用途&#xff1a; String&#xff08;字符串&#xff09; 存储单个键…

windows系统上python3安装open3d第三方库

打开命令提示符&#xff0c;输入&#xff0c; pip install open3d -i https://pypi.tuna.tsinghua.edu.cn/simple成功页面&#xff0c;

CSDN回顾与前行:我的创作纪念日——2048天的技术成长与感悟

CSDN回顾与前行&#xff1a;我的创作纪念日——2048天的技术成长与感悟 &#x1f496;The Begin&#x1f496;点点关注&#xff0c;收藏不迷路&#x1f496; 前言 时光荏苒&#xff0c;岁月如梭。转眼间&#xff0c;从我在CSDN上写下第一篇技术博客《2-6 带头结点的链式表操作…

MVC 控制器 中Action 不能同名,参数不一样,路由器寻找不到对应的,要加特性

//1 方法不可能完全相同&#xff0c;参数不同//2 那还需要特性吗&#xff1f;需要的&#xff0c;因为MVC选择方法时&#xff0c;不是按参数选择&#xff1a;http请求发送很多数据&#xff0c;其实没法识别&#xff0c;//因为mvc找方法是通过反射来的&#xff0c;GetMethods(nam…

vue 自定义(hook)--(模块化)

文章目录 定义示例代码 定义 什么是hook&#xff1f;—— 本质是一个函数&#xff0c;把setup函数中使用的Composition API进行了封装&#xff0c;类似于vue2.x中的mixin。 自定义hook的优势&#xff1a;复用代码, 让setup中的逻辑更清楚易懂。 示例代码 useSum.ts中内容如下…

mavlink协议解析

1. mavlink数据包格式 字节索引C 版本内容值说明0uint8_t magic数据包启动标记0xFE特定于协议的文本启动 (stx) 标记, 用于指示新数据包的开始。 任何不识别协议版本的系统都将跳过数据包。1uint8_t len载荷长度0 - 255指示以下 payload 部分的长度 (为特定消息固定)。2uint8_t…

java并发编程概述

java并发编程概述 一. 进程和线程的概念 进程是计算机中的程序关于某数据集合上的一次运行活动&#xff0c;是系统进行资源分配的基本单位。进程是程序运行的实例&#xff0c;每当操作系统在运行一个程序时&#xff0c;会为其创建一个进程。每个进程都拥有自己的一整套变量。…

python:openpyxl DataBarRule 制作数据条

技术文档&#xff1a; 条件格式 — openpyxl 3.0.7 文档 openpyxl.formatting.rule module — openpyxl 3.1.3 documentation 但是&#xff0c;想让单元格数值按比例显示&#xff08;右边正确&#xff09;只能按data_bar_rule_2编写&#xff1a; from openpyxl import Workb…