Oracle23c改名为Oracle23ai,也意味着Oracle数据库正式从Cloud进入AI时代。Oracle23ai版本是一个超级巨兽,简单总结下:
-
AI能力:内置向量数据库,内置ONNX模型数据处理,内置Text2SQL,内置的机器学习算法持续增强;
-
JSON能力增强,要干掉MongoDB,并且还是JSON与关系型双模型一体化方案;
-
图数据处理能力增强,要干掉Neo4j,模型也是一体化设计;
-
TrueCache,取这个名字就是霸气,鄙视Redis这些伪缓存方案,Oracle才是真正的缓存服务,缓存实例的内存数据与主数据是实时更新,不需要处理Redis数据更新同步的各种问题;
-
数据分片增加raft多副本支持,那些说Oracle没有分布式数据库能力的人,大家看好了;
-
SQL易用性大幅提升,这个是向MySQL、PostgreSQL学习。
更详细的内容参考下文,以下内容翻译自Oracle官网博客:
--------------------------
我们很高兴地宣布 Oracle Database 23ai 正式发布。在过去四年中,Oracle 数据库开发部门一直在努力提供 Oracle 数据库的下一个长期支持版本,重点是 AI 和开发人员的工作效率。鉴于此版本数据库中对 AI 的关注,我们决定将数据库的名称从 Oracle Database 23c 更改为 Oracle Database 23ai。这反映了此版本的重点以及发布环境。
改变游戏规则的创新
Oracle Database 23ai 专注于三个关键领域。
-
AI for Data
-
数据开发
-
数据关键任务
在本博客中,我们将介绍此版本的一些关键功能,这些功能突出了我们在这些重要重点领域的工作,并在您在选择的平台上看到它们时提供详细信息。
一、AI for Data
我们通过 AI for Data 实现的目标有两个:
-
使应用程序开发人员能够更轻松地将 AI 功能添加到其数据驱动应用程序中
-
将 GenAI 功能整合到我们的产品中,以便 Oracle 数据库的所有用户(从数据分析师到应用开发人员和 DBA)都能提高工作效率。
这是通过利用 AI 来简化 Oracle 的数据管理流程、提供 AI 算法以从数据中发现新见解、促进数据库查询的自然语言交互以及使用户能够存储 AI 生成的向量以实现快速高效的对象相似性搜索来实现的。让我们进一步深入研究这些功能。
增强新一代 AI 模型(替换向量数据库)
人们正在感受到 AI 大型语言模型 (LLM) 的影响,ChatGPT、Google Gemini、Cohere 和 LLaMA 等产品就是例证。虽然 LLM 对我们执行日常任务的方式产生了深远的影响,但这些引擎面临的挑战之一是它们仅限于在创建的特定时间窗口内回答问题。它们还缺少组织内保存的数据的上下文和详细信息。为了使这些和其他 LLM 有用,我们需要用与您提出的有关数据库中保存的数据的问题相关的数据来增强他们现有的理解。
在 Oracle Database 23ai 中,我们推出了 AI 向量搜索,这是一项强大的新技术,使您能够利用新一代 AI 模型来生成和存储向量。这些向量(有时称为嵌入)是文档、图像、视频、声音等的多维表示。通过将这些对象编码为向量,您可以获得使用数学计算查找它们之间的相似性的能力。Oracle Database23ai 解决方案的真正强大之处在于,您可以使用简单的 SQL 将这些相似性搜索与业务数据搜索相结合。任何对 SQL 有基本了解的人都可以创建一个强大的语句,将相似性和其他搜索条件结合起来。这些类型的查询为 LLM 提供了额外的上下文,增强了他们的知识,使他们的响应更准确,更贴近客户或组织的问题。为了实现此功能,我们向 SQL 语言添加了新的数据类型、新的向量索引和扩展,以便利用 Oracle Database 23ai 的高级分析功能,使查询向量与现有业务数据一起变得非常简单。
数据的安全编码(内置ONNX模型数据处理能力)
为了实现 LLM 提供的可观好处,我们首先需要丰富我们对数据集及其中对象的理解。对这些对象进行编码的模型可能是大型且复杂的代码段。因此,将此处理卸载到第三方服务已成为常见做法。这可能要求您与第三方共享潜在的敏感信息,并承担固有的风险。
为确保对象的安全编码,Oracle Database 23ai 允许您通过对 ONNX 标准的支持将自己的可信 AI 模型直接加载到数据库中。这使 Oracle Database 23ai 能够在将对象插入数据库时对其进行编码。这样可以安全地近乎实时地对对象进行推理,并确保不需要从数据库中提取数据并将其移交给第三方服务。
自然语言提问(内置Text2SQL)
虽然 SQL 是一种非常强大的语言,但入门起来可能有点挑战。为了让更广泛的用户能够提出 Oracle 数据库中最复杂的问题,我们正在与 Cohere 和 Llama 等 LLM 集成,允许您使用自然语言提出问题。因此,您可以简单地问一个问题,例如“向我展示过去 4 个季度受年轻一代欢迎的产品的销售情况”。Oracle Database 23ai 将共享表的元数据,以便与 LLM 一起回答问题以及用户的问题。LLM 理解“年轻一代”的含义,并将其转换为数据范围作为 SQL 查询中的过滤器,并将其返回到数据库。当然,我们并不局限于 Oracle Database 23ai 仅允许您查询数据库中的信息。您还可以就 Oracle 数据库的各个方面提出问题。
支持机器学习算法完成数据洞察
自 20 多年前发布 Oracle Database 9iR2 以来,该数据库一直采用内置的机器学习 (ML) 算法,使您能够快速查找其表中保存的数据的模式和趋势,并预测客户行为。这些 ML 算法使您能够使用复杂的 ML 算法,而无需复杂的 ETL 操作来提取数据并写回结果。然后,当数据插入或加载到 Oracle 数据库时,这些模型可用于分类、聚类和预测,从而提供切实的业务优势,例如客户建议和欺诈检测。自该版本发布以来,我们改进了 Oracle 数据库,并为其添加了新的 ML 算法和功能,从而创建了业界最复杂、功能最强大的数据挖掘平台之一。
AI在 Oracle23ai 数据库的所有版本中均可用
AI Vector Search 是 Oracle Database 23ai 的一部分,在企业版、标准版 2、Database Free 和所有 Oracle 数据库云服务中均免费提供。
来自早期测试人员的反馈
AI Vector Search 甚至在发布之前就引起了极大的兴趣,许多客户和合作伙伴都热衷于试用并提供有关 AI Vector Search 等最新功能的反馈。以下是我们收到的反馈示例。
“我们很高兴看到 AI 矢量搜索功能被添加到 Oracle 数据库中。我们非常欣赏能够像其他工作负载一样在同一个 Oracle 数据库中运行 AI Vector Search,这使我们能够提供可靠且安全的解决方案。
Shinichiro Otsuka, NRI 认证 IT 架构师, 野村综合研究所, Ltd.
“AI Vector Search 通过将 AI 引入您的数据来改变我们对业务的看法:例如,我们可以使用自然语言来查询我们的文档,以找到客户提出的问题的答案。这使得服务客户的过程更快,服务质量也得到了提高。能够将生成式 AI 的强大功能用于我们自己的数据会产生巨大的影响。
Heli Helskyaho,Miracle Finland Oy 首席执行官
“我们一直在使用先进的数字技术为各种业务转型项目提供咨询。Oracle Database 23ai AI Vector Search 通过向当前关系数据库系统添加向量列,实现起来非常简单。我很高兴向量数据与现有数据位于单个记录中,因此可以使用单个 SQL 语句完成相似性重新排序。这使得将大型语言模型和公司数据结合起来,以创建和运行企业级检索增强生成系统变得容易。
Shigeru Urushibara,UL Systems Inc. 董事长
"随着日本国内劳动力的减少,XCAT的客户希望采取节省劳动力的措施。Oracle Database 23ai 的 AI 矢量搜索支持客户使用 SQL 进行矢量检索,这使其成为处理矢量数据的工程师的绝佳工具。此外,无需额外费用即可管理 AI 数据的能力是许多 Oracle 数据库客户的一大吸引力。
Mitsunori Yamane,Cross Cat Co., Ltd. 总裁
二、数据开发
Oracle Database 23ai 的重点是通过消除与数据库交互相关的复杂性来简化开发应用的体验。消除应用程序开发过程的复杂性意味着您有更多机会专注于创建满足客户要求的优雅应用程序的复杂性,而不是陷入技术细节的泥潭。此外,降低复杂性可以加快开发周期,这在当今快节奏的数字环境中至关重要,因为市场需求可能会迅速变化。
JSON 还是 Relational,这是一个艰难的选择?(替换MongoDB)
Oracle 23ai 引入了许多关键技术来降低开发人员的复杂性。也许其中最具创新性和最重要的一点是引入了 JSON 关系二元性。该技术允许您在单个app. JSON中利用关系的强大功能和 JSON 开发方法的简单性,并提供一种优雅的数据建模方法,其中应答查询所需的所有相关数据都包含在单个对象中,而无需跨表执行复杂的联接。关系方法提供了一个灵活、存储高效、一致的数据模型,该模型易于使用 SQL 等语言进行查询。从历史上看,当您被迫在应用程序生命周期开始时选择要采用的数据库建模方法时,问题就来了。随着业务需求的变化,在此阶段做出的决策可能会在很久以后产生影响。JSON 关系二元性的美妙之处在于,您可以从这两种方法中受益,而无需使用复杂而笨拙的对象关系映射框架 (ORM)。
通过在关系表上创建简单的 JSON 二元性视图,您可以构建使用文档查询和更新基础数据集的应用程序。避免了数据重复(文档建模中的一个基本问题),甚至数据库级并发控制的复杂性也对您隐藏起来,因为 Oracle Database 23ai 代表您管理文档级可序列化性。您可以继续使用简单的 HTTP PUT、POST 和 GET 操作,也可以直接针对 Oracle 数据库使用特定于语言的 API,例如 Oracle 的 SODA API 甚至 MongoDB API。有了 JSON Duality Views,“你不能吃蛋糕就吃”这句老话不再适用。
SQL 变得更简单了(向MySQL/PostgreSQL学习)
SQL 仍然是当今应用程序开发人员使用的最流行的开发语言之一。在询问业务数据中最简单或最复杂的问题时,它的多功能性使其成为数据管理的基石,在可预见的未来,它可能会保持这一地位。这并不是说有些地方可以改进。在 Oracle Database 23ai 中,我们听取了常见的增强请求,并研究了哪些方法可以简化或提供更引人注目的与数据库交互的方式。我们所做的一些 SQL 改进示例包括添加两种新的数据类型“Boolean”和“Vector”,我们添加了“数据用例域”以允许您丰富表定义中使用的数据类型的含义,删除了简单 SQL 语句中对“from dual”的需求以提高可读性,使其更容易在“间隔”数据类型上聚合, 引入了表值构造函数,以便于在 Insert、Select 或 Merge 语句中指定多行。这些只是我们对 SQL 所做的众多改进中的一小部分。有关更多详细信息,请查看此博客。
与 AI Vector Search 一样,我们也很高兴从参与 Oracle Database 23ai Beta 计划的客户和合作伙伴那里获得大量有用的反馈。以下是我们收到的评论示例 -
“JSON关系对偶视图最终解决了对象关系映射的问题,从而改变了应用程序开发的游戏规则。而且,我们终于在多层或Web架构中实现了符合ACID标准的事务。
彼得·德瓦尔,Transfer Solutions首席顾问
“JSON 关系二元性为您提供了两全其美的优势:关系专家可以处理与文档数据库专家相同的数据,而无需学习新技能。应用程序开发人员拥有所需的灵活性,并且数据库管理更简单。Oracle 已经实现了超越其他数据库的巨大飞跃。
Patrick Barel,Qualogy 高级 Oracle 顾问
“Oracle Database 23ai 与 JSON 关系对偶视图和 Oracle APEX 相结合,使我们能够创建功能齐全、符合标准的应用,用于处理 JSON 医疗保健数据。”
Rade Pobulic,VDEL Informationstechnik & Consulting GmbH 技术总监
对复杂关系进行建模的属性图(替换Neo4j)
图形数据库为对真实场景中的复杂关系进行建模提供了全新的视角。然而,直到最近,开发人员还在努力使用专有语言,并且不得不发布为管理这些关系而量身定制的数据数据库。这阻碍了这项突破性技术的广泛接受。幸运的是,该行业采取了协作方式,将图表带给大众,最终建立了标准。这些标准使开发人员能够了解 SQL 的多功能性和熟悉度,从而营造出更易于访问的环境。Oracle Database 23ai 是采用这一新标准的开创性商业数据库。随着这些进步,我们预计图形数据库在企业生态系统中的集成将大幅增加。
与 JSON 二元视图一样,您可以通过属性图视图的用户表达您希望如何使用现有关系表或 JSON 集合中保存的数据的意图。通过简单视图,您可以扩充数据,以便对数据所包含的潜在复杂关系进行建模。新的 SQL 扩展使编写强大的查询变得更加简单,从而更深入地了解使用标准 SQL 难以描述的信息。我们还添加了一组新的复杂图形算法(最短路径、分类、连接等),这些算法将在 GA 发布后不久发布。
属性图 Property Graph 在 Oracle Database 23ai 的所有版本中都可用。
三、数据关键任务
Oracle 数据库以支持世界上一些最重要的应用而闻名。多年来,它已成为企业最宝贵资产:数据的坚定守护者。Oracle 数据库功能丰富,在保护关键系统免受意外停机的影响方面表现出色。一个典型的例子是 Oracle Real Applications Clusters (RAC),这是一项支持全活动共享磁盘数据库的尖端技术,非常适合最关键的任务场景。Oracle Active DataGuard 和 Oracle GoldenGate 在构建同构和异构数据复制架构方面提供了无与伦比的灵活性。
分片更好、更快、更简单(替换TiDB/CockrochDB/OceanBase)
对于企业希望在更远的距离上分发数据的用例,无论是出于监管原因(用户数据必须存储在客户居住的国家/地区),还是为了减少与全球分布式应用程序相关的访问延迟:我们在 Oracle Database 12c 中引入了对数据库分片的支持。分片将数据集分布在多个 Oracle 数据库中,但作为单个逻辑数据集进行管理。这种分片架构允许通过添加和删除分片来纵向扩展或缩减数据库,并允许 Oracle 自动重新平衡数据集。Oracle 能够在线完成此操作,并且对业务影响很小,因为分片的概念直接融入数据库中。
在 Oracle Database 23ai 中,我们的全球分布式数据库技术引入了对 Raft 复制的支持。这是一种基于共识的协议,有助于跨所有分片自动配置复制。使用 raft 时,replication 在所有分片中保存称为复制单元的副本。在发生分片故障或重新配置时,Oracle Database 23ai 会自动重新平衡数据。新的 Raft 协议还支持亚秒级故障转移,以确保持续的业务连续性。
Oracle 23ai 为我们的高可用性产品带来了许多全面的改进,例如新的“本地滚动数据库维护”,通过在接收补丁的同一节点上建立另一个实例来简化集群中滚动补丁的影响。我们还引入了对每个可插拔数据库 (PDB) 的新 Data Guard 的支持,允许在两个容器数据库 (CDB) 之间提供可插拔数据库级别的灾难保护,每个 CDB 都运行一个活动工作负载。我们还改进了 Oracle Clusterware 中 PDB 的集成和管理。有关这些 HA 功能的更多详细信息,请查看 Markus 的博客,他在博客中详细介绍了我们在 Oracle Database 23ai 中所做的改进。
缓存数据变得简单(替换Redis)
在应用层中缓存数据可以带来相当大的好处。它通常用于提高应用程序的响应速度并减少数据库上的负载,因为查询被卸载到通常位于更靠近代码的缓存中。然而,为了实现这些好处,开发人员面临着许多挑战;其中最大的一项是确保缓存与后端数据库中保存的数据一致,否则可能会提供过时且可能不正确的数据。开发人员经常被迫创建复杂的代码来管理这些方案,并且经常不得不求助于设计模式,例如“生存时间”,其中数据定期从缓存中刷新并重新加载。这些挑战和许多其他挑战通常意味着缓存的维护变得困难且成本高昂,在某些情况下,问题比其设计要解决的问题更大。
在 Oracle Database 23c 中,我们希望通过一项名为“True Cache”的新功能来解决针对 Oracle 数据库构建的缓存问题。True Cache 是在主数据库前面运行的无盘 Oracle 实例。True Cache 实例利用 Active Data Guard 技术来确保在主数据库实例中的数据发生变化时自动更新。这种新的缓存技术最重要的功能之一是其简单的配置和最少的代码更改,以利用它提供的好处。
使 SQL 执行更安全(防火墙)
组织面临的挑战之一是恶意行为者不断试图窃取数据或破坏其日常活动。在 Oracle Database 23ai 中,为了防止未经授权的 SQL 执行,无论是通过 SQL 注入攻击还是由未经授权的员工执行,我们引入了 SQL 防火墙。SQL 防火墙允许您根据允许执行的 SQL 来训练数据库。然后,可以使用SQL的“允许列表”来记录未经授权的SQL或将其执行记录在博客中。可以添加其他条件以允许 IP 范围或授权呼叫程序的例外情况。SQL 防火墙的强大之处在于它是 Oracle 数据库的一部分,因此,它对 SQL 的执行施加的开销非常小。设置和训练 SQL 防火墙非常简单,可以通过 GUI 或通过对存储过程的几次简单调用来完成。
超过 300+ 新功能
在之前的博客中,我讨论了 Oracle Database 23ai 的云版本,并介绍了 300+ 项新功能中的一些。其他一些值得注意的功能包括
-
Java 脚本存储过程
-
优先交易
-
数据用例域
-
架构权限
-
附注
-
布尔数据类型
-
开发人员角色
-
每个 PDB 只读备用
-
JSON 架构
-
实时 SQL 计划管理
-
性能改进
-
锁定免费预订
-
改进的微服务支持
-
XML 和 JSON 搜索索引增强功能
-
还有很多很多
有关这些内容的详细分类,另请查看新功能指南文档
平台推出
Oracle Database 23ai 现已在 Oracle Exadata Cloud@Customer、OCI Exadata 数据库服务和 OCI 基础数据库服务上推出。Azure Oracle 数据库服务中也提供了它。对于开发人员,Oracle Database 23ai 现在可在 Always Free 自治数据库中使用,也可以在 Autonomous Database 23ai Container Image 和 Oracle Database 23ai Free 中下载。我们也很高兴地宣布,Oracle GoldenGate 23ai 和 GoldenGate 23ai 免费版也可供下载。Oracle Database 23ai for Linux (OL & RHEL 8/9) 和 Windows 的本地部署版本将很快推出,其他平台将在未来几个月内推出。有关详细信息,请查看 Oracle Support 说明文档 ID 742060.1
Oracle Database 23ai 的正式发布标志着这一重要版本进入了一个新阶段。数以千计的开发人员为其设计、开发和测试做出了贡献,从而形成了我们认为是市场上最好的企业数据库。
参考地址:
https://blogs.oracle.com/database/post/oracle-23ai-now-generally-available
Oracle Database Oracle Database New Features, Release 23ai
原文链接:Oracle Database 23ai 正式发布,超级巨兽(集关系型、向量、文档、图、缓存、分布式数据库一体的全能数据库)Oracle23c改名为Oracle23ai,也意味着Oracle数据库正式从Cloud进入AI时代。https://mp.weixin.qq.com/s/eVgdl1SU7_OztUGniS8yAQ