PostgreSQL 12 引入了可插拔式的表存储方法接口,允许为不同的表选择不同的存储机制,例如用于 OLTP 操作的堆表(HEAP、默认)、用于 OLAP 操作的列式表(Citus),以及用于超快速搜索处理的内存表。
PostgreSQL 这一特性类似于 MySQL 的插件式存储引擎,例如 InnoDB、MyISAM。
今天给大家介绍一个云原生的 PostgreSQL 存储引擎:OrioleDB。
功能特性
OrioleDB 旨在解决 PostgreSQL 默认 HEAP 表在 OLTP(在线事务处理)场景中的一些性能瓶颈,并引入现代数据库存储技术的设计理念,提供更高的并发性能、更低的延迟,并减少存储开销。
OrioleDB 以扩展插件形式提供,基于 PostgreSQL 协议发布,提供的核心特性包括:
- 基于现代存储技术(SSD、NVRAM)设计,优化多核 CPU 和 NUMA 架构下的资源分配,提升吞吐量。
- 基于 Undo Log 的 MVCC,将旧版本数据存储在独立的 Undo Log 而不是主表中。事务回滚或旧版本清理时直接操作 Undo Log,避免主表数据膨胀。同时还支持 64 位事务 ID,避免了回卷问题。
- 聚簇索引,默认使用聚簇索引(类似 MySQL/InnoDB),数据按主键顺序存储,减少随机 I/O,提升范围查询性能。
- 压缩存储,支持页级数据压缩,降低存储成本。
- 分布式支持,Copy-on-Write 检查点提供结构一致的数据快照,兼容 SSD 特性,并支持紧凑的行级 WAL 记录。基于行级 WAL 日志和 Raft 共识算法,支持并行回放和 Active-Active 多主架构,适合分布式部署。
使用示例
目前,OrioleDB 还处于 Beta 阶段,最简单的使用方法就是利用 Docker:
docker run -d --name orioledb -p 5432:5432 orioledb/orioledb
然后安装扩展插件并创建数据表:
-- 创建扩展插件
CREATE EXTENSION orioledb;-- 创建表
CREATE TABLE blog_post
(id int8 NOT NULL,title text NOT NULL,body text NOT NULL,author text NOT NULL,published_at timestamptz NOT NULL DEFAULT CURRENT_TIMESTAMP,views bigint NOT NULL,PRIMARY KEY(id)
) USING orioledb; -- 使用OrioleDB存储引擎-- 创建索引
CREATE INDEX blog_post_published_at ON blog_post(published_at);
OrioleDB 使用聚簇索引,因此主键的选择对于性能至关重要;如果没有指定主键字段,数据库会基于 ctid 字段创建一个隐藏的替代主键。
接下来就可以执行一些 DML 操作:
INSERT INTO blog_post (id, title, body, author, views)
VALUES (1, 'Hello, World!', 'This is my first blog post.', 'John Doe', 1000);SELECT * FROM blog_post ORDER BY published_at DESC LIMIT 10;
更详细的使用介绍和注意事项可以参考以下官方文档:
https://www.orioledb.com/docs
性能比较
以下是一些 OrioleDB 和默认 HEAP 存储引擎的性能比较:
测试一:只读测试显示 OrioleDB 存储引擎的性能是 PostgreSQL 默认引擎的 4 倍。
测试二:读写测试显示 OrioleDB 存储引擎的性能是 PostgreSQL 默认引擎的 4.5 倍。
测试三:OrioleDB 存储引擎的磁盘读取(IOPS)是 PostgreSQL 默认引擎的 1/6。
测试四:OrioleDB 存储引擎的磁盘写入比 PostgreSQL 默认引擎大幅减少。