PostgreSQL的核心架构
注意 本人的博客都迁移到本人自己搭建的博客地址,通过此处可查看。
应用程序的访问接口
进程及内存结构
-
主进程:Postmaster进程
-
辅助进程:SysLogger(系统日志)进程、BgWriter(后台写)进程、WALWrite(预写式日志)进程、PgArch(归档)进程、AutoVacuum(系统自动清理)进程、PgStat(统计收集)进程、CheckPoint()进程。
是整个数据库实例的总控进程,负责启动和关闭该数据库实例。
需要在Postgres.conf
中logging_collection
设置为on
,此时主进程才会启动Syslogger
辅助进程。
把共享内存中的脏页写到磁盘上的进程。主要是为了提高插入、更新和删除数据的性能。
WAL:Write Ahead Log(预写式日志)
在修改数据之前把修改操作记录到磁盘中,以便后面更新实时数据时就不需要数据持久化到文件中。
WAL日志会被循环使用,PgArch在归档前会把WAL日志备份出来。通过PITY(Point in Time Recovery)技术,可以对数据库进行一次全量备份后,该技术将备份时间点之后的WAL日志通过归档进行备份,使用数据库的全量备份再加上后面产生的WAL日志,即可把数据库向前推到全量备份后的任意一个时间点。
在PostgreSQL数据库中,对表进行DELETE操作后,旧的数据并不会立即被删除,并且,在更新数据时,也并不会在旧的数据上做更新,而是新生成一行数据。旧的数据只是被标识为删除状态,只有在没有并发的其他事务读到这些就数据时,它们才会被清楚。这个清除工作就有AutoVacuum进程完成。
做数据的统计收集工作。主要用于查询优化时的代价估算,包括一个表和索引进行了多少次的插入、更新、删除操作,磁盘块读写的次数、行的读次数。pg_statistic
中存储了PgStat
收集的各类信息。
PostgreSQL启动后,会生成一块共享内存,用于做数据块的缓冲区,以便提高读写性能。WAL日志缓冲区和Clog缓冲区也存在共享内存中,除此之外还有全局信息比如进程、锁、全局统计等信息也保存在共享内存中。
使用"mmap()“方式的共享内存,使用此内存的好处是不在需要配置"System V"共享内存的参数"kernel.shmmax"和"kernel.shmall”,就能使用较大的共享内存。
非全局存储的数据都存在本地内存中,主要包括:
-
临时缓冲区:用于访问临时表的缓冲区
-
work_mem: 内部排序操作和Hash表在使用临时操作文件之前使用的存储缓冲区。
-
manintance_work_mem: 在维护操作比如:VACUUM、CREATE INDEX、ALTER TABLE ADD FOREIGN Key等中使用的内存缓冲区。