计算机行业是唯一一个比时装行业概念更多的行业。概念频出,最慢的话半年一定出一个,短的话半个月就能看到新的名词和技术甚至是概念。
存算分离的概念
我第一次听到存算分离时候还是从Hadoop上听到的。然后就去问什么是存算分离。听了讲解以后,我问这和Oracle的集群–RAC的不是一样吗?回答说是基本这个意思。只是Oracle并没有这样宣传。RAC因为有ASM一层,打通了不同存储节点,让数据库看存储是一大块。而Hadoop的HDFS也类似的实现。
我之所以说类似,是因为还有一点不同的。区别就是一个属于引擎级存算分离还有一个数部署级存算分离。(可能是现有实物,再有冠名,依然是概念)
什么是引擎级存算分离?在数据库引擎的内部架构设计层面,天然将存储层(数据持久化)与计算层(查询处理)解耦,二者通过明确的接口或协议通信。优势:弹性扩展:计算和存储可独立扩缩容。资源隔离:计算节点无状态,故障恢复快。云原生友好。云原生依然是一个概念,说的直白点就是在公有云上使用更好。根据这些特征我们也可以判断了OceanBase、TiDB等就是这类的存算分离(这里提及的是他们的分布式版,他们都有单机版和敏捷版不属于这种)
什么是部署级存算分离?将存储与计算分离,但数据库引擎本身并非原生支持。通常依赖共享存储(如SAN、分布式文件系统)。硬件复用:存储资源可被多计算节点共享。简化迁移:计算节点可快速替换,数据无需迁移。根据这些特征我们也可以判断了Oracle的RAC,YashanDB和cantian等属于这种存算分类。
两种存算分离各有千秋。个人认为如果是企业级应用那么部署级存算分离更加贴近业务一些,企业内部不会有爆炸式增长和太多的不确定性。而引擎级存算分离更多的是面向互联网场景的不确定性。
存算分离自带高可用
当谈及存算分离的时候,其实已经进入分布式和高可用的范畴。无论那种存算分离都是对应用透明的。TIDB也好Oracle也罢。1个计算节点宕机或者重启不影响使用。同样存储上都是多副本的,硬盘发生故障数据也不会丢失。那么可靠性的问题就解决了。
存算分离是需求的产物
可以看出有很多产品都有存算分类的架构和方案,那么为什么要做呢?因为有需求!
从一个角度上说,这样做我认为有两个原因。第一个原因是单机的存储有上限,第二个是多个存储并行的话,可以提升读写性能。这些都是和硬件的容量和IO能力有关。只是这些年硬件也在进步。所以也出现了分布式向集中式变迁的趋势。这也就是为什么不少分布式数据库出单机版的原因。这时候部署级存算分离似乎就更加凸显优势。即是分布式又相对集中。
而从另外一个角度,是说计算和存储之间的矛盾。一般来说存储的IO比内存差,比起L1 L2 L3以及CPU就更差了。那么就会出现CPU在等IO情况。那么在存算一体的情况下,只能等。这种场景下存储就限制了计算的发挥。多余的计算能力,其他机器也用不到。同样如果是多余的存储资源其他机器也用不到。
对于以上的问题虚拟机可以增加存储空间和CPU数量。但是如果加到物理机分配的上限也不能加了。而物理机这个扩展到上限也无法加了。而在存算分离的架构下,就可以动态的增加。
这时候就可以看出存算分离的优势了。就像步步高点读机,哪里不会点哪里一样。存算分离哪里不够补哪里。
存算分离是自身的产物
关于算子下推的也在存算分离数据库中都体现了。因为这部分的主要工作其实是存储做的。所谓算子下推比如select * from t where id<1000 and status=0 如果id有索引,但是status没有索引,加上0的有50个。 那么一般情况下通过谓词过滤索引定位扫描1000行,在这1000个中在找到50返回。 而在算子下推到存储层后,在存储层就直接把这50个给出来,而不必把这些行和列加载到内存后再过滤返回给客户端,减少了内存和磁盘、以及内存和网络之间的交互。没有存储上的工作是做不到这个特性的。不是买来一堆硬盘攒一个存储就可以。
还有一点说到分布式那么分布式数据库要不要备份。从前我个人认为不需要。毕竟没听过谁说给Hadoop做备份。百度也没听说过做备份。但是对于有些存算分离的数据库还是提出了备份的要求。在这种情况下备份其实是不好做的。而部署级存算分离可以通过全局一致性快照来完成。什么是全局一致性快照?其实就是对存储上所有的使用的数据块做一次备份。可以理解成虚拟机那种快照。不同的是存算分离的数据库中有管理元数据的机器通过他知道数据在磁盘上的分布,所以就克隆了一份。这种在存储级存算分离上似乎实现比较容易一些,例如Oracle的备份一体机对RAC以及上述提到的其他存储级存算一体数据库。
存算分离是存储不足还是计算不足?
那么到底是计算会经常不足还是存储会经常不足?按说通过合理的设计和实现,绝大部分企业都不需要用到Hadoop。本身也没有海量的数据,如果SQL用到索引计算不会是大问题。
至于存储方面,现在网上看到硬盘N (n>=4) TB的很常见。也就是说中小企业来说都不太需要存算分离。只有达到大型企业比如金融的几个大行,几个运营商等这种规模的是需要存算分离架构的。
打个比方就是如果1000人要从上海去北京,那么选择火车是最优的。但是如果小于等于5个人从加到公司(在一个行政区内),那么开车是最优的。
还是看自己的规模选择
所以存算分离还是集中处理,需要结合情况来说。既不能小马拉大车,也不能杀鸡用牛刀。如果出现以上情况不是方案本身的问题,而是不适配的问题。