一、数据库架构原则
高可用
高性能
可扩展
一致性
二、常见的架构方案
方案一:主备架构,只有主库提供读写服务,备库冗余作故障转移用
jdbc:mysql://vip:3306/xxdb
高可用分析:高可用,主库挂了,keepalive(只是一种工具)会自动切换到备库。这个过程对业务层是透明的,无需修改代码或配置。
高性能分析:读写都操作主库,很容易产生瓶颈。大部分互联网应用读多写少,读会先成为瓶颈,进而影响写性能。另外,备库只是单纯的备份,资源利用率50%,这点方案二可解决。
一致性分析:读写都操作主库,不存在数据一致性问题。
扩展性分析:无法通过加从库来扩展读性能。
可落地分析:两点影响落地使用。第一,性能一般,这点可以通过建立高效的索引和引入缓存来增加读性能,进而提高性能。这也是通用的方案。第二,扩展性差,这点可以通过分库分表来扩展。
方案二:双主架构,两个主库同时提供服务,负载均衡
jdbc:mysql://vip:3306/xxdb
高可用分析:高可用,一个主库挂了,不影响另一台主库提供服务。这个过程对业务层是透明的,无需修改代码或配置。
高性能分析:读写性能相比于方案一都得到提升,提升一倍。
一致性分析:存在数据一致性问题。请看,一致性解决方案。
扩展性分析:当然可以扩展成三主循环,但不建议(会多一层数据同步,这样同步的时间会更长)。如果非得在数据库架构层面扩展的话,扩展为方案四。
可落地分析:两点影响落地使用。第一,数据一致性问题,一致性解决方案可解决问题。第二,主键冲突问题,ID统一地由分布式ID生成服务来生成可解决问题。
方案三:主从架构,一主多从,读写分离
jdbc:mysql://master-ip:3306/xxdb
jdbc:mysql://slave1-ip:3306/xxdb
jdbc:mysql://slave2-ip:3306/xxdb
高可用分析:主库单点,从库高可用。一旦主库挂了,写服务也就无法提供。
高性能分析:大部分互联网应用读多写少,读会先成为瓶颈,进而影响整体性能。读的性能提高了,整体性能也提高了。另外,主库可以不用索引,线上从库和线下从库也可以建立不同的索引(线上从库如果有多个还是要建立相同的索引,不然得不偿失;线下从库是平时开发人员排查线上问题时查的库,可以建更多的索引)。
一致性分析:存在数据一致性问题。请看,一致性解决方案。
扩展性分析:可以通过加从库来扩展读性能,进而提高整体性能。(带来的问题是,从库越多需要从主库拉取binlog日志的端就越多,进而影响主库的性能,并且数据同步完成的时间也会更长。建议不要分多层,且一台主库一般挂3-5台从库吧。一般配置的mysql,并发最好控制在2000/s,挂5台的话,整体基本能支撑1w+/s的并发,再加上缓存和二八定律,基本能支撑小10w/s的并发,很高了。如果还不能满足需求,那还是选择去分库吧。)
可落地分析:两点影响落地使用。第一,数据一致性问题,一致性解决方案可解决问题。第二,主库单点问题,暂时没想到很好的解决方案(这点评论里给了一种方案,可参考)。
注:思考一个问题,一台从库挂了会怎样?读写分离之读的负载均衡策略怎么容错?
方案四:双主+主从架构,看似完美的方案
jdbc:mysql://vip:3306/xxdb
jdbc:mysql://slave1-ip:3306/xxdb
jdbc:mysql://slave2-ip:3306/xxdb
高可用分析:高可用。
高性能分析:高性能。
一致性分析:存在数据一致性问题。请看,一致性解决方案。
扩展性分析:可以通过加从库来扩展读性能,进而提高整体性能。(带来的问题同方案二)
可落地分析:同方案二,但数据同步又多了一层,数据延迟更严重。
三、一致性解决方案
第一类:主库和从库一致性解决方案
注:图中圈出的是数据同步的地方,数据同步(MySQL主从复制,简单来说就是从库从主库拉取binlog日志,再执行一遍,想深入了解可以去查阅“MySQL主从复制原理”相关资料)是需要时间的,这个同步时间内主库和从库的数据会存在不一致的情况。如果同步过程中有读请求,那么读到的就是从库中的老数据。如下图。
既然知道了数据不一致性产生的原因,有下面几个解决方案供参考:
直接忽略,如果业务允许延时存在,那么就不去管它。
强制读主,采用主备架构方案,或者代码指定读主库(一般不建议,这样就失去了读写分离的意义),读写都走主库。
选择读主,写操作时根据库+表+业务特征生成一个key放到Cache里并设置超时时间(大于等于主从数据同步时间)。读请求时,同样的方式生成key先去查Cache,再判断是否命中。若命中,则读主库,否则读从库。代价是多了一次缓存读写,基本可以忽略。
数据库中间件,引入开源(mycat等)或自研的数据库中间层。个人理解,思路同选择读主。数据库中间件的成本比较高,并且还多引入了一层。
第二类:DB和缓存一致性解决方案
先来看一下常用的缓存使用方式:
第一步:淘汰缓存;
第二步:写入数据库;
第三步:读取缓存?返回:读取数据库;
第四步:读取数据库后写入缓存。
一般来说,并发量不是特别大的话,上面的方式就可以。但是如果是高并发量的情况下,当写入时,你淘汰了缓存,但是还没写入数据库时或者主从延时,就有一个读请求完成了,此时缓存中就会缓存旧的数据。此时可以,写库完成时,等一会(根据业务场景评估)再删除一次缓存,这样缓存旧数据的概率又低了,不过这样一来数据库的压力就会有相应的增加,并且响应时间会增加。其实,要想保证数据库和缓存严格的一致性很难,甚至要付出很高的代价。网上还个方案,就是用本地内存队列来控制读请求和写请求串行化,利弊都有,感兴趣可深入研究:高并发场景下,如何保证缓存和数据库双写的一致性。另外,思考一下是不是能用基于临时顺序节点的Zookeeper分布式锁(用两个锁,一个读锁,一个写锁,当排在写锁后面的第一个读锁被通知时,读操作完成后,批量删除后面连续的读锁,注意不要引发羊群效应 -> 主备架构时)?
注:设置缓存时,一定要加上失效时间!
四、个人的一些见解
1、架构演变
架构演变一:方案一 -> 方案一+分库分表;
架构演变二:方案一 -> 方案三 -> 方案三+分库分表
架构演变三:方案一 -> 方案二 -> 方案二+分库分表
注:方案四一般不用。
2、个人见解
加缓存和索引是通用的提升数据库性能的方式;
分库分表带来的好处是巨大的,但同样也会带来一些问题,详见MySQL数据库之互联网常用分库分表方案。
不管是主备+分库分表还是主从+读写分离+分库分表,都要考虑具体的业务场景。一般大部分的数据库架构还是采用方案一和方案一+分库分表,典型的读多写少的场景用方案三+读写分离+分库分表。另外,阿里云提供的数据库云服务也都是主备方案,要想主从+读写分离需要二次架构。
记住一句话:不考虑业务场景的架构都是耍流氓。