数据库的这些性能优化,你做了吗

转载自   数据库的这些性能优化,你做了吗

在互联网项目中,当业务规模越来越大,数据也越来越多,随之而来的就是数据库压力会越来越大。

我们可能会采取各种方式去优化,比如之前文章提到的缓存方案,SQL优化等等,除了这些方式以外,这里再分享几个针对数据库优化的常规手段:「数据读写分离」与「数据库Sharding」。这两点基本上是大中型互联网项目中应用的非常普遍的方案了。

下面我们来详细看一看,

一、从读写分离到CQRS

 

(图片来源阿里云)

由于互联网业务场景,大多数是读多写少,因此进行数据库的读写分离是一件非常简单且有效率的方案。
读写分离简单点来说就是把对数据的读操作和写操作进行分开来,让这两种操作去访问不同的数据库,这样的话,就可以减轻数据库的压力了。

例如上图中,数据库会有一个「主实例」,这个主要用来提供写操作的(偶尔也会承担一点读操作),除了「主实例」以外,还会有多个「从实例」(在图中显示的是 只读实例),「从实例」的功能只是用来承担读操作的。

那上面就出现了多个数据库了,在多个数据库之间的数据是怎么保证一致性的呢?

其实,我们常用的数据库就自带这类同步功能,比如 Mysql,它自己有一个master-slave功能,可以实现主库与从库数据的自动同步,是基于二进制日志复制来实现的。在主库进行的写操作,会形成二进制日志,然后Mysql会把这个日志异步的同步到从库上,从库再自动执行一遍这个二进制日志,那么数据就跟主库一致了。

除了Mysql以外,像Oracle等商业数据库都有类似的功能,甚至是网络上还有很多开源的第三方数据同步工具,也有很多成熟好用的。

好了,「主实例」与「从实例」之间的数据同步问题解决了,那现在还有一个问题就是,项目中是怎样让 写请求 去访问「主实例」,让 读请求 去访问「从实例」的,这个路由规则是怎么实现的呢?

常规的有2种方式:

使用编码方式
这个方式主要是靠开发同学在编码的时候,根据读写不同的操作需求,去调用不同的数据源。例如在数据操作层(DAO层)将读数据与写数据分开为两个方法(函数),然后为这两个方法分别指定不同的数据库即可。
但是这种方式有点硬编码的味道了,而且对开发同学而言还得额外关注这个事情,多了一个编码成本且容易不小心忽略掉。

使用中间件
这种方式就是在后端数据库的前面,前置一个 数据库代理服务,如下图的:MySQL-Proxy 是Mysql提供的一个中间件,用于实现读写分离请求,但这个组件实际用的人不多,我们可以选择其它的一些开源的组件替代,例如:MyCat、ProxySQL 等等,但大致的原理比较类似,通过这个图很容易理解这个模式。

 

好了,基础的读写分离就讲完了,但感觉这个方式虽然实用是实用,就是不怎么有逼格。

OK,想要有逼格是吧,满足你,那我们就来聊一聊另一个有逼格的读写分离概念: 「 CQRS 」

CQRS:Command Query Responsibility Segregation
命令(增删改)和查询的责任分离

 

我们还是先看图,通过上图可以简单的理解一下CQRS

CQRS 重点强调的就是 Query(读) 和 Command(写)的分离,在业务上将职责分离清晰,Command 主要做业务逻辑的执行,Query来负责数据查询和展示。同时 这两种操作是基于不同的数据源,甚至是一个是数据库,另外一个是NoSQL都可以,Query去查询的数据源可以直接按照领域模型进行存储,而并不是按照数据模型去存储,这样查询出来就立即可以展示,而不用转换,且查询效率高。

其实CQRS是由鼎鼎大名的 Martin Fowler 提出,搞计算机的应该都认识。想要更深入的去学习CQRS,可以翻看Martin Fowler公开的资料。

二、Sharding(分库分表)

上面讲完了数据库的读写分离,现在我们来聊一下数据库的Sharding。

随着数据库里的数据越来越大,单表查询的性能已经不能满足业务要求了,这个时候就需要进行分表处理了,将大表拆分为若干个小表,不同的分表中数据也不一样,这样可以分散查询压力,提高处理效率。

然而,当表越来越多,所有的数据都在一个数据库上时,网络IO以及文件IO也都会集中在一个数据库上,可能会超过单台服务器的容量, CPU、内存、文件IO、网络IO 都会成为系统的瓶颈,QPS/TPS也会超过单数据库实例的处理极限。那么这个时候就需要对数据库进行分片处理。

因为分表和分库的思路类似,因此下面统一来聊技术方案。
其实分库分表只是我们通俗的便于理解的说话,正确的描述应该是:数据分片

数据的分片主要有2种模式:

  • 垂直拆分

  • 水平拆分

两种拆分应用的场景是不同的:

垂直拆分,是指按照业务模块进行拆分。简单来讲,就是把业务紧密的模块的字段/表放在一起,放在同一个数据库或者服务器上。将不同业务的字段/表进行独立,拆到不同的数据库或者服务器上。比如一个游戏系统中,可以将玩家基本信息与道具公会等信息进行拆分。
如图示例:


(图片来源网络)

水平拆分,是指纯粹的按照某种数据规则/格式进行拆分。例如 按照数据唯一ID的哈希散列拆分、按照数据的日期拆分、按照某种范围拆分等等。水平拆分需要注意的是,随着数据动态的变化,分片数量可能需要随之动态调整,另外就是水平分片是没有考虑业务特征的,因此在进行业务汇总查询或者分片中事物处理的时候就比较麻烦一些。
如图示例:

另外,在实际应用中,两种拆分模式一般会结合在一起使用,效果更佳。

以上就是数据库性能优化之「数据读写分离」与「数据库Sharding」方法,欢迎大家一起交流。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/325982.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

青客宝团队Consul内部分享ppt

Consul 是一个支持多数据中心,分布式,高可用的服务发现和配置共享系统。由 HashiCorp 公司使用 Go 语言开发,基于Raft协议。部署起来非常容易,只需要极少的可执行程序和配置文件,具有绿色、轻量级的特点。 Consul是支持…

2018蓝桥杯省赛---java---C---9(小朋友崇拜圈)

题目描述 思路分析 数组来储存小朋友们的崇拜对象,然后下标1就是对应的小朋友座号,写一个方法找出每一个小朋友的崇拜圈大小,然后找出最大的崇拜圈即可 代码实现 package lanqiao;import java.util.*;public class Main {public static vo…

漫画:什么是时间复杂度

转载自 漫画:什么是时间复杂度 时间复杂度的意义 究竟什么是时间复杂度呢?让我们来想象一个场景: 某一天,小灰和大黄同时加入了一个公司...... 一天过后,小灰和大黄各自交付了代码,两端代码实现的功能…

Visual Studio 和 Team Foundation Server 产品维护及周期策略

1 适用于 Visual Studio 和 Team Foundation Server 2012 - 2017 这些产品遵循 Microsoft 10 年支持生命周期策略(5 年主流支持和 5 年扩展支持),起始日期为主要产品版本向全球 (RTW) 发布的日期。 例如,Visual Studio 2017 于 20…

28. 实现 strStr()---LeetCode---JAVA(今天又是一行超人)

class Solution {public int strStr(String haystack, String needle) {return haystack.indexOf(needle);} }

DevOps通用及版本控制面试题

转载自 DevOps通用及版本控制面试题 通用DevOps面试问题 此类别将包含与任何特定DevOps阶段无关的问题。这里的问题旨在测试您对DevOps的理解,而不是关注特定工具或阶段。 问题一: DevOps和Agile之间的根本区别是什么? 两者之间的差异…

微信和支付宝支付模式详解及实现(.Net标准库)

支付基本上是很多产品都必须的一个模块,大家最熟悉的应该就是微信和支付宝支付了,不过更多的可能还是停留在直接sdk的调用上,甚至和业务系统高度耦合,网上也存在各种解决方案,但大多形式各异,东拼西凑而成。…

.NET遇上Docker - 使用Docker Compose组织Ngnix和.NETCore运行

本文工具准备: Docker for WindowsVisual Studio 2015 与 Visual Studio Tools for Docker或 Visual Studio 2017 需要在安装时选择“容器开发支持”,如图: Docker的思想是将不同的应用放在不同的容器中分开运行,如运行.NetCore …

为什么大公司一定要使用DevOps

转载自 为什么大公司一定要使用DevOps 0 DevOps的意图 究竟什么是DevOps? 要想回答这个问题,首先要明确DevOps这个过程参与的人员是谁?即开发团队和IT运维团队!那么,DevOps的意图是什么呢?即在两个团队之间&#…

怎样访问Springboot项目中static中的资源

第一步 成功启动 第二步 输入 协议://ip:端口/资源的名字 eg http://localhost:8080/06-demo-point.html

asp.net core源码飘香:Logging组件

简介: 作为基础组件,日志组件被其他组件和中间件所使用,它提供了一个统一的编程模型,即不需要知道日志最终记录到哪里去,只需要调用它即可。 使用方法很简单,通过依赖注入ILogFactory(CreateL…

互联网账户系统如何设计

转载自 互联网账户系统如何设计 在很多互联网公司业务发展的早期,业务模式比较单一的情况下,涉及用户账户资金交易相关的逻辑也比较简单,但是随着公司业务模式的不断创新及类型的多元化发展,会渐渐发现现有系统账户逻辑越来越雍…

数组(ArrayList)底层怎样扩容

ArrayList维护了数组transient Object[] elementData; 初始化 数组需要扩容时

Visual Basic 15语言新特性

对于C#的两个重要特性元组和Ref返回值,Visual Basic 15提供了对等的实现。这两个特性都是“不完全的”,但已经可以提供足够的变通方案,让VB应用程序可以消费使用了这些特性的C#库。 元组 在VB中,从单个函数调用直接返回多个值是…

Struts2面试问题

转载自 Struts2面试问题 1.什么是Struts2? Apache Struts2是一个用Java构建Web应用程序的开源框架。Struts2基于OpenSymphony WebWork框架。它从Struts1中得到了很大的改进,使其更加灵活,易于使用和扩展。Struts2的核心组件是Action&…

谷歌工程师文化中的几个核心原则

转载自 谷歌工程师文化中的几个核心原则 每周,一组谷歌员工都会在厕所的墙壁上粘贴一页来分享本周的测试小建议。有时这页纸会讨论依赖注入,并提供一个简单的示例展示如何用不同语言使用它;有时它可能会分享如何安装一个用于测量团队代码库…

初探CSRF在ASP.NET Core中的处理方式

前言 前几天,有个朋友问我关于AntiForgeryToken问题,由于对这一块的理解也并不深入,所以就去研究了一番,梳理了一下。 在梳理之前,还需要简单了解一下背景知识。 AntiForgeryToken 可以说是处理/预防CSRF的一种处理…

HBase体系架构说明

HBase体系架构说明! client:两种—-Hbase shell 命令行接口 JavaAPI client访问Region不能直接访问,首先client需要先连接到zookeeper,zookeeper管理HMaster,说明,hdfs集群,在没有zookeepe…

asp.net core 编译mvc,routing,security源代码进行本地调试

因为各种原因,需要查看asp.net core mvc的源代码来理解运行机制等等,虽说源代码查看已经能很好的理解了。但是能够直接调试还是最直观的。所有就有了本次尝试。因调试设置源代码调试太辍笔,所以不用这个方法,转而使用编译源代码的…

并查集判断是否有环存在

题目描述 思路分析 代码实现 package com.atguigu.disjointSet;public class djset {public static int VERTICES6;public static void initialise(int parent[]){int i;for (i 0; i < VERTICES; i) {parent[i]-1;}}public static int find_root(int x,int parent[]){int …