Mycat
1.Mycat
分库分表中间件,将存放在一个数据库的数据存放在不同的多个数据库中。来分散负载。
- scheme 逻辑库,对应mysql的数据库,一个逻辑库定义了包含的所有table.是数据库集群对外的统一访问接口。
- table 逻辑表,和物理数据库存储的一张表类似。
这里的表格需要声明所存储的逻辑数据节点,datanode。这里可以指定分片规则。 - DataNode 逻辑数据节点,存放table的具体物理节点,通过datasource来关联到后端的某个具体数据库上
- datasource,定义某个物理库的访问地址,用于捆绑到datanode上。
2.垂直切分与水平切分的不同
垂直切分,一个表很大字段很多,将它拆成多个表。比如订单表,有一些常见的不变的字段,比如订单金额之类的,下单人,电话留言等信息。还有一些状态信息,下单时间,发货时间,付款时间,退货时间以及对应的状态变化等等,将这两个就可以垂直拆分成两个表。
优点:拆分后业务清晰,拆分规则明确。
缺点:部分业务表无法join,只能通过接口解决,提高系统复杂度。
水平切分:根据表中的数据的逻辑关系,将一张表的数据按照某种条件拆分到多台数据库上面。
比如将用户id,取模,为1进第一个库,为2,3,0进2,3,4库。
优点:负载均衡的更好。
缺点:拆分规则不好想象,扩展和维护比较难,join比较难。
3.核心配置文件
scheme.xml 配置逻辑库,逻辑表,数据节点,节点主机
<?xml version="1.0"?>
<!DOCTYPE mycat:schema SYSTEM "schema.dtd">
<mycat:schema xmlns:mycat="http://io.mycat/"><schema name="mydatabase" checkSQLschema="true" sqlMaxLimit="100"><table name="t_user" dataNode="dn1,dn2,dn3" primaryKey="id" rule="auto-sharding-long"><childTable name="t_loginlog" primaryKey="id" joinKey="user_id" parentKey="id"></childTable></table><table name="t_student" dataNode="dn1,dn3" primaryKey="id" rule="student_id" /><table name="t_dictionaries" dataNode="dn1,dn2,dn3" type="global" /><table name="t_teacher" dataNode="dn1" /></schema><dataNode name="dn1" dataHost="dtHost1" database="db1" /><dataNode name="dn2" dataHost="dtHost1" database="db2" /><dataNode name="dn3" dataHost="dtHost2" database="db3" /><!--name:节点名称,在上方dataNode标签中调用maxCon:底层数据库的链接最大数minCon:底层数据库的链接最小数balance:值可以为0,1,2,3,分别表示对当前datahost中维护的数据库们的读操作逻辑0:不开启读写分离,所有的读写操作都在最小的索引号的writeHost(第一个writeHost标签)1:全部的readHost和备用writeHost都参与读数据的平衡,如果读的请求过多,负责写的第一个writeHost也分担一部分2 :所有的读操作,都随机的在所有的writeHost和readHost中进行3 :所有的读操作,都到writeHost对应的readHost上进行(备用writeHost不参加了),在集群中没有配置ReadHost的情况下,读都到第一个writeHost完成writeType:控制当前datahost维护的数据库集群的写操作0:所有的写操作都在第一个writeHost标签的数据库进行1:所有的写操作,都随机分配到所有的writeHost(mycat1.5完全不建议配置了)dbtype:数据库类型(不同数据库配置不同名称,mysql)dbDriver:数据库驱动,native,动态获取switchType:切换的逻辑-1:故障不切换1:故障切换,当前写操作的writeHost故障,进行切换,切换到下一个writeHost;slaveThreshold:标签中的<heartbeat>用来检测后端数据库的心跳sql语句;本属性检查从节点与主节点的同步情况(延迟时间数),配合心跳语句show slave status; 读写分离时,所有的readHost的数据都可靠--><dataHost name="dtHost1" maxCon="1000" minCon="10" balance="1"writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100"><!--用于验证心跳,这个是mysql主库的配置--><heartbeat>select user()</heartbeat><writeHost host="127.0.0.1" url="192.168.199.11:3306" user="root" password="123456"><readHost host="127.0.0.1" url="192.168.199.12:3306" user="root" password="123456" /></writeHost></dataHost><dataHost name="dtHost2" maxCon="1000" minCon="10" balance="1"writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100"><!--用于验证心跳,这个是mysql主库的配置--><heartbeat>select user()</heartbeat><writeHost host="127.0.0.1" url="192.168.199.13:3306" user="root" password="123456"><readHost host="127.0.0.1" url="192.168.199.13:3306" user="root" password="123456" /></writeHost></dataHost>
</mycat:schema>
server.xml 连接mycat的用户信息,账号密码
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE mycat:server SYSTEM "server.dtd">
<mycat:server xmlns:mycat="http://io.mycat/"><system><!--配置的端口号--><property name="serverPort">8066</property><property name="nonePasswordLogin">0</property> <!-- 0为需要密码登陆、1为不需要密码登陆 ,默认为0,设置为1则需要指定默认账户--><property name="useHandshakeV10">1</property><property name="useSqlStat">0</property> <!-- 1为开启实时统计、0为关闭 --><property name="useGlobleTableCheck">0</property> <!-- 1为开启全加班一致性检测、0为关闭 --><property name="sequnceHandlerType">2</property><property name="subqueryRelationshipCheck">false</property> <!-- 子查询中存在关联查询的情况下,检查关联字段中是否有分片字段 .默认 false --><!--默认为type 0: DirectByteBufferPool | type 1 ByteBufferArena | type 2 NettyBufferPool --><property name="processorBufferPoolType">0</property><!--默认是65535 64K 用于sql解析时最大文本长度 --><!--<property name="maxStringLiteralLength">65535</property>--><!--<property name="sequnceHandlerType">0</property>--><!--<property name="backSocketNoDelay">1</property>--><!--<property name="frontSocketNoDelay">1</property>--><!--<property name="processorExecutor">16</property>--><!--<property name="serverPort">8066</property> <property name="managerPort">9066</property> <property name="idleTimeout">300000</property> <property name="bindIp">0.0.0.0</property> <property name="frontWriteQueueSize">4096</property> <property name="processors">32</property> --><!--分布式事务开关,0为不过滤分布式事务,1为过滤分布式事务(如果分布式事务内只涉及全局表,则不过滤),2为不过滤分布式事务,但是记录分布式事务日志--><property name="handleDistributedTransactions">0</property><!--off heap for merge/order/group/limit 1开启 0关闭--><property name="useOffHeapForMerge">1</property><!--单位为m--><property name="memoryPageSize">64k</property><!--单位为k--><property name="spillsFileBufferSize">1k</property><property name="useStreamOutput">0</property><!--单位为m--><property name="systemReserveMemorySize">384m</property><!--是否采用zookeeper协调切换 --><property name="useZKSwitch">false</property><!-- XA Recovery Log日志路径 --><!--<property name="XARecoveryLogBaseDir">./</property>--><!-- XA Recovery Log日志名称 --><!--<property name="XARecoveryLogBaseName">tmlog</property>--><!--如果为 true的话 严格遵守隔离级别,不会在仅仅只有select语句的时候在事务中切换连接--><property name="strictTxIsolation">false</property><property name="useZKSwitch">true</property></system><!-- 全局SQL防火墙设置 --><!--白名单可以使用通配符%或着*--><!--例如<host host="127.0.0.*" user="root"/>--><!--例如<host host="127.0.*" user="root"/>--><!--例如<host host="127.*" user="root"/>--><!--例如<host host="1*7.*" user="root"/>--><!--这些配置情况下对于127.0.0.1都能以root账户登录--><!-- 此处是开放了本机和外网的请求链接,因为我的mycat安装在虚拟机上,所以本机是通过ip链接192.*是为了让navicat可以连接使用(配置完整的虚拟机IP也可以)127.*是为了让虚拟机本身可以通过命令连接--><firewall><whitehost><host host="192.*" user="root"/><host host="127.*" user="root"/></whitehost><blacklist check="false"></blacklist></firewall><!-- 此处定义了一个root用户,可以管理的逻辑库为mydatabase,对应schema.xml中的<schema name="mydatabase" > --><user name="root" defaultAccount="true"><property name="password">123456</property><property name="schemas">mydatabase</property><!-- 表级 DML 权限设置 --><!-- <privileges check="false"><schema name="TESTDB" dml="0110" ><table name="tb01" dml="0000"></table><table name="tb02" dml="1111"></table></schema></privileges> --></user><!--<user name="user"><property name="password">123456</property><property name="schemas">mycat1,test3</property><property name="readOnly">true</property></user>-->
</mycat:server>
rule.xml 分片规则
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE mycat:rule SYSTEM "rule.dtd">
<mycat:rule xmlns:mycat="http://io.mycat/">
<!--schema.xml中配置的rule="student_id" 所对应的规则,规则对应主键,
列名为id需要与数据库的列名对应algorithm对应下方function--><tableRule name="student_id"><rule><columns>id</columns><algorithm>student_text</algorithm></rule></tableRule><tableRule name="rule1"><rule><columns>id</columns><algorithm>func1</algorithm></rule></tableRule><tableRule name="rule2"><rule><columns>user_id</columns><algorithm>func1</algorithm></rule></tableRule><tableRule name="sharding-by-intfile"><rule><columns>sharding_id</columns><algorithm>hash-int</algorithm></rule></tableRule><tableRule name="auto-sharding-long"><rule><columns>id</columns><algorithm>rang-long</algorithm></rule></tableRule><tableRule name="mod-long"><rule><columns>id</columns><algorithm>mod-long</algorithm></rule></tableRule><tableRule name="sharding-by-murmur"><rule><columns>id</columns><algorithm>murmur</algorithm></rule></tableRule><tableRule name="crc32slot"><rule><columns>id</columns><algorithm>crc32slot</algorithm></rule></tableRule><tableRule name="sharding-by-month"><rule><columns>create_time</columns><algorithm>partbymonth</algorithm></rule></tableRule><tableRule name="latest-month-calldate"><rule><columns>calldate</columns><algorithm>latestMonth</algorithm></rule></tableRule><tableRule name="auto-sharding-rang-mod"><rule><columns>id</columns><algorithm>rang-mod</algorithm></rule></tableRule><tableRule name="jch"><rule><columns>id</columns><algorithm>jump-consistent-hash</algorithm></rule></tableRule>
<!--在conf中需要添加student_text.txt规则文件-->
<!--
文件内容:0-1M=01M-2M=1
--><function name="student_text"class="io.mycat.route.function.AutoPartitionByLong"><property name="mapFile">student_text.txt</property></function><function name="murmur"class="io.mycat.route.function.PartitionByMurmurHash"><property name="seed">0</property><!-- 默认是0 --><property name="count">2</property><!-- 要分片的数据库节点数量,必须指定,否则没法分片 --><property name="virtualBucketTimes">160</property><!-- 一个实际的数据库节点被映射为这么多虚拟节点,默认是160倍,也就是虚拟节点数是物理节点数的160倍 --><!-- <property name="weightMapFile">weightMapFile</property> 节点的权重,没有指定权重的节点默认是1。以properties文件的格式填写,以从0开始到count-1的整数值也就是节点索引为key,以节点权重值为值。所有权重值必须是正整数,否则以1代替 --><!-- <property name="bucketMapPath">/etc/mycat/bucketMapPath</property> 用于测试时观察各物理节点与虚拟节点的分布情况,如果指定了这个属性,会把虚拟节点的murmur hash值与物理节点的映射按行输出到这个文件,没有默认值,如果不指定,就不会输出任何东西 --></function><function name="crc32slot"class="io.mycat.route.function.PartitionByCRC32PreSlot"></function><function name="hash-int"class="io.mycat.route.function.PartitionByFileMap"><property name="mapFile">partition-hash-int.txt</property></function><function name="rang-long"class="io.mycat.route.function.AutoPartitionByLong"><property name="mapFile">autopartition-long.txt</property></function><function name="mod-long" class="io.mycat.route.function.PartitionByMod"><!-- how many data nodes --><property name="count">3</property></function><function name="func1" class="io.mycat.route.function.PartitionByLong"><property name="partitionCount">8</property><property name="partitionLength">128</property></function><function name="latestMonth"class="io.mycat.route.function.LatestMonthPartion"><property name="splitOneDay">24</property></function><function name="partbymonth"class="io.mycat.route.function.PartitionByMonth"><property name="dateFormat">yyyy-MM-dd</property><property name="sBeginDate">2015-01-01</property></function><function name="rang-mod" class="io.mycat.route.function.PartitionByRangeMod"><property name="mapFile">partition-range-mod.txt</property></function><function name="jump-consistent-hash" class="io.mycat.route.function.PartitionByJumpConsistentHash"><property name="totalBuckets">3</property></function>
</mycat:rule>
未完待续,祝大家明天面试顺利。很多知识目前都是为了面试,很凌乱,以后补充。