一文看懂mycat配置--数据库的读写分离、分表分库

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

⼀⽂看懂mycat配置--数据库的读写分离、分表分库概述
系统开发中，数据库是⾮常重要的⼀个点。

除了程序的本⾝的优化，如：SQL语句优化、代码
优化，数据库的处理本⾝优化也是⾮常重要的。

主从、热备、分表分库等都是系统发展迟早会
遇到的技术问题问题。

Mycat是⼀个⼴受好评的数据库中间件，已经在很多产品上进⾏使⽤了。

今天主要带⼤家了解下mycat的相关配置，mycat配置后才可以去做数据库的读写分离、分表分
库。

a31dcbd3eb9.jpeg
mycat⽬录
MyCAT 配置解析
Mycat的配置⽂件都在conf⽬录⾥⾯，这⾥介绍⼏个常⽤的⽂件
84975f54f84.jpeg
Mycat的架构其实很好理解，Mycat是代理，Mycat后⾯就是物理数据库。

和Web服务器的Nginx
类似。

对于使⽤者来说，访问的都是Mycat，不会接触到后端的数据库。

⼀、wrapper.conf
配置jdk:
mand=/usr/local/jdk1.8.0_131/bin/java
⼆、server.xml
1、user标签
<user name="root">
<property name="password"></property>
<property name="schemas">TESTDB</property>
</user>
user⽤户配置节点
l --name登录的⽤户名，也就是连接Mycat的⽤户名
l --password登录的密码，也就是连接Mycat的密码
l --schemas数据库名，这⾥会和schema.xml中的配置关联，多个⽤逗号分开，例如需要这个⽤户需要管理两个数据库db1,db2，则配置db1,dbs
2、privileges标签
对⽤户的 schema以及表进⾏精细化的DML权限控制
<privileges check="false">
</privileges>
--check表⽰是否开启DML权限检查。

默认是关闭。

server.dtd⽂件中 <!ELEMENT privileges (schema)*> 说明可以有多个schema的配置。

--dml顺序说明：insert,update,select,delete
<schema name="db1" dml="0110" >
<table name="tb01" dml="0000"></table>
<table name="tb02" dml="1111"></table>
</schema>
db1的权限是update,select。

tb01的权限是啥都不能⼲。

tb02的权限是insert,update,select,delete。

其他表默认是udpate,select。

3. system标签
这个标签内嵌套的所有 property 标签都与系统配置有关。

<property name="charset">utf8</property>
字符集
<property name="processors">1</property>
处理线程数量，默认是cpu数量。

<property name="processorBufferChunk">4096</property>
每次读取留的数量，默认4096。

<property name="processorBufferPool">409600</property>
创建共享buffer需要占⽤的总空间⼤⼩。

processorBufferChunk*processors*100。

<property name="processorBufferPoolType">0</property>
默认为0。

0表⽰DirectByteBufferPool，1表⽰ByteBufferArena。

<property name="processorBufferLocalPercent">100</property>
⼆级共享buffer是processorBufferPool的百分⽐，这⾥设置的是百分⽐。

<property name="sequnceHandlerType">100</property>
全局ID⽣成⽅式。

(0:为本地⽂件⽅式，1:为数据库⽅式；2:为时间戳序列⽅式；3:为ZK⽣成ID；4:为ZK递增ID⽣成。

<property name="useCompression">1</property>
是否开启mysql压缩协议。

1为开启，0为关闭，默认关闭。

<property name="packetHeaderSize">4</property>
指定 Mysql 协议中的报⽂头长度。

默认 4。

<property name="maxPacketSize">16M</property>
指定 Mysql 协议可以携带的数据最⼤长度。

默认 16M。

<property name="idleTimeout">1800000</property>
指定连接的空闲超时时间。

某连接在发起空闲检查下，发现距离上次使⽤超过了空闲时间，那么这个连接会被回收，就是被直接的关闭掉。

默认 30 分钟，单位毫秒。

<property name="txIsolation">3</property>
前端连接的初始化事务隔离级别，只在初始化的时候使⽤，后续会根据客户端传递过来的属性对后端数据库连接进⾏同步。

默认为 REPEATED_READ，设置值为数字默认 3。

READ_UNCOMMITTED = 1;
READ_COMMITTED = 2;
REPEATED_READ = 3;
SERIALIZABLE = 4;
<property name="sqlExecuteTimeout">300</property>
SQL 执⾏超时的时间，Mycat 会检查连接上最后⼀次执⾏ SQL 的时间，若超过这个时间则会直接关闭这连接。

默认时间为 300 秒，单位秒。

<property name="processorCheckPeriod">1000</property>
清理 NIOProcessor 上前后端空闲、超时和关闭连接的间隔时间。

默认是 1 秒，单
位毫秒。

<property name="dataNodeIdleCheckPeriod">300000</property>
对后端连接进⾏空闲、超时检查的时间间隔，默认是 300 秒，单位毫秒。

<property name="dataNodeHeartbeatPeriod">10000</property>
对后端所有读、写库发起⼼跳的间隔时间，默认是 10 秒，单位毫秒。

<property name="bindIp">0.0.0.0</property>
mycat 服务监听的IP 地址，默认值为 0.0.0.0。

<property name="serverPort">8066</property>
定义 mycat 的使⽤端⼝，默认值为 8066。

<property name="managerPort">9066</property>
定义 mycat 的管理端⼝，默认值为 9066。

<property name="fakeMySQLVersion">5.6</property>
mycat 模拟的mysql 版本号，默认值为 5.6 版本，如⾮特需，不要修改这个值，⽬前⽀持设置5.5,5.6,5.7 版本，其他版本可能会有问题。

<property name="useSqlStat">0</property>
是否开启实时统计。

1为开启；0为关闭。

<property name="useGlobleTableCheck">0</property>
是否开启全局表⼀致性检测。

1为开启；0为关闭。

<property name="handleDistributedTransactions">0</property>
分布式事务开关。

0为不过滤分布式事务；1为过滤分布式事务；2 为不过滤分布式事务,但是记
录分布式事务⽇志。

<property name="maxStringLiteralLength">65535</property>
默认是65535。

64K ⽤于sql解析时最⼤⽂本长度
以上举例的属性仅仅是⼀部分，可以配置的变量很多，具体可以查看SystemConfig这个类的属性内容。

System标签下的属性，⼀般是上线后，需要根据实际运⾏的情况，分析后调优的时候进⾏修改。

4. Firewall标签
顾名思义，这个就是关于防⽕墙的设置，也就是在⽹络层对请求的地址进⾏限制，主要是从安全⾓度来保证Mycat不被匿名IP进⾏访问
<firewall>
<whitehost>
<host host="127.0.0.1" user="mycat"/>
<host host="127.0.0.2" user="mycat"/>
</whitehost>
<blacklist check="false">
</blacklist>
</firewall>
设置很简单，很容易理解，只要设置了⽩名单，表⽰开启了防⽕墙，只有⽩名单的连接才可以进⾏连接。

三、schema.xml
3988c175452.jpeg
--schema数据库设置，此数据库为逻辑数据库，name与server.xml中schema对应
--dataNode分⽚信息，也就是分库相关配置
--dataHost物理数据库，真正存储数据的数据库
1、schema标签
<schema name="TESTDB" checkSQLschema="false" sqlMaxLimit="10">
</schema>
schema标签⽤来定义mycat实例中的逻辑库，mycat可以有多个逻辑库，每个逻辑库都有⾃⼰的相关配置。

可以使⽤schema标签来划分这些不同的逻辑库
如果不配置schema标签，所有表的配置会属于同⼀个默认的逻辑库。

逻辑库的概念和MySql的
database的概念⼀样，我们在查询两个不同逻辑库中的表的时候，需要切换到该逻辑库下进⾏查询。

--name逻辑数据库名，与server.xml中的schema对应
--checkSQLschema数据库前缀相关设置，当该值为true时，例如我们执⾏语句select * from pany 。

mycat会把语句修改为 select * from company 去掉TESTDB。

--sqlMaxLimit当该值设置为某个数值时，每条执⾏的sql语句，如果没有加上limit语句，Mycat会⾃动加上对应的值。

不写的话，默认返回所有的值。

需要注意的是，如果运⾏的schema为⾮拆分库的，那么该属性不会⽣效。

需要⾃⼰sql语句加limit。

2、table标签
<table name="travelrecord" dataNode="dn1,dn2,dn3" rule="auto-sharding-long" />
<table name="company" primaryKey="ID" type="global" dataNode="dn1,dn2,dn3" />
--name表名，物理数据库中表名
--dataNode表存储到哪些节点，多个节点⽤逗号分隔。

节点为下⽂dataNode设置的name
--primaryKey主键字段名，⾃动⽣成主键时需要设置
--autoIncrement是否⾃增
--rule分⽚规则名，具体规则下⽂rule详细介绍
--type 该属性定义了逻辑表的类型，⽬前逻辑表只有全局表和普通表。

全局表： global 普通表：⽆
注：全局表查询任意节点，普通表查询所有节点效率低
--autoIncrement mysql对⾮⾃增长主键，使⽤last_insert_id() 是不会返回结果的，只会返回0.所以，只有定义了⾃增长主键的表，才可以⽤last_insert_id()返回主键值。

mycat提供了⾃增长主键功能，但是对应的mysql节点上数据表，没有auto_increment,那么在mycat层调⽤last_insert_id()也是不会返回结果的。

--needAddLimit 指定表是否需要⾃动的在每个语句后⾯加上limit限制，由于使⽤了分库分表，数据量有时候会特别庞⼤，这时候执⾏查询语句，
忘记加上limt就会等好久，所以mycat⾃动为我们加上了limit 100，这个属性默认为true，可以⾃⼰设置为false禁⽤。

如果使⽤这个功能，最好配合使⽤数据库模式的全局序列。

--subTables分表，分表⽬前不⽀持Join。

1) childTable标签
<table name="customer" primaryKey="ID" dataNode="dn1,dn2" rule="sharding-by-intfile">
<childTable name="c_a" primaryKey="ID" joinKey="customer_id" parentKey="id" />
</table>
--childTable 标签⽤于定义E-R 分⽚的⼦表。

通过标签上的属性与⽗表进⾏关联。

--name⼦表的名称
--joinKey⼦表中字段的名称
--parentKey⽗表中字段名称
--primaryKey同Table
--needAddLimit同Table
3、dataNode标签
<dataNode name="dn1" dataHost="localhost1" database="db1" />
datanode标签定义了mycat中的数据节点，也就是我们所说的数据分⽚。

⼀个datanode标签就是⼀个独⽴的数据分⽚。

例⼦中的表述的意思为，使⽤名字为localhost1数据库实例上的db1物理数据库，这就组成⼀个数据分⽚，最后我们⽤dn1来标⽰这个分⽚。

--name定义数据节点的名字，这个名字需要唯⼀。

我们在table标签上⽤这个名字来建⽴表与分⽚对应的关系
--dataHost⽤于定义该分⽚属于哪个数据库实例，属性与datahost标签上定义的name对应
--database⽤于定义该分⽚属于数据库实例上的具体库。

4、dataHost标签
这个标签直接定义了具体数据库实例，读写分离配置和⼼跳语句。

<dataHost name="localhost1" maxCon="1000" minCon="10" balance="0" writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100">
<heartbeat>select user()</heartbeat>
<writeHost host="hostM1" url="192.168.1.100:3306" user="root" password="123456">
<readHost host="hostS1" url="192.168.1.101:3306" user="root" password="123456" />
</writeHost>
</dataHost>
--name唯⼀标⽰dataHost标签，供上层使⽤
--maxCon指定每个读写实例连接池的最⼤连接。

--minCon指定每个读写实例连接池的最⼩连接，初始化连接池的⼤⼩
--balance负载均称类型
l balance="0"：不开启读写分离机制，所有读操作都发送到当前可⽤的writeHost上
l balance="1"：全部的readHost与stand by writeHost参与select语句的负载均衡，简单的说，当双主双从模式（M1-S1，M2-S2 并且M1 M2互为主备），正常情况下，M2,S1,S2都参与select语句的负载均衡。

l balance="2"：所有读操作都随机的在writeHost、readHost上分发
l balance="3"：所有读请求随机的分发到writeHst对应的readHost执⾏，writeHost不负担读写压⼒。

（1.4之后版本有）
--writeType负载均衡类型。

l writeType="0",所有写操作发送到配置的第⼀个 writeHost，第⼀个挂了切到还⽣存的第⼆个writeHost，重新启动后已切换后的为准，切换记录在配置⽂件中:dnindex.properties .
l writeType="1"，所有写操作都随机的发送到配置的 writeHost。

1.5以后版本废弃不推荐。

--switchType-1不⾃动切换
l 1 默认值⾃动切换
l 2 基于MySql主从同步的状态决定是否切换⼼跳语句为 show slave status
l 3 基于mysql galary cluster 的切换机制（适合集群）1.4.1 ⼼跳语句为 show status like 'wsrep%'
--dbType指定后端链接的数据库类型⽬前⽀持⼆进制的mysql协议，还有其他使⽤jdbc链接的数据库，例如：mongodb，oracle，spark等
--dbDriver指定连接后段数据库使⽤的driver，⽬前可选的值有native和JDBC。

使⽤native的话，因为这个值执⾏的是⼆进制的mysql协议，所以可以使⽤mysql和maridb，其他类型的则需要使⽤JDBC驱动来⽀持。

如果使⽤JDBC的话需要符合JDBC4标准的驱动jar 放到mycat\lib⽬录下，并检查驱动jar包中包括如下⽬录结构⽂件META-INF\services\java.sql.Driver。

在这个⽂件写上具体的driver类名，例如com.mysql.jdbc.Driver
writeHost readHost指定后端数据库的相关配置给mycat，⽤于实例化后端连接池。

--tempReadHostAvailable
如果配置了这个属性 writeHost 下⾯的 readHost 仍旧可⽤，默认 0 可配置（0、1）。

1）heartbeat标签
这个标签内指明⽤于和后端数据库进⾏⼼跳检查的语句。

例如：MYSQL 可以使⽤ select user()，Oracle 可以使⽤ select 1 from dual 等。

2) writeHost /readHost 标签
这两个标签都指定后端数据库的相关配置，⽤于实例化后端连接池。

唯⼀不同的是，writeHost 指定写实例、readHost 指定读实例。

在⼀个 dataHost 内可以定义多个 writeHost 和 readHost。

但是，如果 writeHost 指定的后端数据库宕机，那么这个 writeHost 绑定的所有 readHost 都将不可⽤。

另⼀⽅⾯，由于这个 writeHost 宕机，系统会⾃动的检测到，并切换到备⽤的 writeHost 上去。

这两个标签的属性相同.
--host⽤于标识不同实例，⼀般 writeHost 我们使⽤*M1，readHost我们⽤*S1。

--url后端实例连接地址。

Native：地址：端⼝ JDBC：jdbc的url
--password后端存储实例需要的密码
--user后端存储实例需要的⽤户名字
--weight权重配置在readhost 中作为读节点的权重
--usingDecrypt是否对密码加密，默认0。

具体加密⽅法看官⽅⽂档。

四、Rule.xml
ule.xml ⾥⾯就定义了我们对表进⾏拆分所涉及到的规则定义。

我们可以灵活的对表使⽤不同的分⽚算法，或者对表使⽤相同的算法但具体的参数不同。

包含的标签 tableRule 和 function。

1. tableRule 标签
这个标签定义表规则。

定义的表规则，在 schema.xml：
<tableRule name="rule1">
<rule>
<columns>id</columns>
<algorithm>func1</algorithm>
</rule>
</tableRule>
--name 属性指定唯⼀的名字，⽤于标识不同的表规则。

内嵌的 rule 标签则指定对物理表中的哪⼀列进⾏拆分和使⽤什么路由算法。

--columns 内指定要拆分的列名字。

--algorithm 使⽤function 标签中的 name 属性。

连接表规则和具体路由算法。

当然，多个表规则可以连接到同⼀个路由算法上。

table 标签内使⽤。

让逻辑表使⽤这个规则进⾏分⽚。

2. function 标签
<function name="hash-int" class="org.opencloudb.route.function.PartitionByFileMap">
<property name="mapFile">partition-hash-int.txt</property>
</function>
--name 指定算法的名字。

--class 制定路由算法具体的类名字。

--property 为具体算法需要⽤到的⼀些属性。