MySQL的高可扩展和高可用

# 分区表

# 工作原理

对用户而言，分区表是一个独立的逻辑表，但是底层MySQL将其分成了多个物理子表，这对用户来说是透明的，每一个分区表都会使用一个独立的表文件。对代码而言不需要任何的改变。

创建表时使用partition by子句定义每个分区存放的数据，执行查询时，优化器会根据分区定义过滤哪些没有我们需要数据的分区。这样查询只查询所需数据所在的空间。

# 适用场景

表非常大，无法全部存在内存，或者只在表的最后有点热点数据，其他都是历史数据。
分区表的数据更易维护，可以对独立的分区进行独立的操作。
分区表的数据可以分布在不同的机器上，从而高效的利用资源
可以使用分区表避免某些瓶颈

# 限制

一个表最多有1024个分区
2.5.1版本中，分区表表达式必须是整数，5.5可以使用列分区。
分区字段中如果有主键和唯一索引列，那么主键和唯一索引必须包含进来
分区表中无法使用外键约束
需要对现有表的结构修改
所有分区必须使用相同的存储引擎
分区函数中可以使用的函数和表达式会有一些限制
某些存储引擎不支持分区
对于MyISAM的分区表不能使用load into cache
对于MyISAM表，使用分区表时需要打开更多的文件描述符

# 分库分表

# 工作原理

通过hash算法或者一些工具，将数据表垂直或者水平进行物理拆分

# 适用场景

单表级别达到了百万或者千万级别
解决表锁的问题

# 分表方式

# 水平分表

水平分割：表很大，分割后可以降低在查询时读取的数据和索引的页数，同时也降低了索引的层数，提高了查询速度。

# 适用场景

表中的数据具有独立性，例如表中分别记录各个地区的数据或者不同时期的数据，特别是有些数据常用，有些数据不常用。
需要把数据放在不同介质上

# 缺点

给应用增加复杂度，通常查询时需要多个表名，查询的数据需要进行UNION操作
在许多数据库应用中，这种复杂性会超过它锁带来的优点，查询时会增加读一个索引层的磁盘次数。

# 垂直分表

把主键和一些列放在一个表，再把主键和另外一些列放在另一个表

# 适用场景

把常用的列和不常用的列进行拆分
可以使数据行变小，一个数据页可以存储更多的数据，查询时减少I/O次数

# 缺点

管理冗余列，查询时需要进行join操作

# 两者的缺点

有些分表基于应用层的算法，一旦算法改变整个分表的逻辑改变，扩展性比较差
对于应用层来说，逻辑算法会增加开发成本

# MySQL的复制原理及负载均衡

# 原理

在主库上把数据的更改记录到二进制日志中，从库把主库的日志复制到自己的中继日志，从库读取中继日志中的事件，将其重放到从库数据中。

# 解决的问题

数据的分布：随意的停止和开始复制，并在不同地理位置分布数据备份
负载均衡：降低单个服务器的压力
高可用和故障切换：帮助应用程序避免单点失败
升级测试：可以使用更高版本的MySQL作为从库进行测试

#MySQL面试题

上次更新: 2020/12/31, 06:55:18

← MySQL的SQL优化 MySQL安全→

01
MVC对比 12-31

02
负载均衡 12-31

03
数据库缓存优化 12-31

更多文章>