31. 主从复制

一、主从复制概述

1.1、如何提升数据库并发能力

??在实际工作中，我们常常把Redis作为缓存与MySQL配合使用，当有请求的时候，首先会从缓存中进行查找。如果存在就直接取出。如果不存在再访问数据库，这样就提升了读取的效率，也减少了对后端数据库的访问压力。Redis的缓存架构是高并发架构中非常重要的一环。

??此外，一般应用对数据库而言都是“读多写少”，也就说对数据库读取数据的压力比较大，有一个思路就是采用数据库集群的方案，做主从架构、进行读写分离，这样同样可以提升数据库的并发处理能力。但并不是所有的应用都需要对数据库进行主从架构的设置，毕竟设置架构本身是有成本的。

??如果我们的目的在于提升数据库高并发访问的效率，那么首先考虑的是如何优化SQL和索引，这种方式简单有效；其次才是采用缓存的策略，比如使用Redis将热点数据保存在内存数据库中，提升读取的效率；最后才是对数据库采用主从架构，进行读写分离。

1.2、主从复制的作用

??主从同步设计不仅可以提高数据库的吞吐量，还有以下3个方面的作用。

读写分离
- 我们可以通过主从复制的方式来同步数据，然后通过读写分离来提高数据库并发处理能力。其中一个是Master主库，负责写入数据，我们称之为：写库。其它都是Slave从库，负责读取记录，我们称之为：读库。当主库进行更换新的时候，会自动将数据复制到从库中，而我们在客户端读取数据的时候，会从从库中进行读取。面对“读多写少”的需求，采用读写分离的方式，可以实现更高的并发访问。同时，我们还能对从服务器进行负载均衡，让不同的读请求按照策略均匀地分发到不同的从服务器上，让读取更加顺畅。读取更加顺畅的另一个原因，就是减少了锁表的影响，比如我们让主库负责写，当主库出现写锁的时候，不会影响到从库进行SELECT的读取。
数据备份
- 我们通过主从复制将主库上的数据复制到了从库上，相当于是一种热备份机制，也就是在主库正常运行的情况下进行的备份，不会影响到服务。
具有高可用性
- 数据备份骑士是一种冗余的机制，通过这种冗余的方式可以换取数据库的高可用性，也就是当服务器出现故障或宕机的情况下，可以切换到从服务器上，保证服务的正常运行。关于高可用性的程度，我们可以用一个指标衡量，即正常可用时间/全年时间。实际上，更高的高可用性，意味着需要付出更高的成本代价。在现实中，我们需要结合业务需求和成本进行选择。

二、主从复制的原理

??Slave会从Master读取binlog来进行数据同步。

2.1、原理剖析

2.1.1、三个线程

??实际上主从同步的原理就是基于binlog进行数据同步的。在主从复制过程中，会基于3个线程来操作，一个主库线程，两个从库线程。

??二进制日志转储线程（Binlog dump thread）是一个主库线程。当从库线程连接的时候，主库可以将二进制日志发送给从库，当主库读取事件（Event）的时候，会在Binlog上加锁，读取完成之后，再将锁释放掉。

??从库I/O线程会连接到主库，向主库发送请求更新Binlog。这时从库的I/O线程就可以读取到主库的二进制日志转储线程发送的Binlog更新部分，并且拷贝到本地的中继日志（Relay log）。

??从库SQL线程会读取从库中的中继日志，并且执行日志中的事件，将从库中的数据与主库保持同步。

不是所有版本的MySQL都默认开启服务器的二进制日志。在进行主从同步的时候，我们需要先检查服务器是否已经开启了二进制日志。
除非特殊指定，默认情况下从服务器会执行所有主服务器中保存的事件。也可以通过配置，使从服务器执行特定的事件。

2.1.2、复制三步骤

Master将写操作记录到二进制日志（binlog）。这些记录叫做二进制日志事件（binary log events）；
Slave将Master的binary log events拷贝到它的中继日志（relay log）；
Slave重做中继日志中的事件，将改变应用到自己的数据库中。 MySQL复制是异步的且串行化的，而且重启后从接入点开始复制

2.1.3、复制的问题

??复制的最大问题：延时

2.1.4、复制的基本原则

每个Slave只有一个Master
每个Slave只能有一个唯一的服务器ID
每个Master可以有多个Slave

三、一主一从架构搭建

??一台主机用于处理所有写请求，一台从机负责所有读请求。

3.1、主机配置文件

??建议mysql版本一致且后台以服务运行，主从所有配置项都配置在 [mysqld] 节点下，且都是小写字母。

必选
- 主服务器唯一ID（server-id）
- 启用二进制日志,指名路径（log-bin）
可选
- read-only： 0（默认）表示读写（主机），1表示只读（从机）
- 设置日志文件保留的时长，单位是秒（binlog_expire_logs_seconds）
- 控制单个二进制日志大小。此参数的最大和默认值是1GB（max_binlog_size）
- 设置不要复制的数据库（binlog-ignore-db）
- 设置需要复制的数据库,默认全部记录（binlog-do-db）
- 设置binlog格式（binlog_format）

重启后台mysql服务，使配置生效
先搭建完主从复制，再创建数据库
MySQL主从复制起始时，从机不继承主机数据

binlog格式设置：

STATEMENT模式（基于SQL语句的复制(statement-based replication, SBR)）：每一条会修改数据的sql语句会记录到binlog中。这是默认的binlog格式。
- SBR 的优点：
  - 不需要记录每一行的变化，减少了binlog日志量，文件较小
  - binlog中包含了所有数据库更改信息，可以据此来审核数据库的安全等情况
  - binlog可以用于实时的还原，而不仅仅用于复制
  - 主从版本可以不一样，从服务器版本可以比主服务器版本高
- SBR 的缺点：
  - 不是所有的UPDATE语句都能被复制，尤其是包含不确定操作的时候
  - 使用以下函数的语句也无法被复制：LOAD_FILE()、UUID()、USER()、FOUND_ROWS()、SYSDATE() (除非启动时启用了 --sysdate-is-now 选项)
  - INSERT ... SELECT 会产生比 RBR 更多的行级锁
  - 复制需要进行全表扫描(WHERE 语句中没有使用到索引)的 UPDATE 时，需要比 RBR 请求更多的行级锁
  - 对于有 AUTO_INCREMENT 字段的 InnoDB表而言，INSERT 语句会阻塞其他 INSERT 语句
  - 对于一些复杂的语句，在从服务器上的耗资源情况会更严重，而 RBR 模式下，只会对那个发生变化的记录产生影响
  - 执行复杂语句如果出错的话，会消耗更多资源
  - 数据表必须几乎和主服务器保持一致才行，否则可能会导致复制出错
ROW模式（基于行的复制(row-based replication, RBR)）：5.1.5版本的MySQL才开始支持，不记录每条sql语句的上下文信息，仅记录哪条数据被修改了，修改成什么样了。
- RBR 的优点：
  - 任何情况都可以被复制，这对复制来说是最安全可靠的。
  - 多数情况下，从服务器上的表如果有主键的话，复制就会快了很多
  - 复制以下几种语句时的行锁更少：INSERT ... SELECT、包含 AUTO_INCREMENT 字段的 INSERT、没有附带条件或者并没有修改很多记录的 UPDATE 或 DELETE 语句
  - 执行 INSERT，UPDATE，DELETE 语句时锁更少
  - 从服务器上采用多线程来执行复制成为可能
- RBR 的缺点：
  - binlog 大了很多
  - 复杂的回滚时 binlog 中会包含大量的数据
  - 主服务器上执行 UPDATE 语句时，所有发生变化的记录都会写到 binlog 中，而 SBR 只会写一次，这会导致频繁发生 binlog 的并发写问题
  - 无法从 binlog 中看到都复制了些什么语句
MIXED模式（混合模式复制(mixed-based replication, MBR)）：从5.1.8版本开始，MySQL提供了Mixed格式，实际上就是Statement与Row的结合。
- 在Mixed模式下，一般的语句修改使用statment格式保存binlog。如一些函数，statement无法完成主从复制的操作，则采用row格式保存binlog。MySQL会根据执行的每一条具体的sql语句来区分对待记录的日志形式，也就是在Statement和Row之间选择一种。

3.2、从机配置文件

??要求主从所有配置项都配置在 my.cnf 的 [mysqld] 栏位下，且都是小写字母。

必选
- 从服务器唯一ID（server-id）
可选
- 启用中继日志（relay-log）

重启后台mysql服务，使配置生效。
主从机都关闭防火墙

3.3、主机：建立账户并授权

-- 用户名参数表示新建用户的账户，由 用户（User） 和 主机名（Host） 构成；
CREATE USER 用户名 [IDENTIFIED BY '密码'];
GRANT REPLICATION SLAVE ON *.* TO 用户名; 
-- MySQL 8.0之后的版本此语句必须执行。否则见报下面的错误。 
ALTER USER 用户名 IDENTIFIED WITH mysql_native_password BY '密码';
flush privileges;
-- 查询Master的状态，并记录下File和Position的值。
show master status;

注意：在从机执行show slave status\G时报错：
Last_IO_Error: error connecting to master 'slave1@192.168.1.150:3306' - retry-time: 60 retries: 1 message: Authentication plugin 'caching_sha2_password' reported error: Authentication requires secure connection.

3.4、从机：配置需要复制的主机

??步骤1：从机上复制主机的命令，如果之前做过同步，请先关闭，否则有可能报错。

CHANGE MASTER TO 
MASTER_HOST='主机的IP地址', 
MASTER_USER='主机用户名', 
MASTER_PASSWORD='主机用户名的密码', 
MASTER_LOG_FILE='mysql-bin.具体数字', 
MASTER_LOG_POS=具体值;

??步骤2：启动slave同步。如果报错以下错误：slave failed to initialize relay log info structure from the repository。可以执行如下操作：reset slave，删除之前的relay_log信息。然后重新执行 CHANGE MASTER TO ...语句即可。

??接着，查看同步状态：如果Slave_IO_Running和Slave_SQL_Running两个参数都是Yes，则说明主从配置成功！如果Slave_IO_Running为Connecting、Slave_SQL_Running为Yes，则说明主从配置失败！可能错误的原因有：1.网络不通 2.账户密码错误 3.防火墙 4.mysql配置文件问题 5.连接服务器时语法 6.主服务器mysql权限

-- 启动slave同步
START SLAVE;
-- 查看同步状态：
SHOW SLAVE STATUS;

3.5、停止主从同步

停止主从同步命令：stop slave;
如果停止从服务器复制功能，再使用需要重新配置主从。否则会报错。

??重新配置主从，需要在从机上执行：

stop slave; 
reset master; -- 删除Master中所有的binglog文件，并将日志索引文件清空，重新开始所有新的日志文件(慎用)

四、同步数据不一致问题

??主从同步的要求：

读库和写库的数据一致(最终一致)；
写数据必须写到写库；
读数据必须到读库(不一定)；

4.1、理解主从延迟问题

??进行主从同步的内容是二进制日志，它是一个文件，在进行网络传输的过程中就一定会存在主从延迟
，这样就可能造成用户在从库上读取的数据不是最新的数据，也就是主从同步中的数据不一致性问题。

4.2、主从延迟问题原因

??在网络正常的时候，日志从主库传给从库所需的时间是很短的，即T2-T1的值是非常小的。即，网络正常情况下，主备延迟的主要来源是备库接收完binlog和执行完这个事务之间的时间差。主备延迟最直接的表现是，从库消费中继日志（relay log）的速度，比主库生产binlog的速度要慢。造成原因：

从库的机器性能比主库要差
从库的压力大
大事务的执行

4.3、如何减少主从延迟

??若想要减少主从延迟的时间，可以采取下面的办法：

降低多线程大事务并发的概率，优化业务逻辑
优化SQL，避免慢SQL，减少批量操作，建议写脚本以update-sleep这样的形式完成。
提高从库机器的配置，减少主库写binlog和从库读binlog的效率差。
尽量采用短的链路，也就是主库和从库服务器的距离尽量要短，提升端口带宽，减少binlog传输的网络延时。
实时性要求的业务读强制走主库，从库只做灾备，备份。

4.4、如何解决一致性问题

??如果操作的数据存储在同一个数据库中，那么对数据进行更新的时候，可以对记录加写锁，这样在读取的时候就不会发生数据不一致的情况。但这时从库的作用就是备份，并没有起到读写分离，分担主库读压力的作用。读写分离情况下，解决主从同步中数据不一致的问题，就是解决主从之间 数据复制方式的问题，如果按照数据一致*从弱到强来进行划分，有以下3种复制方式。

4.4.1、异步复制

??异步模式就是客户端提交COMMIT之后不需要等从库返回任何结果，而是直接将结果返回给客户端，这样做的好处是不会影响主库写的效率，但可能存在主库宕机，而Binlog还没有同步到从库的情况，也就是此时的主库和从库数据不一致。这时候从从库中选择一个作为新的主机，那么新的主机则可能缺少原来主服务器中已提交的事务。所以，这种复制模式下的数据一致性是最弱的。

4.4.2、半同步复制

??MySQL 5.5版本之后开始支持半同步复制的方式。原理是在客户端提交COMMIT之后不直接将结果返回给客户端，而是等待至少有一个从库接收到了Binlog，并且写入到中继日志中，再返回给客户端。这样做的好处就是提交了数据的一致性，当然相比于异步复制来说，至少增加了一个网络连接的延迟，降低了主库写的效率。

??在MySQL 5.7版本中还增加了一个rpl_semi_sync_master_wait_for_slave_count参数，可以对应答的从库数量进行设置，默认为1，也就是说只要有1个从库进行了响应，就可以返回给客户端。如果将这个参数调大，可以提升数据一致性的强度，但也会增加主库等待从库响应的时间。

4.4.3、组复制

??异步复制和半同步复制都无法最终保证数据的一致性问题，半同步复制是通过判断从库响应的个数来决定是否返回给客户端，虽然数据一致性相比于异步复制有提升，但仍然无法满足对数据一致性要求高的场景，比如金融领域。MGR 很好地弥补了这两种复制模式的不足。

??组复制技术，简称MGR（MySQL Group Replication），是MySQL在 5.7.17 版本中推出的一种新的数据复制技术，这种复制技术是基于Paxos协议的状态机复制。

??首先我们将多个节点共同组成一个复制组，在执行读写（RW）事务的时候，需要通过一致性协议层（Consensus 层）的同意，也就是读写事务想要进行提交，必须要经过组里“大多数人”（对应 Node 节点）的同意，大多数指的是同意的节点数量需要大于（N/2+1），这样才可以进行提交，而不是原发起方一个说了算。而针对只读（RO）事务则不需要经过组内同意，直接COMMIT即可。

??在一个复制组内有多个节点组成，它们各自维护了自己的数据副本，并且在一致性协议层实现了原子消息和全局有序消息，从而保证组内数据的一致性。

02.SQL与JDBC 主从复制

31. 主从复制

一、主从复制概述

1.1、如何提升数据库并发能力

1.2、主从复制的作用

二、主从复制的原理

2.1、原理剖析

2.1.1、三个线程

2.1.2、复制三步骤

2.1.3、复制的问题

2.1.4、复制的基本原则

三、一主一从架构搭建

3.1、主机配置文件

3.2、从机配置文件

3.3、主机：建立账户并授权

3.4、从机：配置需要复制的主机

3.5、停止主从同步

四、同步数据不一致问题

4.1、理解主从延迟问题

4.2、主从延迟问题原因

4.3、如何减少主从延迟

4.4、如何解决一致性问题

4.4.1、异步复制

4.4.2、半同步复制

4.4.3、组复制

相关

001.MySQL高可用主从复制简介

Mysql主从复制原理

Docker部署Redis主从复制模式

MySQL 主从复制(实时热备)原理与配置

故障分析--主从复制故障1

mysql主从复制简介

关于MySQL数据库主从复制不同步问题

MySQL 主从复制相关

Docker 搭建 MySQL8.0 主从复制环境

二、主从复制

Docker高阶篇-Mysql 主从复制

redis 4.x及以上的未授权访问(主从复制RCE)

标签