MySQL相关参数总结
保留个原文链接,避免被爬虫爬了过去,以便后续更正补充:
MySQL参数繁多,是一个需要根据具体业务、软硬件环境、负载压力、性能需求、数据异常的容忍程度等等信息综合考量的结果,不是一成不变的(当然,某些参数保持默认值就够了)。
想管好数据库,必须理解数据库的一些配置选项,以及其背景因素。
陆陆续续收集整理了好多MySQL相关的参数,总是觉得串不起来,总结归类之后,立马就清晰了很多,提到一个参数,首先会往分门别类,类别是什么,作用是什么,有哪些相关的知识点,需要注意什么。
这里根据个人的思路,用xmind做了一个归类总结以及说明,后续会修正,补充、增加。
对于这些参数的理解与说明,来自于网络、书籍以及自己的理解整理而成,不一定完全正确,随时补充、更正、纠错,这里参考了许多博客,并有大段的引用解释,详细情况会一一注明
General参数 server_id = XXX In MySQL 5.7, the--server-id
option must be specified if binary logging is enabled, otherwise the server is not allowed to start.
mysql同步的数据中是包含server_id的,用于标识该语句最初是从哪个server写入的,因此server_id一定要有的,根据需求修改,不能重复
user = mysql
Mysql使用的用户
datadir = /usr/local/mysql57/data
数据文件路径
tmpdir = /usr/local/mysql57/tmp临时文件路径 character-set-server = utf8mb4
默认server字符集 collation-server = utf8mb4_general_ci
字符序,某种字符集下,也即character-set-server已知的情况下,存在多种排序规则,指定其中一种排序规则,其实叫做排序规则更容易理解。
port = 3306
数据库服务端口号 default_storage_engine =InnoDB
默认为InnoDB引擎 socket = /usr/local/mysql57/mysql.Sock
本机连接至MySQL服务可以使用sock方式连接,实际上是MySQL服务的进程Id pid-file = /usr/local/mysql57/data/mysql.pid Mysql的进程文存放位置 log_error = /usr/local/mysql57_data/mysql3306/log/mysql-error.log
启动&错误日志信息
log_error_verbosity = 0|1|2
log_error_verbosity 为0, 表示不记录告警信息。
log_error_verbosity 为1, 表示告警信息写入错误日志。
log_error_verbosity 大于1, 表示各类告警信息,例如有关网络故障的信息和重新连接信息写入错误日志。参考:
慢查询日志开关 long_query_time = n
界定慢查询阈值,单位秒 log_output = file|table
慢查询输出位置,文件或者表,如果是文件的话,目标为slow_query_log_file ,如果是表的话,存储在mysql.slowlog slow_query_log_file = /usr/local/mysql57_data/mysql3306/log/slow_query_log .log
慢查询日志文件 log_queries_not_using_indexes
捕获没有用到索引的查询,同样会记录到慢查询的目标中 log_bin_trust_function_creators = ON
存储过程或者函数需要标记是否修改数据,参考 performance_schema = ON 启用performance_schema ###################################################################################### binlog相关参数 binlog_format = row|statment|mixed Row level 日志中会记录每一行数据被修改的情况,然后在slave端对相同的数据进行修改。 优点:能清楚的记录每一行数据修改的细节 缺点:数据量太大 Statement level(默认) 每一条被修改数据的sql都会记录到master的bin-log中,slave在复制的时候sql进程会解析成和原来master端执行过的相同的sql再次执行 优点:解决了 Row level下的缺点,不需要记录每一行的数据变化,减少bin-log日志量,节约磁盘IO,提高新能 缺点:容易出现主从复制不一致 Mixed(混合模式) 结合了Row level和Statement level的优点,不建议使用
bin_log_cache_size
对于事务性的操作,是要事物完成的时候写入二进制日志,事物提交之前,执行的写入性操作会被缓存起来,直到整个事物完成,mysqld进程会将整个事物写入二进制日志。
当事物开始的时候,会按照binlog_cache_size系统变量指定的值分配内容空间,如果指定的binlog_cache_size缓存空间不够,执行的事务性操作回滚并提示失败
默认是32kb
由参数sync_binlog= n来控制,设置sync_binlog = 1的话,表示最高安全级别的写入(但也不能保证不丢失任何事物日志),相当于是一种安全写入模式,不过对性能有一定的影响。 GTID相关参数 gtid_mode = on|off gtid模式的开关,默认是关闭的 enforce_gtid_consistency = 1 强事物一致性,开启之后事物中不能创建临时表 binlog_gtid_simple_recovery = 1 参考:https://keithlan.github.io/2018/05/03/gtid_binlog_gtid_simple_recovery/
5.7.6以后默认是开启,开启之后,以更优化的方式从binlog中读取GTID
1. 这个变量用于在MySQL重启或启动的时候寻找GTIDs过程中,控制binlog 如何遍历的算法? 2. 当binlog_gtid_simple_recovery=FALSE 时: 为了初始化 gtid_executed,算法是: 从newest_binlog -> oldest_binlog 方向遍历读取,如果发现有Previous_gtids_log_event , 那么就停止遍历 为了初始化 gtid_purged,算法是: 从oldest_binlog -> newest_binlog 方向遍历读取, 如果发现有Previous_gtids_log_event(not empty)或者 至少有一个Gtid_log_event的文件,那么就停止遍历 3. 当binlog_gtid_simple_recovery=TRUE 时: 为了初始化 gtid_executed , 算法是: 只需要读取newest_binlog 为了初始化 gtid_purged, 算法是: 只需要读取oldest_binlog 4. 当设置binlog_gtid_simple_recovery=TRUE , 如果MySQL版本低于5.7.7 , 可能会有gitd计算出错的可能,具体参考官方文档详细描述- 在线GTID升级的时候,binlog_gtid_simple_recovery = TRUE 必须打开,否则在binlog 删除的时候,会发生阻塞状况
- 在线GTID升级的时候,尽量将非GTID的binlog备份好,然后删除掉,以免出现莫名其妙的错误
MySQL最经典的参数之一 如果innodb_flush_log_at_trx_commit设置为0,log buffer将每秒一次地写入log file中,并且log file的flush(刷到磁盘)操作同时进行.该模式下,在事务提交的时候,不会主动触发写入磁盘的操作。
如果innodb_flush_log_at_trx_commit设置为1,每次事务提交时MySQL都会把log buffer的数据写入log file,并且flush(刷到磁盘)中去.
如果innodb_flush_log_at_trx_commit设置为2,每次事务提交时MySQL都会把log buffer的数据写入log file.但是flush(刷到磁盘)操作并不会同时进行。该模式下,MySQL会每秒执行一次 flush(刷到磁盘)操作。 innodb_doublewrite = 0|1 物理级保护数据安全,在将内存中的脏页写入磁盘之前,先将内存中的脏页复制到内存的doublewrite buffer中(2MB),然后将doublewrite buffer的数据写入共享表空间的页中(128个page,2MB大小),然后再写磁盘。
innodb_flush_method = fdatasync|O_DSYNC|O_DIRECT
控制着innodb数据文件及redo log的打开、刷写模式,参考:https://blog.csdn.net/smooth00/article/details/72725941
redo LOG BUFFER 和redo LOG 以及数据文件的不同刷新模式
O_DIRECT绕过操作系统缓存,直接从innodb BUFFER写磁盘,减少磁盘IO和内存的使用,会最小化缓冲对io的影响
默认是48MB,在频繁的数据写入的实例中为了防止redolog频繁在两个文件中间切换,应该配置为一个较大的值,比如500MB
。 innodb_log_buffer_size 默认值是16MB,未提交事务的缓冲区大小,如果单个事物和事物并发量不大,可以保留默认值。 innodb_thread相关参数: 参考: Innodb_thread_concurrency InnoDB最大线程数 innodb_thread_sleep_delay 调整当 并发 thread 到达 innodb_thread_concurrency时需要sleep的时间 innodb_concurrency_tickets innodb_commit_concurrency backend Thread相关参数: 参考: innodb_max_dirty_pages_pct innodb_purge_threads innodb_flush_neighbors innodb_fast_shutdown innodb_file: 参考: innodb_file_format = Antelope|Barracuda innodb_file_format_check innodb_file_format_max InnoDB IO相关参数 参考:, innodb_read_io_threads 在Linux平台上就可以根据CPU核数来更改相应的参数值了,默认是4。 innodb_write_io_threads 同innodb_read_io_threads innodb_io_capacity
按照该值的百分比来控制刷新到磁盘页的数量
1. 在合并插入缓冲时, 合并插入缓冲的数量是该值的5%
2. 在从缓冲中刷新脏页时, 刷新的脏页数量等于该值.
若用户使用了ssd类的磁盘或做了磁盘阵列, 可将该值适当调大.
Created_tmp_disk_tables
和 Created_tmp_tables
状态来分析是否需要增加tmp_table_size
max_heap_table_size
同tmp_table_size, 它规定了内部内存临时表的最大值,每个线程都要分配。(实际起限制作用的是tmp_table_size和max_heap_table_size的最小值。)
thread_cache_size:
参考:https://www.jianshu.com/p/47adb747652d
线程池缓存大小 ( 当客户端断开连接后 将当前线程缓存起来 当在接到新的连接请求时快速响应 无需创建新的线程 )
connect相关参数
参考:
max_connections最大连接数 wait_timeout 服务器关闭非交互连接之前等待活动的秒数。 Interactive_timeout 服务器关闭交互式连接前等待活动的秒数。交互式客户端定义为在mysql_real_connect()中使用CLIENT_INTERACTIVE选项的客户端。 connect_timeout和max_connect_errors 参考: connect_timeout MySQL服务端进程mysqld等待连接建立完成的时间,单位为秒。如果超过connect_timeout时间范围内,仍然无法完成协议握手话,MySQL客户端会收到异常, 异常消息类似于: Lost connection to MySQL server at 'XXX', system error: errno,该变量默认是10秒。 max_connect_errors = N 默认值是100,不是防止暴力破解超过N次后禁止连接的,而是计算协议握手错误次数之后禁用主机,并且仅用于通过验证的主机(HOST_VALIDATED = YES)。
为了防止网络中断造成的连接失败,从而造成客户端无法连接,相反,这个值需要配置成一个较大的值,比如10000甚至更多。 相关信息记录在select * from performance_schema.host_cache;使用 flush hosts;清理。 table_definition_cache: 参考: table_definition_cache,该参数值的代表MySQL可以缓存的表定义的数量。和前面的table cache不同的是,表定义的缓存占用空间很小, 而且不需要使用文件描述符,也就是只要打开.frm文件,缓存表定义,然后就可以关闭.frm文件。 table_open_cache: 参考:, table_open_cache指定表高速缓存的大小。每当MySQL访问一个表时,如果在表缓冲区中还有空间,该表就被打开并放入其中,这样可以更快地访问表内容。 通过检查峰值时间的状态值Open_tables和 Opened_tables,可以决定是否需要增加table_open_cache的值。 如果你发现open_tables等于table_open_cache,并且opened_tables在不断增长,那么你就需要增加table_open_cache的值了(上述状态值可:SHOW STATUS LIKE ‘Open%tables’获得)。 query_cache 查询缓存,不建议使用 query-cache-type: 是否打开查询缓存 query-cache-size: 查询缓存的大小 open_files_limit: 参考: open_files_limit = table_open_cache*2 + innodb表 ###################################################################################### Master-Slave主从复制相关参数 半同步Master端参数: 参考: rpl_semi_sync_master_enabled on 开启半同步复制 rpl_semi_sync_master_timeout 参数控制,单位是毫秒,默认为10000,即10s,master等待slave超时时间,超时之后关闭半同步,转为异步复制
rpl_semi_sync_master_wait_no_slave
ON默认值,当状态变量Rpl_semi_sync_master_clients中的值小于rpl_semi_sync_master_wait_for_slave_count时,Rpl_semi_sync_master_status依旧显示为ON。
OFF当状态变量Rpl_semi_sync_master_clients中的值于rpl_semi_sync_master_wait_for_slave_count时,Rpl_semi_sync_master_status立即显示为OFF,即异步复制。
说得直白一点,如果我的架构是1主2从,2个从都采用了半同步复制,且设置的是rpl_semi_sync_master_wait_for_slave_count=2,如果其中一个挂掉了,
对于rpl_semi_sync_master_wait_no_slave设置为ON的情况,此时显示的仍然是半同步复制,如果rpl_semi_sync_master_wait_no_slave设置为OFF,则会立刻变成异步复制。
rpl_semi_sync_master_wait_point=wait_after_commit|wait_after_sync
参考:https://mp.weixin.qq.com/s/fvvEn6nSYzQs9NCa1eCOIQ
wait_after_commit:半同步;wait_after_sync:增强(无损)半同步
为什么要增强的半同步复制?因为传统的半同步复制有潜在问题
wait_after_commit模式:主上客户端发出提交指令,事务提交到了存储引擎后,等待从传递过来ack,再向前端返回成功的状态。
与无损复制的区别就是:如果在主上这个事务已经提交到了存储引擎,而正在等待从的ack过程中---这个时候发生creash,则主上这个事务其实已经认为commit了,而从还没commit,
在切换到从后,就会回滚最后的这个事务,这个时候主从的时候其实就不一致了
after_commit在主机事务提交后将日志传送到从机,after_sync是先传再提交
rpl_stop_slave_timeout ???
控制stop slave 命令的执行时间
控制stop slave 的执行时间,在重放一个大的事务的时候,突然执行stop slave,命令 stop slave会执行很久,这个时候可能产生死锁或阻塞,严重影响性能,mysql
5.6可以通过rpl_stop_slave_timeout参数控制stop slave 的执行时间
master_info持久化方式 sync_master_info = N 每N个事件写入一次表/文件 relay_log_info_repository = file|table relay_info持久化方式 sync_relay_log_info = N 每N个事件写入一次表/文件 relay log信息如果配置为非Table模式,写事物和写文件(将已经应用的日志位置写入文件)是无法保持一致的 MySQL 5.6版本通过将复制信息存放到表中来解决此问题.通过配置两个参数 relay_log_info_repository=TABLE,master_info_repository=TABLE, relay log info 会存放到 mysql.slave_relay_log_info表中, master info 会存放mysql.slave_master_info表中。就是把SQL线程执行事务和更新mysql.slave_replay_log_info的语句看成一个事务处理,这样就会一直同步的. 半同步复制Slave端相关参数 rpl-semi-sync-slave-enabled = on Slave开启半同步 rpl_semi_sync_master_trace_level 用于开启半同步复制模式时的调试级别,默认是32 rpl_semi_sync_slave_trace_level 用于开启半同步复制模式时的调试级别,默认是32 parallel replication多线程复制 slave_parallel_workers = N slave上多个线程回放master上的binlog slave_parallel_type = DATABASE | LOGICAL_CLOCK DATABASE:默认值,基于库的并行复制方式 LOGICAL_CLOCK:基于组提交的并行复制方式 slave_preserve_commit_order =0| 1 当slave_preserve_commit_order=0时 没有办法保证顺序,在恢复的过程中会有问题,到时候你怎么start slave 呢? start slave until SQL_AFTER_MTS_GAPS ; reset slave Master执行顺序: last_committed=0,sequence_number=1,2,3,4 slave执行顺序: 有可能就是 last_committed=0,sequence_number=1,4,3,2 当slave_preserve_commit_order=1时 后一个sequence_number提交的时候,会等待前一个sequence_number完成。 Waiting for preceding transaction to commit Slave Relay log
max_relay_log_size
标记relay log 允许的最大值,如果该值为0,则默认值为max_binlog_size(1G);如果不为0,则max_relay_log_size则为最大的relay_log文件大小;
relay_log
定义relay_log的位置和名称,如果值为空,则默认位置在数据文件的目录,文件名为host_name-relay-bin.nnnnnn(By default, relay log file names have the form host_name-relay-bin.nnnnnn in the data directory);
relay_log_index
同relay_log,定义relay_log的位置和名称;
relay_log_info_repository = table|file
relay_log_info_file
设置relay-log.info的位置和名称(relay-log.info记录MASTER的binary_log的恢复位置和relay_log的位置),也可以配置记录到mysql库中的slave_relay_log_info表中;
relay-log-recovery = 1
这个参数的作用是:当slave从库宕机后,假如relay-log损坏了,导致一部分中继日志没有处理,则自动放弃所有未执行的relay-log,并且重新从
master上获取日志,这样就保证了relay-log的完整性。默认情况下该功能是关闭的,将relay_log_recovery的值设置为 1时,可在slave从库上开启该功能,建议开启。
relay-log-purge
是否自动清空不再需要中继日志时。默认值为1(启用)