MySQL relay_log_purge=0 时的风险

神仙的仙居 2016-04-02 13:49:03 累计浏览 1,856 次

本机暂存

内容概览

这篇讲的是当MySQL设置`relay_log_purge=0`时，一个容易被忽略的数据一致性风险。很多DBA为了在高可用切换后能用上relay log补齐数据，会选择禁止自动清除，但官方文档提示这在使用`relay_log_recovery=1`时并非“崩溃安全”。

文章深入剖析了这个“地雷”的成因：在崩溃重启后，由于IO线程位置可能不准，`relay_log_recovery`会从已执行的位置重新拉取binlog并开启新的relay log。若旧的relay log被保留（`purge=0`），就可能在两个场景下出问题。一是崩溃时最后一个relay log未执行完，重启后这部分数据被重新下载，导致重复；二是如果SQL线程追赶过快，可能在IO线程尚未将relay log刷盘时就已读取执行，造成新旧文件间出现一段数据空缺。

因此，若因特殊需求必须保留relay log，在解析时务必通过binlog头信息来校验，确保数据准确无误。文章还附上了配置crash safe复制的相关参考，帮助读者从根源上稳固复制架构。

有时候，我们希望将 MySQL 的 relay log 多保留一段时间，比如用于高可用切换后的数据补齐，于是就会设置 relay_log_purge=0，禁止 SQL 线程在执行完一个 relay log 后自动将其删除。但是在官方文档关于这个设置有这么一句话：

Disabling purging of relay logs when using the --relay-log-recovery option risks data consistency and is therefore not crash-safe.

究竟是什么样的风险呢？查找了一番后，基本上明白了原因。

首先，为了让从库是 crash safe 的，必须设置 relay_log_recovery=1，这个选项的作用是，在 MySQL 崩溃或人工重启后，由于 IO 线程无法保证记录的从主库读取的 binlog 位置的正确性，因此，就不管 master_info 中记录的位置，而是根据 relay_log_info 中记录的已执行的 binlog 位置从主库下载，并让 SQL 线程也从这个位置开始执行。MySQL 启动时，相当于执行了 flush logs ，会新开一个 relay log 文件，新的 relay log 会记录在新的文件中。如果默认情况 relay_log_purge=1 时，SQL 线程就会自动将之前的 relay log 全部删除。而当 relay_log_purge=0 时，旧的 relay log 则会被保留。虽然这并不会影响从库复制本身，但还是会有地雷：

由于崩溃或停止 MySQL 时，SQL 线程可能没有执行完全部的 relay log，最后一个 relay log 中的一部分数据会被重新下载到新的文件中。也就是说，这部分数据重复了两次。
如果 SQL 跟得很紧，则可能在 IO 线程写入 relay log ，但还没有将同步到磁盘时，就已经读取执行了。这时，就会造成新的文件和旧的文件中少了一段数据。

如果我们读取 relay log 来获取数据，必须注意这一点，否则就会造成数据不一致。而保留 relay log 的目的也在于此。因此，在处理 relay log 时必须格外小心，通过其中 binlog 头信息来确保正确性。

关于如何配置 crash safe 的复制本身的配置，可以参照：
http://blog.itpub.net/22664653/viewspace-1752588/
http://www.innomysql.net/article/34.html

参考资料：
http://blog.booking.com/better_crash_safe_replication_for_mysql.html
https://bugs.mysql.com/bug.php?id=73038
http://bugs.mysql.com/bug.php?id=74324

同分类推荐文章

使用deepseek进行Oracle恢复,引起重大故障（2026-06-22 10:56:00）
接手一个只差临门一脚的数据库恢复（2026-06-18 00:13:09）
我做了一个 AI 版的 StarRocks 升级风险扫描工具，直接帮我定位到一个风险（2026-06-15 01:00:00）

查看更多数据库文章 →

建议继续学习

用Hyer来进行网站的抓取（累计阅读 158,250）
MySQL数据库在实际应用一些方面的介绍（累计阅读 36,397）
WordPress插件开发 -- 在插件使用数据库存储数据（累计阅读 29,163）
Mysql监控指南（累计阅读 21,350）
由浅入深探究mysql索引结构原理、性能分析与优化（累计阅读 16,521）
在Apache2.2.XX下安装Mod-myvhost模块（累计阅读 13,056）
15个最好的免费开源电子商务平台（累计阅读 12,541）
浅谈MySQL索引背后的数据结构及算法（累计阅读 11,904）
整理了一份招PHP高级工程师的面试题（累计阅读 11,708）
架构师的思考（累计阅读 10,523）