Innodb Crash Recovery恢复时间的飞跃

SQL部落 2011-07-14 23:49:52 累计浏览 3,655 次

本机暂存

内容概览

这篇讲的是Innodb Crash Recovery从“漫长等待”到“快速完成”的转变。作者从自身经历出发——库数据量小、参数设置保守，对恢复过程的耗时曾没有切身感受。直到他回顾了技术社区早期讨论，才意识到在InnoDB优化前，漫长的恢复曾是普遍痛点，大家不得不通过繁琐的参数调优来缓解。

文章由此切入，解释了Crash Recovery究竟是何过程：它不仅是事务回滚，更涉及数据一致性校验与重做，其耗时直接关系到服务的可恢复性。核心转折在于，作者对比了改进前后的体验差异。InnoDB通过优化恢复算法、改进日志处理机制等，显著缩短了停机窗口，使得曾经需要数十分钟甚至更久的恢复过程得以大幅压缩。

这并非单纯的参数调整指南，而是从开发者视角观察到的底层改进如何实实在在地改变了运维日常。对于需要设计高可用MySQL服务的团队而言，了解这些历史演进与当前机制，对配置优化和故障预案制定都有切实参考。

之前没经历过漫长的crash recovery恢复过程，一是本身库中的数据量就不大，平时的业务量就不是很高，二是innodb_buffer_pool_size和innodb_log_file_size的大小平时设置的也不大。所以，对于意外导致innodb自动恢复时，经历的等待时间的长短没有什么深刻的体会。在浏览peter很早以前的文章时，看到当时大家是多么的无奈和痛苦，同时，在InnoDB没有对其作出改进之前，大家都在开动脑筋，配合各种参数尽可能的缩短故障恢复的时间。先来了解下，什么是Crash Recovery，它究竟都帮我们做了什么。

Innodb Crash Recovery

这也是InnoDB引擎的一个特点，当故障发生，重新启服务后，会自动完成恢复操作，将数据库恢复到之前一个正常状态。恢复进程会完成两步，第一步：检查redo日志，将之前完成并提交的事务全部重做；第二步：将undo日志中，未完成提交的事务，全部取消。那么，就仅仅做了这么两步为什么恢复过程会变得如此漫长呢？在InnoDB未对恢复速度做提升之前，MySQL的bug列表中，曾被提出了两个改进请求：Bug #29847和Bug #49535。

“民间办法”― 治标不治本

方法1：重启mysqld之前，暂时减小innodb_buffer_pool_size的大小，将innodb_flush_method=O_DIRECT临时注释掉，会缩短故障恢复的时间。

方法2：一开始就把my.cnf中参数innodb_log_file_size的大小设置的小些，该选项与恢复时间的长短有直接关系，但太小也会对性能造成影响。

“专业解决” ― 改进代码

Bug #49535提到，在恢复期间重做redo日志时，检查可用内存的大小将消耗超过90%的CPU。恢复redo日志时，会在buffer pool中开辟一块空间，用来的将redo log从磁盘中读到内存当中，放到一个hash table里面，随着读出redo log的增加，这个hash table会不断增大，为了保证该空间不超过buffer pool的大小，所以，每读入一次redo log都要去遍历一遍hash table来获得其大小，显然效率低下而且很耗资源。解决办法是在hash table的结构中加入一个头字段来单独记录总的大小。

Bug #29847是由flush list过大导致。当每执行一条日志后，都会被插入到一个叫作flush list的列表中，也就是我们说的dirty page列表，正常情况下有跟新完成，那么新的跟新会被放到列表的前面，而当发生恢复时，每次跟新的记录都会按照之前LRU的顺序放到原来的位置，同时，不幸的是这个flush list有时一个古老的链表结构，每次插入的遍历痛苦，你懂得！flush list变的越长将消耗的时间就越久，所以，为什么之前提到，减小innodb_log_file_size的大小，能有效的缩短恢复时间，其实，是为了减少flush list的大小。解决办法是采用一种叫做红黑树（red-black tree）的数据结构，这个我还没有看明白:) 在pluin 1.0.7以后就没有恢复太久的问题了，为了提高性能完全可以尽可能的加大redo log的设置，InnoDB也保证了不会再有超长恢复等待的发生。

p.s.:除了peter，又发现一个很猛的人domas，有思想有深度；此外，MySQL圈里日本技术要比中国技术强好多，Yasufumi Kinoshita、Yoshinori.Matsunobu、TokuDB；当然，中国也有例如：姜承尧。

同分类推荐文章

使用deepseek进行Oracle恢复,引起重大故障（2026-06-22 10:56:00）
接手一个只差临门一脚的数据库恢复（2026-06-18 00:13:09）
我做了一个 AI 版的 StarRocks 升级风险扫描工具，直接帮我定位到一个风险（2026-06-15 01:00:00）

查看更多数据库文章 →

建议继续学习

用Hyer来进行网站的抓取（累计阅读 158,250）
MySQL数据库在实际应用一些方面的介绍（累计阅读 36,397）
WordPress插件开发 -- 在插件使用数据库存储数据（累计阅读 29,164）
Mysql监控指南（累计阅读 21,350）
由浅入深探究mysql索引结构原理、性能分析与优化（累计阅读 16,522）
在Apache2.2.XX下安装Mod-myvhost模块（累计阅读 13,056）
15个最好的免费开源电子商务平台（累计阅读 12,541）
浅谈MySQL索引背后的数据结构及算法（累计阅读 11,904）
整理了一份招PHP高级工程师的面试题（累计阅读 11,708）
深入浅出INNODB MVCC机制与原理（累计阅读 9,692）