Innodb 多版本实现

MySQL支持 2010-01-07 13:29:19 累计浏览 3,215 次

本机暂存

内容概览

这篇讲的是 InnoDB 存储引擎如何巧妙地实现多版本并发控制（MVCC）。作者从 InnoDB 核心特性出发，深入解析了其多版本实现背后的存储机制：旧的行版本并非凭空产生，而是被系统性地存放在表空间特定的回滚段（rollback segment）中。

文章的重点在于揭示这个“旧版本仓库”的运作逻辑。它解释了当数据行被更新或删除时，旧版本如何被写入回滚段，新版本又如何留在聚簇索引中。通过这种方式，InnoDB 能够同时维护数据的当前状态和历史版本，为不同事务提供一致性的数据视图，这是实现高并发读写的关键所在。

这种设计的巧妙之处在于，它把版本管理的存储成本和访问效率做了很好的平衡。回滚段的结构使得旧版本可以按需访问和高效回收，既支持了 MVCC，又避免了历史数据无限堆积带来的空间问题。理解这部分实现，对于排查长事务导致的回滚段膨胀、或理解事务隔离级别的底层行为都十分有帮助。

Innodb是一个多版本的存储引擎，它可以把旧的行信息存到表空间中。这些旧的行信息存储到Innodb称为的回滚段的表空间中。

Innodb为实现多版本，Innodb在每一行添加了三个列。一个6字节的DB_TRX_ID字段用来表示事务的Insert或是Update操作，对于Delete操作实际上也并不在直接删除，只是用一个Bit位去标识行被删除。另外，每行包括7字节的DB_ROLL_PTR字段，称为回滚指针（roll pointer）。这个回滚指针指向回滚段（undo segment）中的回滚记录。如果行被更新，那么回滚段中记录的信息足以使update操作加到update操作之间。最后还有一个6字节的DB_ROW_ID字段，该字段包含新行的Row Id，这个字段只在Insert操作时单纯的增加。DB_ROW_ID是需要一个互诉锁的才能产生。Innodb产生的clustered index包括Row ID.从另一方面来说，除了Clustered Index索引外，其它的索引不会包含Row Id.

Innodb利用回滚段保存的信息完成事务的回滚。同样是为了读取早的版本行信息，通过回滚段中的信息达到一致性读。

回滚段中的回滚日值可以区分为insert和update日值。Insert的回滚日值只需要一个事务回的信息，记录Insert的操作的事务就行，该回滚信息在事务提交后被丢弃。Update的回滚日值不但用来撤销事务，同时也为一致性读服务。在事务操作中，别的Session可以通过Update的回滚段信息达构建早期的版本，从来达到一致性读。

对于Innodb的多版本是为达到一致性读，我们在使用Innodb时要养成一个习惯：要规律的提交我们的事务。另一方面，对于Innodb的回滚段中Update的回滚日值不能随着事务的提交而被丢弃，所以回滚段有可能增长很大，填满所有的表空间。

回滚段的需求的物理大小通常比Insert和Update的行小的多，所以我们可以根据Insert，Update行的并发量来估算分配回滚段的大小。

在Innodb的多版本设计中，Delete语句并不是直接物理的从数据中立即删除相应的行，只是做一个Bit位的标识。另外当Innodb删除相应的原行和行的索引信息时，回滚段中此行的Update回滚日值才会被清除。对于Delete操作的的删除我们称为静化（purge）,这个操作是很快速的，正常情况下静化在SQL语句后按一定的顺序去执行删除操作。

假设一个场景：当一个用户用小的批量插入和删除行操作在一个表，它有可能会造成静化操作的进程落后，从而造成表的增长的很大很大，使的磁盘的工作效率比较低了。这样就会出现恶劣的情况既使表只有该表只有10M的数据，也有可能使表空间增长到10G，当然里面有很多是即将过静化掉的行(dead row).基于这个原因，静化进程会造成新的行操作和分配资源的性能瓶颈。所以也要关注一下innodb_max_purge_lag这个参数的设定是不是合适。

同分类推荐文章

使用deepseek进行Oracle恢复,引起重大故障（2026-06-22 10:56:00）
接手一个只差临门一脚的数据库恢复（2026-06-18 00:13:09）
我做了一个 AI 版的 StarRocks 升级风险扫描工具，直接帮我定位到一个风险（2026-06-15 01:00:00）

查看更多数据库文章 →

建议继续学习

深入浅出INNODB MVCC机制与原理（累计阅读 9,693）
Innodb IO优化－配置优化（累计阅读 7,727）
Innodb分表太多或者表分区太多，会导致内存耗尽而宕机（累计阅读 7,719）
由浅入深理解索引的实现(2) （累计阅读 7,709）
MySQL中like语句及相关优化器tips （累计阅读 6,282）
Innodb 表和索引结构（累计阅读 6,224）
InnODB和MyISAM索引统计集合（累计阅读 6,235）
从load data引发的死锁说起（累计阅读 6,143）
一次神奇的MySQL优化（累计阅读 6,082）
InnoDB线程并发检查机制（累计阅读 5,796）