MySQL索引之聚集索引

iMySQL 2015-11-02 22:32:52 累计浏览 1,807 次

本机暂存

内容概览

如果你曾经困惑过MySQL的InnoDB和MyISAM索引机制到底有何不同，这篇文章提供了一个清晰的对比视角。它聚焦于“聚集索引”这一核心概念，指出在InnoDB的“索引组织表”中，数据的物理存储顺序由主键索引的逻辑顺序直接决定，这使其在范围查询和热点数据读写上效率更高，但离散写入则可能成为短板。相比之下，MyISAM作为“堆组织表”，数据写入顺序与索引无关，虽无聚集索引带来的结构优势，却也避免了离散更新时的性能损耗。

文章进一步剖析了InnoDB表中聚集索引的唯一性及其选择规则：优先显式主键，其次首个非空唯一索引，最后回退到内置ROWID。这意味着聚集索引的键值逻辑地组织了整张表。通过对比IOT（索引组织表）与HOT（堆组织表）在碎片产生、查询开销等方面的优劣，文章实际上是在指导读者根据自身的数据写入模式和查询需求，来审慎选择表引擎和设计主键，从而优化数据库性能。

在MySQL里，聚集索引和非聚集索引分别是什么意思，有什么区别？

在MySQL中，InnoDB引擎表是(聚集)索引组织表(clustered index organize table)，而MyISAM引擎表则是堆组织表(heap organize table)。

也有人把聚集索引称为聚簇索引。

当然了，聚集索引的概念不是MySQL里特有的，其他数据库系统也同样有。

简言之，聚集索引是一种索引组织形式，索引的键值逻辑顺序决定了表数据行的物理存储顺序，而非聚集索引则就是普通索引了，仅仅只是对数据列创建相应的索引，不影响整个表的物理存储顺序。

我们先来看看两种存储形式的不同之处：

简单说，IOT表里数据物理存储顺序和主键索引的顺序一致，所以如果新增数据是离散的，会导致数据块趋于离散，而不是趋于顺序。而HOT表数据写入的顺序是按写入时间顺序存储的。

IOT表相比HOT表的优势是：

范围查询效率更高；
数据频繁更新(聚集索引本身不更新)时，更不容易产生碎片；
特别适合有一小部分热点数据频繁读写的场景；
通过主键访问数据时快速可达；

IOT表的不足则有：

数据变化如果是离散为主的话，那么效率会比HOT表差；

HOT表的不足有：

索引回表读开销很大；
大部分数据读取时随机的，无法保证被顺序读取，开销大；

每张InnoDB表只能创建一个聚集索引，聚集索引可以由一列或多列组成。

上面说过，InnoDB是聚集索引组织表，它的聚集索引选择规则是这样的：

首先选择显式定义的主键索引做为聚集索引；
如果没有，则选择第一个不允许NULL的唯一索引；
还是没有的话，就采用InnoDB引擎内置的ROWID作为聚集索引；

我们来看看InnoDB主键索引的示意图：

图片来自高性能MySQL

可以看到，在这个索引结构的叶子节点中，节点key值是主键的值，而节点的value则存储其余列数据，以及额外的ROWID、rollback pointer、trx id等信息。

结合这个图，以及上面所述，我们可以知道：在InnoDB表中，其聚集索引相当于整张表，而整张表也是聚集索引。主键必然是聚集索引，而聚集索引则未必是主键。

MyISAM是堆组织表，它没有聚集索引的概念。

关于MySQL的方方面面大家想了解什么，可以直接留言回复，我会从中选择一些热门话题进行分享。同时希望大家多多转发，多一些阅读量是老叶继续努力分享的绝佳助力，谢谢大家 :)

同分类推荐文章

使用deepseek进行Oracle恢复,引起重大故障（2026-06-22 10:56:00）
接手一个只差临门一脚的数据库恢复（2026-06-18 00:13:09）
我做了一个 AI 版的 StarRocks 升级风险扫描工具，直接帮我定位到一个风险（2026-06-15 01:00:00）

查看更多数据库文章 →

建议继续学习

用Hyer来进行网站的抓取（累计阅读 158,250）
MySQL数据库在实际应用一些方面的介绍（累计阅读 36,397）
WordPress插件开发 -- 在插件使用数据库存储数据（累计阅读 29,164）
Mysql监控指南（累计阅读 21,350）
由浅入深探究mysql索引结构原理、性能分析与优化（累计阅读 16,522）
在Apache2.2.XX下安装Mod-myvhost模块（累计阅读 13,056）
15个最好的免费开源电子商务平台（累计阅读 12,541）
浅谈MySQL索引背后的数据结构及算法（累计阅读 11,904）
整理了一份招PHP高级工程师的面试题（累计阅读 11,708）
深入浅出INNODB MVCC机制与原理（累计阅读 9,692）