MySQL索引之聚集索引
在MySQL里,聚集索引和非聚集索引分别是什么意思,有什么区别?
在MySQL中,InnoDB引擎表是(聚集)索引组织表(clustered index organize table),而MyISAM引擎表则是堆组织表(heap organize table)。
也有人把聚集索引称为聚簇索引。
当然了,聚集索引的概念不是MySQL里特有的,其他数据库系统也同样有。
简言之,聚集索引是一种索引组织形式,索引的键值逻辑顺序决定了表数据行的物理存储顺序,而非聚集索引则就是普通索引了,仅仅只是对数据列创建相应的索引,不影响整个表的物理存储顺序。
我们先来看看两种存储形式的不同之处:
简单说,IOT表里数据物理存储顺序和主键索引的顺序一致,所以如果新增数据是离散的,会导致数据块趋于离散,而不是趋于顺序。而HOT表数据写入的顺序是按写入时间顺序存储的。
IOT表相比HOT表的优势是:
范围查询效率更高;
数据频繁更新(聚集索引本身不更新)时,更不容易产生碎片;
特别适合有一小部分热点数据频繁读写的场景;
通过主键访问数据时快速可达;
数据变化如果是离散为主的话,那么效率会比HOT表差;
索引回表读开销很大;
大部分数据读取时随机的,无法保证被顺序读取,开销大;
首先选择显式定义的主键索引做为聚集索引;
如果没有,则选择第一个不允许NULL的唯一索引;
还是没有的话,就采用InnoDB引擎内置的ROWID作为聚集索引;
IOT表的不足则有:
HOT表的不足有:
每张InnoDB表只能创建一个聚集索引,聚集索引可以由一列或多列组成。
上面说过,InnoDB是聚集索引组织表,它的聚集索引选择规则是这样的:
我们来看看InnoDB主键索引的示意图:
图片来自高性能MySQL
可以看到,在这个索引结构的叶子节点中,节点key值是主键的值,而节点的value则存储其余列数据,以及额外的ROWID、rollback pointer、trx id等信息。
结合这个图,以及上面所述,我们可以知道:在InnoDB表中,其聚集索引相当于整张表,而整张表也是聚集索引。主键必然是聚集索引,而聚集索引则未必是主键。
MyISAM是堆组织表,它没有聚集索引的概念。
关于MySQL的方方面面大家想了解什么,可以直接留言回复,我会从中选择一些热门话题进行分享。 同时希望大家多多转发,多一些阅读量是老叶继续努力分享的绝佳助力,谢谢大家 :)
建议继续学习:
- 由浅入深探究mysql索引结构原理、性能分析与优化 (阅读:15124)
- 浅谈MySQL索引背后的数据结构及算法 (阅读:9962)
- 由浅入深理解索引的实现(2) (阅读:6457)
- HBase二级索引与Join (阅读:5846)
- 如何建立合适的索引? (阅读:5457)
- InnODB和MyISAM索引统计集合 (阅读:5296)
- Innodb 表和索引结构 (阅读:4861)
- mysql查询中利用索引的机制 (阅读:4818)
- MySQL索引背后的数据结构及算法原理 (阅读:4485)
- 多维度分类排行榜应用:用位图索引 (阅读:4029)
扫一扫订阅我的微信号:IT技术博客大学习
- 作者:叶金荣 来源: iMySQL
- 标签: 索引 聚集索引
- 发布时间:2015-11-02 22:32:52
- [70] Twitter/微博客的学习摘要
- [65] find命令的一点注意事项
- [64] 如何拿下简短的域名
- [64] IOS安全–浅谈关于IOS加固的几种方法
- [63] android 开发入门
- [62] 流程管理与用户研究
- [62] Go Reflect 性能
- [60] Oracle MTS模式下 进程地址与会话信
- [59] 读书笔记-壹百度:百度十年千倍的29条法则
- [59] 图书馆的世界纪录