IT技术博客大学习 共学习 共进步
全部 移动开发 后端 数据库 AI 算法 安全 DevOps 前端 设计 开发者

查看InnoDB的磁盘空间利用率

MySQLOPS 数据库与运维自动化技术分享 2012-05-04 00:06:01 累计浏览 3,628 次
本机暂存

这周阿里巴巴变集团DBA内部技术交流分享时,支付宝的黄忠同学提了一个问题,关于InnoDB存储引擎索引page 的利用率。

 page利用率

主要是指btree里面每个page的使用被使用的空间大小。我们知道MySQL数据库InnoDB存储引擎默认一个page大小是16k。但实际使用情况不会总用满。我们定义为所有page的总使用字节除以总字节数。
在理论分析之前,我们要先弄个工具,查一下。

实例统计

写了一个简单的工具,读ibd文件上的每个page,算出每个page的实际使用字节,可以得到利用率。
我们找了线上一个库来模拟。表中有1个自增主键和3个非聚簇索引。不影响结论地简化为如下:

CREATE TABLE `ctu_factor_risk_99_03` (
`seq_id` bigint(20) unsigned NOT NULL AUTO_INCREMENT,
`a` varchar(32) DEFAULT NULL,
`b` varchar(32) DEFAULT NULL,
`c` varchar(32) DEFAULT NULL,
KEY a (a),
KEY bc (b,c),
KEY cb (c,b)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

 插入数据中a,b,c均为长度为30字节的随机字符串。
显然主键和其他索引应该分开统计。统计结果发现,主键page利用率71%,其他索引利用率约52%。

简单分析
上面的结果很好理解。因为按照主键递增顺序插入数据,因此主键上数据“紧凑”。 而其他三个索引,则都是随机更新,需要不停地作索引节点分裂。

如何提升磁盘空间利用率

  回到最开始的问题。其实我们关心的,是InnoDB存储引擎为了保存相同的数据,用了多少空间。所以我们的问题变成,存储相同的数据,如何让占用的磁盘空间更小。

   有一个很直观的结论。把这些索引删了重建,必然会减少空间消耗。因为这个操作之后,在新的数据插入之前,这些索引也变成“紧凑的”。

      再建了一个与cb相同的索引,再跑,利用率居然高达98%。这个原理大家应该都知道了,只是量化一下而已。

         工具下载, 用法 ./ibd_used tb.ibd N1 N2 >/tmp/r 最后几行为各个索引的利用率统计值

同分类推荐文章

  1. 第七章 事务 (2026-04-07 08:00:00)
  2. 第六章:分区 (2026-03-29 08:00:00)
  3. Neko Master: 从 0 到 1K+ Star 的 Vibe Coding 实践 (2026-03-01 08:00:00)

查看更多 数据库 文章 →

建议继续学习

  1. 用Hyer来进行网站的抓取 (累计阅读 158,174)
  2. MySQL数据库在实际应用一些方面的介绍 (累计阅读 36,333)
  3. WordPress插件开发 -- 在插件使用数据库存储数据 (累计阅读 29,092)
  4. Mysql监控指南 (累计阅读 21,231)
  5. 由浅入深探究mysql索引结构原理、性能分析与优化 (累计阅读 16,207)
  6. 在Apache2.2.XX下安装Mod-myvhost模块 (累计阅读 12,991)
  7. 15个最好的免费开源电子商务平台 (累计阅读 12,466)
  8. 浅谈MySQL索引背后的数据结构及算法 (累计阅读 11,563)
  9. 整理了一份招PHP高级工程师的面试题 (累计阅读 11,476)
  10. 深入浅出INNODB MVCC机制与原理 (累计阅读 9,628)