查看InnoDB的磁盘空间利用率
这周阿里巴巴变集团DBA内部技术交流分享时,支付宝的黄忠同学提了一个问题,关于InnoDB存储引擎索引page 的利用率。
page利用率
主要是指btree里面每个page的使用被使用的空间大小。我们知道MySQL数据库InnoDB存储引擎默认一个page大小是16k。但实际使用情况不会总用满。我们定义为所有page的总使用字节除以总字节数。
在理论分析之前,我们要先弄个工具,查一下。
实例统计
写了一个简单的工具,读ibd文件上的每个page,算出每个page的实际使用字节,可以得到利用率。
我们找了线上一个库来模拟。表中有1个自增主键和3个非聚簇索引。不影响结论地简化为如下:
|
CREATE TABLE `ctu_factor_risk_99_03` ( |
插入数据中a,b,c均为长度为30字节的随机字符串。
显然主键和其他索引应该分开统计。统计结果发现,主键page利用率71%,其他索引利用率约52%。
简单分析
上面的结果很好理解。因为按照主键递增顺序插入数据,因此主键上数据“紧凑”。 而其他三个索引,则都是随机更新,需要不停地作索引节点分裂。
如何提升磁盘空间利用率
回到最开始的问题。其实我们关心的,是InnoDB存储引擎为了保存相同的数据,用了多少空间。所以我们的问题变成,存储相同的数据,如何让占用的磁盘空间更小。
有一个很直观的结论。把这些索引删了重建,必然会减少空间消耗。因为这个操作之后,在新的数据插入之前,这些索引也变成“紧凑的”。
再建了一个与cb相同的索引,再跑,利用率居然高达98%。这个原理大家应该都知道了,只是量化一下而已。
工具下载, 用法 ./ibd_used tb.ibd N1 N2 >/tmp/r 最后几行为各个索引的利用率统计值
建议继续学习:
- Linux如何统计进程的CPU利用率 (阅读:15363)
- Innodb IO优化-配置优化 (阅读:7333)
- Innodb分表太多或者表分区太多,会导致内存耗尽而宕机 (阅读:7090)
- Linux下CPU的利用率 (阅读:5891)
- Innodb 表和索引结构 (阅读:5583)
- InnoDB线程并发检查机制 (阅读:5088)
- Innodb如何使用内存 (阅读:4757)
- 快速预热Innodb Buffer Pool的方法 (阅读:4630)
- Innodb文件表空间结构 (阅读:4643)
- InnoDB的缓存替换策略及其效果 (阅读:4420)
扫一扫订阅我的微信号:IT技术博客大学习
- 作者:丁奇 来源: MySQLOPS 数据库与运维自动化技术分享
- 标签: InnoDB 利用率
- 发布时间:2012-05-04 00:06:01
-
[928] WordPress插件开发 -- 在插件使用 -
[134] 解决 nginx 反向代理网页首尾出现神秘字 -
[53] 整理了一份招PHP高级工程师的面试题 -
[52] 如何保证一个程序在单台服务器上只有唯一实例( -
[51] 海量小文件存储 -
[51] 用 Jquery 模拟 select -
[50] 全站换域名时利用nginx和javascri -
[50] Innodb分表太多或者表分区太多,会导致内 -
[49] CloudSMS:免费匿名的云短信 -
[47] jQuery性能优化指南
