MySQL数据库InnoDB存储引擎查询优化器实现的分析之optimizer_search_depth参数

MySQLOPS 数据库与运维自动化技术分享 2012-01-08 22:26:22 累计浏览 3,317 次

本机暂存

内容概览

这篇讲的是 MySQL 优化器里一个看似不起眼，却对复杂查询性能有决定性影响的参数——`optimizer_search_depth`。作者深入到 InnoDB 引擎的实现层面，剖析了这个参数如何控制着优化器在寻找最优查询计划时的“探索深度”。我们平时可能遇到某些复杂联接查询执行异常缓慢的问题，根源有时就在于此。优化器并非全知全能，它需要一个边界来避免在庞大的搜索空间里陷入无止境的计算。文章的核心，就是解读这个深度阈值是如何被设定、调整，以及它背后的权衡逻辑。通过源码级的分析，揭示了在“计划质量”与“优化开销”之间取得平衡的一个关键实现细节，对于理解和调优高性能 SQL 查询很有启发。

1.1 optimizer_search_depth参数

以上提到的greedy_search+best_extension_by_limited_search函数，通过search_depth参数控制递归调用的深度。而search_depth参数，可通过optimizer_search_depth来设置。

一般而言，如果optimizer_search_depth设置过大，那么join时，获取最优执行计划的代价十分巨大。

optimizer_search_depth = join tables的数量，一定能获得最优执行计划(根据mysql的代价估计模型)，但是计算代价大。

optimizer_search_depth < join tables的数量，获取的执行计划，是局部最优，但是计算代价小。

optimizer_search_depth参数，对于单表查询无意义。

http://dev.mysql.com/doc/refman/5.0/en/controlling-optimizer.html中，有mysql对于此参数的说明，可以参考。

1.2 多表join查询总结

join的查询优化，是一个复杂的过程。
mysql在join的查询优化中，同样为指定unique查询的sql做了优化，优化方案与单表unique查询类似：若发现指定的unique无法找到匹配的记录，直接返回，而不产生真正的执行计划，如下图所示：

当mysql查询优化发现nkeys.c2 = 20无法匹配到记录，直接返回。并不会继续生成完整的执行计划。

在best_access_plan函数中，对表s进行最优路径选择时，会充分利用range查询优化的结果。若无法利用range查询优化结果，还会使用的统计信息包括：

(1).rec_per_key

每一个key，包含多少记录。在存储引擎，info函数中进行收集。

(2).records_in_table

当前表上，有多少记录。在存储引擎，info函数中进行收集。

对于多表join查询，rec_per_key, records_in_table两个统计信息相当重要，直接影响到最后的执行计划选择。因此在引擎实现中，要充分考虑这两个统计信息的收集算法。如果能够持久化这两个统计信息，就基本上能够保证join查询的执行计划稳定。
下一章节，将分析INNODB如何收集records_in_table，rec_per_key这两个统计信息。

本系列文章主目录：MySQL数据库InnoDB存储引擎查询优化器实现的分析

同分类推荐文章

使用deepseek进行Oracle恢复,引起重大故障（2026-06-22 10:56:00）
接手一个只差临门一脚的数据库恢复（2026-06-18 00:13:09）
我做了一个 AI 版的 StarRocks 升级风险扫描工具，直接帮我定位到一个风险（2026-06-15 01:00:00）

查看更多数据库文章 →

建议继续学习

用Hyer来进行网站的抓取（累计阅读 158,252）
MySQL数据库在实际应用一些方面的介绍（累计阅读 36,400）
WordPress插件开发 -- 在插件使用数据库存储数据（累计阅读 29,164）
Mysql监控指南（累计阅读 21,352）
由浅入深探究mysql索引结构原理、性能分析与优化（累计阅读 16,523）
在Apache2.2.XX下安装Mod-myvhost模块（累计阅读 13,058）
15个最好的免费开源电子商务平台（累计阅读 12,541）
浅谈MySQL索引背后的数据结构及算法（累计阅读 11,909）
整理了一份招PHP高级工程师的面试题（累计阅读 11,709）
深入浅出INNODB MVCC机制与原理（累计阅读 9,693）