MySQL源代码的海洋中游弋初探MySQL之SQL执行过程

MySQLOPS 数据库与运维自动化技术分享 2012-05-15 23:30:12 累计浏览 4,042 次

本机暂存

内容概览

这篇讲的是搜狐DBA团队技术沙龙分享中，如何从MySQL源码层面探查一条SQL语句的真实执行轨迹。

文章以几个典型查询（如GROUP BY、两表JOIN）为例，深入其底层逻辑：当执行`GROUP BY`且未命中索引时，MySQL会如何通过临时表的写入、重复键检测与最终排序来完成操作；而一旦GROUP BY的列上存在有序索引，执行流程又如何被优化，跳过临时表和filesort。作者还进一步剖析了Nested Loop Join（嵌套循环连接）的算法图示，以及派生表、依赖子查询等复杂结构的内部处理。

最巧妙的部分在于，文章通过跟踪源码中临时表创建、join buffer使用等“痕迹”，将EXPLAIN输出里诸如“Using temporary”或“Using join buffer”这样的抽象结论，还原成了具体的数据流转步骤。这正呼应了其核心观点：阅读手册概念易有“空中楼阁”之感，而深入源码才能获得“脚踏实地”的理解，最终目标是看懂并利用好EXPLAIN的每一次输出。

导读：

2012年5月12日，MySQL技术群-北京技术圈的MySQL爱好者，聚集搜狐公司，举办MySQL数据库技术沙龙，本文内容为搜狐DBA团队古雷(外号：古大师，因研究佛学而来)分享的MySQL之SQL执行过程，先整理成文章的方式供大家阅读，古大师也是mysqlops中文网的技术编辑之一。

序言：

不积跬步，无以至千里；不积小流，无以成江海——《劝学》荀子
吾生也有涯，而知也无涯。以有涯随无涯，殆已——《养生主》庄子

Group by

select name1 from test group by name1;
从InnoDB存储引擎表读出一条记录，写入临时表，循环往复
临时表中，group by的key(本例中为name1)
- -每个KEY值只有一行记录
- -(相同KEY值写入，检测到重复键错误，忽略此错误并继续)
从临时表中读取记录(全部或KEY)
排序(filesort)
发送排序结果

Group by + sum

select sum(id) from test group by name1;
从InnoDB存储引擎表读取一条记录，写入临时表，循环往复
临时表中group by的key(本例中为name1)
- -有一个hash索引
- -每个KEY值只有一行记录
- -写入临时表每行记录时，更新相同KEY的sum值
以group by的key对临时表排序(filesort)
发送排序结果
If you use GROUP BY, output rows are sorted according to the GROUP BY columns as if you had an ORDER BY for the same columns. To avoid the overhead of sorting that GROUP BY produces, add ORDER BY NULL