MySQL 中group by的实现
这篇讲的是 MySQL 中 `GROUP BY` 到底是如何实现的。作者从一个常见的误解出发——很多人根据执行计划中的 `Using filesort` 认为,`GROUP BY` 是“先排序,后分组”。但真的是这样吗? 作者通过一个对比实验来验证:在查询中显式添加 `ORDER BY NULL` 后,`filesort` 消失了,结果行的出现顺序也发生了改变。这说明排序并非分组的必要步骤,而是后续的一个可选操作。 文章深入到了算法层面。MySQL 实际采用的是一种更高效的哈希分组算法:它会创建一个临时表,遍历原表数据时,根据分组键(key)进行哈希查找。若 key 存在则更新计数,不存在则插入新行。整个过程无需预先排序,时间复杂度是 O(n)。 最后,文章解释了默认情况下我们看到的结果是“有序”的,那仅仅是因为 MySQL 默认在分组后追加了一次排序操作。这与“先排序后分组”的直觉正好相反。