一条SQL引发的对order by的思考

五四陈科学院-坚信科学，分享技术 2010-07-06 23:26:30 累计浏览 3,248 次

本机暂存

内容概览

这篇讲的是，作者从一条实际工作中遇到的、看似简单的SQL查询出发，却意外揭开了MySQL `ORDER BY`机制中不少容易被忽略的深层细节。

文章聚焦于一个核心问题：为什么某些查询在加了`ORDER BY`后，性能会急剧下降甚至导致全表扫描？作者没有停留在表面优化，而是深入到底层，对比了`InnoDB`与`MyISAM`存储引擎在处理`ORDER BY`时的不同策略，特别是利用索引的能力差异。同时，文章还拆解了当排序字段与查询条件字段不一致，或涉及多列排序、不同数据类型时，优化器可能做出的迥异选择。

通过对具体案例的剖析，作者清晰地指出：`ORDER BY`并非一个简单的“结果排序”指令，它与存储引擎的聚簇索引结构、优化器的成本评估紧密相关。理解这些关键差异，才能真正预判SQL的性能，而不是依赖“经验法则”。对于常写SQL的开发者而言，文中对不同场景适用性的分析，提供了一个非常实用的排查思路。

在实际工作中遇到下面一个问题：

有一个表，存有2000万数据。

主键为ID bigint(20) NOT NULL auto_increment

另有一字段time timestamp NOT NULL default CURRENT_TIMESTAMP

故事从这两个字段说起：

sql1需要从这个表中检索出来时间为2010-05-26 11:55:00之前并且id号大于20000的前10条数据

sql2需要从这个表中检索出来时间为2010-05-26 11:55:00之后并且id号大于20000的前10条数据

两条sql写出来大概是这样子的：

sql1:select * from table where time 20000 order by id limit 10;

sql2:select * from table where time >’2010-05-26 11:55:00′ and id>20000 order by id limit 10;

并且已经知道表中的数据，在上面所示时间之前的数据要远远多于所示时间之后的数据。如图1所示：

54chen

图1 数据在时间线上的示意图

实测发现，sql1执行时间0.03s，sql2执行时间33s。

为何大于小于运行的速度相比如何巨大？下面来解答。

第一，用explain来观察两条sql的区别

结论：没什么区别

第二，研究order by

将sql2的order by id修改为order by id desc(排序方向颠倒)后，发现速度马上提到了0.03s的水平。

同样修改sql1的时候，速度马上降到了30s的水平。

进行多次测试，排除mysql本身的缓存干扰。

结论：

sql1的运行示意图如图2所示：

54chen

图2 第一条SQL语句快慢解释图

sql2的运行示意图如图3所示：

54chen

图2 第二条SQL语句快慢解释图

综合上面两个图，mySQL在where查询的时候，也许按照where的条件，按照主键的顺序，最后满足条件的，最后进到内存中去，再进行后面的order by时，asc如果在内存中比不在内存中的就要快得多。

未研究真正实现的代码，仅凭感觉验证。

一句话概括是：按照使用的索引，最后满足条件的数据将留在内存里供进一步排序。

同分类推荐文章

使用deepseek进行Oracle恢复,引起重大故障（2026-06-22 10:56:00）
接手一个只差临门一脚的数据库恢复（2026-06-18 00:13:09）
我做了一个 AI 版的 StarRocks 升级风险扫描工具，直接帮我定位到一个风险（2026-06-15 01:00:00）

查看更多数据库文章 →

建议继续学习

MySQL数据库在实际应用一些方面的介绍（累计阅读 36,399）
由浅入深探究mysql索引结构原理、性能分析与优化（累计阅读 16,523）
如何查找消耗资源较大的SQL （累计阅读 15,211）
浅谈MySQL索引背后的数据结构及算法（累计阅读 11,907）
浅谈TCP优化（累计阅读 11,082）
其实，文件也可以truncate （累计阅读 8,574）
MariaDB常见问题FAQ （累计阅读 8,345）
搜索引擎的特殊用法（累计阅读 8,122）
SQL vs NoSQL：数据库并发写入性能比拼（累计阅读 8,003）
Mysql的随机读取（累计阅读 7,864）