MySQL中like语句及相关优化器tips

MySQLOPS 数据库与运维自动化技术分享 2012-09-30 15:32:37 累计浏览 6,282 次

本机暂存

标签 InnoDB MySQL 优化器索引

内容概览

这篇讲的是MySQL中`LIKE`语句的正确使用姿势以及背后的优化器逻辑。作者从“为什么有些`LIKE`查询能走索引，有些却成了全表扫描”这个问题切入，深入剖析了优化器如何根据匹配模式（前缀匹配、后缀匹配、中间匹配）来决定查询计划。

文章清晰地指出了使用`LIKE`的一个核心原则：尽量使用前缀匹配（如 `'abc%'`），因为这能有效利用索引，避免扫描全表。对于后缀匹配（`'%abc'`）和中间匹配（`'%abc%'`）这两种典型场景，文章分析了它们无法高效利用传统B+索引的原因，并提供了几种实用的替代方案，例如使用反转函数创建函数索引，或者借助全文索引等。

更进一步，文章还揭示了MySQL优化器在处理`LIKE`时的一些“小聪明”，比如如何通过`index dive`或统计信息来估算行数，从而影响最终的执行计划选择。这些细节对于理解查询性能瓶颈至关重要。

无论你是正在编写复杂查询的DBA，还是日常进行SQL开发的后端工程师，这篇文章提供的底层原理和优化技巧，都能帮助你避开`LIKE`语句的性能陷阱，写出更高效的数据库访问代码。

背景

MySQL中在对某个字段做包含匹配时可以用like。

先看这个结构和结果

CREATE TABLE `tb` ( `id` int(11) NOT NULL AUTO_INCREMENT, `user_id` bigint(20) DEFAULT NULL, `title` varchar(128) NOT NULL,

`memo` varchar(2000) DEFAULT NULL,

PRIMARY KEY (`id`),

KEY `title` (`title`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

mysql> explain select * from tb where title like ‘%abcd%’;

+—-+————-+——-+——+—————+——+———+——+——+————-+

+—-+————-+——-+——+—————+——+———+——+——+————-+

+—-+————-+——-+——+—————+——+———+——+——+————-+

1 row in set (1.65 sec)

由于like用的是 ‘%xx%’, 不符合前缀匹配的规则，因此用不上索引title，只能作全表扫描。

问题

以上为官方回答。但是如果是在 InnoDB这种聚集索引组织的表中，假设这个表单行很大，比如后面还有若干个类似memo的字段。

这样聚集索引会很大，导致全表扫描需要读更多的磁盘。而理想情况应该是这个流程

1) 遍历title索引，从中读取和过滤所有title中匹配like条件的id

2) 用id到聚簇索引中读数据。

在单行很大，而like能够过滤掉比较多语句的情况下，上面的流程肯定比全表扫描更快，也更省资源。

FORCE INDEX行不行？

第一个反应是用force index。

+—-+————-+——-+——+—————+——+———+——+——+————-+

1 row in set (0.00 sec)

显然不行。原因是通常情况下，force index只能从possible_keys中强制选择某一个索引，但是这个查询的possible_keys是NULL, force index 无效。

覆盖索引

我们想到覆盖索引，试验这个语句。

+—-+————-+——-+——-+—————+——-+———+——+——+————————-+

1 row in set (0.00 sec)

我们看到这个语句用上了title索引，而且Using index表明用上了覆盖索引。

有同学可能会疑惑，这里possible_keys是NULL, 为什么key用上了title，应了那句“nothing imposible”?

实际上在MySQL优化器里面专门加了这一段，在type= JT_ALL时，会特别扫一下所有能够满足的覆盖索引，并找长度最短的那个。

这么做的考虑就是基于选择小的索引，减少读盘。重要的是，这个优化对于现有的引擎是通用的。

因此上面说的“通常情况下”的例外就是：force index可以强制使用覆盖索引。比如常见的 select count(*) from tb. 这时候你force index所有已存在的索引都是可以生效的。

权宜之计

了解了覆盖索引的效果，我们可以把查询改写为如下，以满足我们最开始希望的执行流程。

| 1 | PRIMARY | tb | const | PRIMARY | PRIMARY | 4 | const | 1 | |

+—-+————-+————-+——-+—————+————+———+——-+——+————————-+

3 rows in set (0.00 sec)

从explain结果中看执行流程是按照我们之前描述的那样，但是引入了JOIN。

JOIN写法还会引入primary key查询的时候是随机查询，因此最终的效率受like的过滤效果影响.

这个改写对性能的提升效果取决于要使用的索引与总数据量的大小比较，需要作应用测试。

同分类推荐文章

使用deepseek进行Oracle恢复,引起重大故障（2026-06-22 10:56:00）
接手一个只差临门一脚的数据库恢复（2026-06-18 00:13:09）
我做了一个 AI 版的 StarRocks 升级风险扫描工具，直接帮我定位到一个风险（2026-06-15 01:00:00）

查看更多数据库文章 →

建议继续学习

用Hyer来进行网站的抓取（累计阅读 158,251）
MySQL数据库在实际应用一些方面的介绍（累计阅读 36,397）
WordPress插件开发 -- 在插件使用数据库存储数据（累计阅读 29,164）
Mysql监控指南（累计阅读 21,351）
由浅入深探究mysql索引结构原理、性能分析与优化（累计阅读 16,523）
在Apache2.2.XX下安装Mod-myvhost模块（累计阅读 13,057）
15个最好的免费开源电子商务平台（累计阅读 12,541）
浅谈MySQL索引背后的数据结构及算法（累计阅读 11,904）
整理了一份招PHP高级工程师的面试题（累计阅读 11,708）
深入浅出INNODB MVCC机制与原理（累计阅读 9,693）