缓存算法–LRU

JavaRanger - 专注JAVA高性能程序开发、JVM、Mysql优化、算法 2015-12-13 22:12:12 累计浏览 3,595 次

本机暂存

内容概览

这篇讲的是两种经典的缓存淘汰算法：LRU和它的改进版LRU-K。文章开门见山，先解析了LRU（最近最少使用）的核心思想——它用一个巧妙的链表来实现，新数据插入头部，每次访问都把数据提到最前，满了就淘汰尾部那个“最久没碰”的。这种策略在热点数据集中时效率很高，实现也简单。

但文章也指出了LRU的软肋：一旦出现偶发的批量扫描，会挤掉很多热门数据，造成严重的“缓存污染”。为了解决这个问题，文章引入了LRU-K。这里的“K”代表一个访问次数阈值，比如我们常说的LRU-2。它不再因为一次访问就把数据加入缓存，而是让数据在历史队列中先“排队”，只有被访问了K次，证明它确实是热点，才获准进入缓存队列。

这样一来，LRU-K的命中率通常比LRU更高，能有效抵抗缓存污染。但天下没有免费的午餐，它的实现需要维护额外的访问历史队列并进行排序，算法复杂度、内存消耗和CPU开销都比LRU要高。文章最后也点明了选择的关键：LRU胜在简单高效，适合大多数常规场景；而当你面对严重的访问模式波动时，LRU-K（尤其是LRU-2）提供了一个更稳健的选择。

LRU

LRU是Least Recently Used 的缩写，翻译过来就是“最近最少使用”，也就是说，LRU缓存把最近最少使用的数据移除，让给最新读取的数据。而往往最常读取的，也是读取次数最多的，所以，利用LRU缓存，我们能够提高系统的performance.

LRU实现

1. 新数据插入到链表头部；

2. 每当缓存命中(即缓存数据被访问)，则将数据移到链表头部；

3. 当链表满的时候，将链表尾部的数据丢弃。

LRU分析

【命中率】

当存在热点数据时，LRU的效率很好，但偶发性的、周期性的批量操作会导致LRU命中率急剧下降，缓存污染情况比较严重。

【复杂度】

实现简单。

【代价】

命中时需要遍历链表，找到命中的数据块索引，然后需要将数据移到头部。

LRU-K

LRU-K中的K代表最近使用的次数，因此LRU可以认为是LRU-1。LRU-K的主要目的是为了解决LRU算法“缓存污染”的问题，其核心思想是将“最近使用过1次”的判断标准扩展为“最近使用过K次”。

实现

相比LRU，LRU-K需要多维护一个队列，用于记录所有缓存数据被访问的历史。只有当数据的访问次数达到K次的时候，才将数据放入缓存。当需要淘汰数据时，LRU-K会淘汰第K次访问时间距当前时间最大的数据。详细实现如下：

1. 数据第一次被访问，加入到访问历史列表；

2. 如果数据在访问历史列表里后没有达到K次访问，则按照一定规则(FIFO，LRU)淘汰；

3. 当访问历史队列中的数据访问次数达到K次后，将数据索引从历史队列删除，将数据移到缓存队列中，并缓存此数据，缓存队列重新按照时间排序；

4. 缓存数据队列中被再次访问后，重新排序；

5. 需要淘汰数据时，淘汰缓存队列中排在末尾的数据，即：淘汰“倒数第K次访问离现在最久”的数据。

LRU-K具有LRU的优点，同时能够避免LRU的缺点，实际应用中LRU-2是综合各种因素后最优的选择，LRU-3或者更大的K值命中率会高，但适应性差，需要大量的数据访问才能将历史访问记录清除掉。

分析

【命中率】

LRU-K降低了“缓存污染”带来的问题，命中率比LRU要高。

【复杂度】

LRU-K队列是一个优先级队列，算法复杂度和代价比较高。

【代价】

由于LRU-K还需要记录那些被访问过、但还没有放入缓存的对象，因此内存消耗会比LRU要多；当数据量很大的时候，内存消耗会比较可观。

LRU-K需要基于时间进行排序(可以需要淘汰时再排序，也可以即时排序)，CPU消耗比LRU要高。

同分类推荐文章

对基本有序的序列排序算法（2026-06-11 17:46:49）
Four Levels Of Customer Understanding （2026-05-22 21:00:00）
除法的意义（2026-04-12 20:52:17）

查看更多算法文章 →

建议继续学习

如何成为Python高手（累计阅读 54,992）
红黑树并没有我们想象的那么难(上) （累计阅读 21,494）
Linux 性能监控、测试、优化工具（累计阅读 13,010）
include(“./file.php”)和include(“file.php”)区别（累计阅读 12,788）
为什么算法这么难？（累计阅读 12,397）
浅谈MySQL索引背后的数据结构及算法（累计阅读 11,902）
加州求职记（累计阅读 11,561）
Rolling cURL: PHP并发最佳实践（累计阅读 11,486）
海量数据面试题举例（累计阅读 11,114）
基于Redis构建系统的经验和教训（累计阅读 10,521）