关于两种限流模式

淘宝网综合业务平台团队博客 2012-12-11 13:32:03 累计浏览 2,818 次

本机暂存

内容概览

这篇讲的是高并发系统中两种主流的限流模式：滑窗模式与响应模式。滑窗模式是“事后统计”，通过检查过去多个单位时间窗口内的请求总量是否超标来决定是否放行。它的实现像一个环形计数器数组，逻辑直观，但阈值设定依赖经验或压测，且可能因单位时间请求分布不均导致“先松后紧”。文章指出，它更适合作为对单一资源（如数据库、特定API）的刚性保护承诺。

而响应模式则是一种“实时反馈”策略，它只关心当前正在处理的请求数。文章巧妙地指出了限流的根本目的——是保护系统资源不被拖垮。由于系统容量会受GC、依赖抖动等动态因素影响，响应模式通过公式（QPS/1000*RT）动态计算最大并发数，让限流阈值能随系统实际承载能力自动调整，展现了更强的适应性。

文章最后对比了二者的实现思路：滑窗模式基于数组和环形队列记录历史计数；响应模式则仅需一个原子计数器跟踪活跃请求数。这为在确定性资源保护和自适应系统保护两种场景下的选型提供了清晰的技术参考。

流量预警和限流方案中，比较常用的有两种。第一种滑窗模式，通过统计多个单元时间的访问次数来进行控制，当单位时间的访问次数达到的某个峰值时进行限流。第二种为响应模式，通过控制当前活跃请求数，来进行流量控制。下面来简单分析下两种的优缺点。

1、滑窗模式

模式分析:

在每次有访问进来时，我们判断前N个单位时间里总访问量是否超过了设置的阈值，若超过则不允许执行。

这种模式的实现的方式更加契合流控的本质意义。理解较为简单。但由于访问量的预先不可预见性，会发生单位时间的前半段有大量的请求涌入，而后半段则拒绝所有请求的情况发生。(一般，需要会将单位时间切的足够的细来解决这个问题)其次，我们很难确定这个阈值设置在多少比较合适，只能通过经验或者模拟(如压测)来进行估计，不过即使是压测也很难估计的准确，线上每台机器的硬件参数的不同，或者同一台机子在不同的时间点其可以接受的阈值也不尽相同(系统中)，每个时间点导致能够承受的最大阈值也不尽相同，我们无法考虑的周全。

所以滑窗模式往往用来对某一资源的保护上(或者说是承诺比较合适：我对某一接口的提供者承诺过，最高调用量不超过XX)，如对db的保护，对某一服务的调用的控制上。因为对于我们应用来说，db或某一接口就是一共单一的整体。

代码实现思路：

每一个窗(单位时间)就是一个独立的计数器(原子计数器)，用以数组保存。将当前时间以某种方式(比如取模)映射到数组的一项中。每次访问先对当前窗内计数器+1，再计算前N个单元格的访问量综合，超过阈值则限流。

这里有个问题，时间永远是递增的，单纯的取模，会导致数组过长，使用内存过多，我们可以用环形队列来解决这个问题。

2、响应模式

模式分析：

每次操作执行时，我们通过判断当前正在执行的访问数是否超过某个阈值在决定是否限流。

该模式看着思路比较的另类，但却有其独到之处。实际上我们限流的根本是为了保护资源，防止系统接受的请求过多，应接不暇，拖慢系统中其他接口的服务，造成雪崩。也就是说我们真正需要关心的是那些运行中的请求，而那些已经完成的请求已是过去时，不再是需要关心的了。

我们来看看其阈值的计算方式，对于一个请求来说，响应时间rt/qps是一个比较容易获取的参数，那么我们这样计算：qps/1000*rt。

此外，一个应用往往是个复杂的系统，提供的服务或者暴露的请求、资源不止一个。内部GC、定时任务的执行、其他服务访问的骤增，外部依赖方、db的抖动，抑或是代码中不经意间的一个bug。都可能导致相应时间的变化，导致系统同时可以执行请求的变化。而这种模式，则能恰如其分的自动做出调整，当系统不适时，rt增加时，会自动的对qps做出适应。

代码实现思路:

当访问开始时，我们对当前计数器(原子计数器)+1，当完成时，-1。该计数器即为当前正在执行的请求数。只需判断这个计数器是否超过阈值即可。

同分类推荐文章

等了十年的 Go 链式管道，终于来了：seq 让你像写 Scala 一样写 Go （2026-06-25 18:38:18）
Go 实验特性详解（2026-06-21 10:05:27）
amd64 微架构级别对 Go 程序性能提升多少？（2026-06-21 09:38:49）

查看更多后端文章 →

建议继续学习

腾讯后台开发技术总监浅谈过载保护小心雪崩效应（累计阅读 7,112）
微博架构与平台安全演讲稿（累计阅读 5,742）
基于漏桶(Leaky bucket)与令牌桶(Token bucket)算法的流量控制（累计阅读 4,571）
squid对源网站进行限速（累计阅读 4,014）
InnoDB线程并发检查机制（累计阅读 3,820）
限流系统如何发现系统的热点（累计阅读 3,232）
深入理解Oracle中的Mutex （累计阅读 3,111）
对爬虫的限制（累计阅读 2,970）
没有比解决瓶颈更高效的事情了（累计阅读 2,639）
TCP 滑动窗口与窗口缩放因子(Window Scaling) （累计阅读 2,103）