Ring Buffer 的应用

云风的 BLOG 2012-02-05 15:29:41 累计浏览 2,447 次

本机暂存

内容概览

这篇讲的是 Ring Buffer（环形缓冲区）这个经典数据结构的实际应用思考。作者坦言，文章起源于微博上的一场技术讨论甚至争论，他借此机会将散落的观点系统梳理，成文的初衷并非给出一个非黑即白的“最佳方案”，而是为不同技术视角的碰撞提供一个汇总，旨在帮助读者开拓思路。

文章核心探讨了在具体工程场景中采用 Ring Buffer 可能带来的利弊权衡。作者没有停留在教科书式的原理讲解，而是从“信不信这样能更好”的实践角度出发，分析了在特定背景下，Ring Buffer 作为一种解耦、缓冲或同步机制时的适用性。内容涉及了其在高并发、低延迟或流处理等场景中的潜在优势，同时也未回避其可能引入的复杂性或局限性。

如果你在系统设计中曾纠结于选择何种缓冲机制，或者对如何在特定约束下平衡吞吐量与延迟感到困惑，这篇文章提供的正是一次开放式的思路梳理。它更像是一场技术讨论的精华回顾，而非一份标准答案手册，其中关于环形缓冲区线程安全实现与性能权衡的具体讨论，对架构选型和编码实现都有直接的参考价值。

这是一篇命题作文，源于今天在微薄上的一系列讨(好吧，也可以说是吵架)。其实方案没有太多好坏，就看你信不信这样做能好一些或坏一些。那么，整理成 blog 写出，也就是供大家开拓思路了。

我理解的需求来源于网络服务提供程序的一个普遍场景：一个服务器程序可能会收到多个客户端的网络数据流，在每个数据流上实际上有多个独立的数据包，只有一个数据包接收完整了才能做进一步的处理。如果在一个网络连接上数据包并不完整，就需要暂时缓存住尚未接收完的数据包。

问题是：如何管理这些缓冲区比较简洁明了，且性能高效。

其实这个有许多解决方案，比如为每个网络连接开一个单独的固定长度的 buffer 。或是用 memory pool 等改善内存使用率以及动态内存分配释放，等等。今天在微薄上吵架也正是在于这些方案细节上，到底好与不好，性能到底如何。既然单开一篇 blog 了，我不像再谈任何有争议的细节，仅仅说说，用 Ring Buffer 如何解决这个问题。

具体点说，我倾向于用 C 语言来做这种偏底层、业务简单的模块。为了减低工作量，可以使用一些成熟的库，比如 libev 等。

类似的库多半提供的是一种回调机制的框架，设置好对应的 IO 异步请求的 callback 函数，然后启动框架的主循环，每个 socket (或别的句柄)可读写时，回调注册好的函数。

把这件事情做的干净漂亮的关键点之一在于数据缓冲区的管理。

拿到需求后，我们应该适当估算我们的程序需要解决多大的数据吞吐量。比如，我们可以假设，一个逻辑完整的数据包在 TCP 连接上，可能最长大约会经过一两秒时间，通过 1 到 10 个包发送过来。整个系统每秒会处理 100M 字节(千兆网)的数据流，那么大约在 10 秒内，处理的数据量大约就在 1G 。

根据对实际业务的估算，这个值可能不到 1G ，128M 就够，也可能多达几个 G 。没关系。我们只是估算出，大致在这个范围内，一个独立的逻辑包一定存在于整个数据流的截段中。我指的数据流是服务程序从网卡上读到的所有数据。

就以 1G 为例，那么这个服务程序只需要开单个这么大的 buffer 就足够了，不必再有任何的动态内存管理。

我们把所有的数据，不论它来至哪个 TCP 连接，都以循环队列的方式，无差别的循序置入这个 buffer。放置的时候，以每次 IO 可读时可以读入的最大字节长度为限。一旦放不下，就折返到 buffer 头部。

buffer 里大概的数据结构是这样的：

[数据长度连接号下一块的位置数据] [数据长度连接号下一块的位置数据] [数据长度连接号下一块的位置数据] ...

另外，内存里开一张 hash 表，记下连接号到数据块的映射关系。如果不想用 hash 表的话，也可以在 buffer 中直接记下连接对象在内存中的地址。

每当一个连接可读的时候，无论读到多少字节，都向这个 buffer 后面追加。并且用链表将其和历史上曾经读过的数据连起来。

同时，可以分析一个逻辑包是否完成。如果没有完成，则继续下面的工作。完成了的话，则利用已有的链表，将分离的数据块拼合在一块连续的内存上。之后，如何处理这个逻辑包，就不在是这个层次上的工作了。

对于处理掉的数据块，可以做一个记号表示废弃即可。我的做法是对数据长度段取反，这样 buffer 在循环使用时，可以判断出下面的内存空间是否可以安全使用。

处理完一个逻辑包后，有可能最后一块数据被切分出去。我的做法时调整这个块，前半块标记为废弃数据块，后半块为待处理数据块。

理论上，如果你的估算没有错且留有余量的话，每次新到来的数据包都能在 buffer 中找到储存它们的空间。因为根据估算，消费速度是要大于生产速度的。不然整个系统都跑不下去。

但如果碰到例外怎么办? 比如有个客户端半个逻辑包发来以后，迟迟不发下半个包。最简单的做法是，碰到 ring buffer 回卷后，碰到那些未废弃的数据块(尚未处理掉)，索引到对应的连接，直接 close 掉连接，把没有处理的数据扔掉即可。因为在互联网上，连接本来就是不稳定的。你的协议原本就要处理主动断开连接的情况。无非是根据 ring buffer 的大小和当时的负载情况，设置了一个超时而已。

有兴趣的同学，可以用这个思路实现一下几年前我提到的连接服务器。代码量应该不大。

另，在更高层的应用上，同样可以使用类似的策略。即循环使用一个 ring buffer 。当 buffer 回转时碰到有对象占用 buffer 拦路时，杀掉对象。对于一些对象比较复杂占用的数据段不固定，对象生命期很短的应用，ring buffer 都有参考价值。例如 3d engine 中的粒子系统。对于要个别需要长期生存的对象，还可以定期复制自己，重新压入 ring buffer 的方式来延长生命期。

使用 ring buffer 的优势是内存使用率很高，不会造成内存碎片，几乎没有浪费(比如传统动态内存分配需要的 cookie)。业务处理的同一时间，访问的内存数据段集中。可以更好的适应不同系统，取得较高的性能。内存的物理布局简单单一，不太容易发生内存越界、悬空指针等 bug ，出了问题也容易在内存级别分析调试。做出来的系统容易保持健壮。

同分类推荐文章

等了十年的 Go 链式管道，终于来了：seq 让你像写 Scala 一样写 Go （2026-06-25 18:38:18）
Go 实验特性详解（2026-06-21 10:05:27）
amd64 微架构级别对 Go 程序性能提升多少？（2026-06-21 09:38:49）

查看更多后端文章 →

建议继续学习

如何成为Python高手（累计阅读 54,992）
libcurl的使用总结（二）（累计阅读 15,083）
Linux 性能监控、测试、优化工具（累计阅读 13,012）
include(“./file.php”)和include(“file.php”)区别（累计阅读 12,789）
Rolling cURL: PHP并发最佳实践（累计阅读 11,488）
关于使用STL的红黑树map还是hashmap的问题（累计阅读 8,876）
jQuery性能优化指南（累计阅读 8,819）
提升磁盘IO性能的几个技巧（累计阅读 8,512）
关于PHP的编译和执行分离（累计阅读 8,345）
Mysql的随机读取（累计阅读 7,865）