无锁消息队列

捣乱小子 2014-12-30 12:22:52 累计浏览 14,273 次

本机暂存

内容概览

这篇讲的是如何在共享内存中设计高效的无锁消息队列。作者从实际项目需求出发——为了将耗时的数据落地任务从主逻辑进程中剥离，以提升整体处理能力——提出了用无锁队列替代频繁系统调用的方案。

文章的核心是从简单到复杂，逐步推演无锁队列的设计。首先探讨了最基础的单生产者与单消费者场景，仅需维护 front 和 rear 指针，利用循环队列即可高效工作。接着，为解决多消费者并发出队的问题，引入了 CAS（Compare & Set）原子操作来安全地更新指针。最后，在多生产者多消费者的最复杂场景下，通过增加一个 write_index 变量，结合两次 CAS 操作来协调生产者之间的写入竞争，确保了数据一致性。

文章结合具体图示和伪代码，清晰地阐述了不同并发模型下的实现关键与细微差别，例如利用 CAS 实现“乐观锁”，以及在生产者操作失败时通过 sched_yield() 让出 CPU 的优化技巧。作者在项目中实际应用了其中一种设计，最终观察到 CPU 使用率下降了约10%，验证了该方案的有效性。

背景

近期在项目中用到了无锁队列 (lock free queue)这个东西，在项目中后台需要收集数据，待收集完整后需要落地，如果收集和落地都由一个进程来做，效果不好。无锁队列是蛮实用的一种数据结构。譬如，当一些后台的任务，写数据库，文件等，会出现较长时间的阻塞，可以交由后台进程去处理。这时候就涉及 IPC 方面的知识。当然，完全可以使用 fifo，mq 之类的系统预置的调用，但频繁的系统调用是吃不消的。

一个解决方法是，在共享内存中实现无锁队列，逻辑进程往队列中 push 任务，后端服务进程从队列中 pop 任务，以提高逻辑进程的处理能力。

单个生产者与单个消费者

如果一个共享队列只与一个生产者与一个消费者共享，那么此队列可以这么设计：

在共享内存中，分别维护 front 指针，rear 指针和循环队列，其中 front 指针指向队列头部，其值由生产者维护；rear 指针指向队列尾部，其值由消费者维护；循环队列是一个大数组。注意，front, rear 存储的是数据的下标而已，且队列最后一个空间不可用，后者是为了方便作 full 判断。

所以，当 front==rear 的时候，队列为空：

当 (front+1)%MAX_QUEUE_SIZE==rear 的时候，队列满了：

获取循环队列大小的时候，需要注意 front<rear 的情况：

queue_size = (front-rear)<0 ? (front+MAX_QUEUE_SIZE-rear) : front-rear

此时，最简单的无锁共享队列即完成了。为，front, rear 指针分别由单个生产者和单个消费者维护(修改)，这里不存在覆盖写等问题。后台进程可定期检测队列是否为空，非空的时候执行消费操作即可。经过讨论，项目中采用是这种数据结构并更新了系统设计方案(逻辑层和存储层分离)，CPU 降低了 10%~

单个生产者与多个消费者

背景

多个进程共同维护一份数据的时候，非常容易出问题，譬如最常见的是丢失修改问题。要保证更新这些指针的时候是原子操作，才可以避规避这些情况，linux 下最常见的即是加锁。

在我们的项目中，生产者经过优化后能力超过了后端消费能力，于是想到增加消费者，但上面的“单个生产者与单个消费者”中描述的数据结构不能满足要求。在介绍解决方法之前，要介绍一下 CAS 操作。

CAS 简介

如何保证原子操作？简单加减运算的原子性能通过 CPU 提供的 CAS 原子操作 CMPXCHG 指令来保证。CAS 即 Compare & Set，或者 Compare & Swap，这有点类似于乐观锁。即在正在的修改操作之前，先读取旧的值 old，在修改完成之后，再一次读取旧值是否更改，如果更改则再尝试，直到修改成功为止。

c 语言描述可以写成：

bool CAS(type *accum, type *dest, int newval)
{
  if ( *accum == *dest ) {
      *dest = newval;
      return true;
  }
  return false;
}

CAS 操作帮忙解决了多进程维护一份数据的同步问题。

具体实现

具体实现需要在“单个生产者与单个消费者”中描述的方法上，稍微修改一下。入队操作都是一样的，只有一个生产者，维护 front 值。出队操作稍有不同。

先保存旧的 rear ->old_rear，接着拷贝数据，

CAS(&rear, old_rear, rear+1)，如果用数组模拟环形数组，考虑越界的情况，

不成功，重新开始。

多个生产者与多个消费者

这种情况下，要考虑多个生产者之间 push 操作同步的问题。

我们设置三个值：front, rear, write_index. 前两个值和上面描述的一样，分别是队列头部和尾部，write_index 的作用是为生产者在 push 的时候预留空间，在无 push 操作的时候，write_index==front。

在入队的时候，保存旧的 write_index -> old_write_index，接着 CAS(&write_index, old_write_index, old_write_index+1).

接着将数据写到对应的位置上，

最后 CAS(&front, old_write_index, old_write_index+1)，直到 CAS 成功为止。

在网络上的资料中，还在这最后一步不成功的情况下添了点花：不成功的时候，调用 sched_yield(); 主要目的是让该生产者主动让出 cpu 给其他的生产者，因为可能其他生产者正在执行 push 操作，这样它就可以完成 push 操作了。确实，这在处理器数量少于生产者数量的时候，对性能来说是比较关键的。

这里涉及两个 CAS 操作。如果有两个进程同时 push，A 先执行 push，但结果 B 先完成 push 操作，结果是 A push 操作不成功，但它会继续尝试 push 直到成功为止。

出队的操作和“单个生产者与多个消费者”中描述的方法一样。在现有的项目中，较少遇到“多个生产者与多个消费者”的场景，这样复杂的情况，可能还不如开多个队列，让不同的生产者去 push 不同的队列，以简化问题。

推荐看《参考》中的资料。另外，上面的无锁消息队列都是基于线性数组的，还有一种是基于链表的做法，这里有一份实现代码，推荐看：https://github.com/haipome/lock_free_queue

参考：

http://www.codeproject.com/Articles/153898/Yet-another-implementation-of-a-lock-free-circular

http://coolshell.cn/articles/8239.html

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.53.8674&rep=rep1&type=pdf

同分类推荐文章

对基本有序的序列排序算法（2026-06-11 17:46:49）
Four Levels Of Customer Understanding （2026-05-22 21:00:00）
除法的意义（2026-04-12 20:52:17）

查看更多算法文章 →

建议继续学习

一种常见的并发编程场景的处理（累计阅读 23,588）
python编程细节──遍历dict的两种方法比较（累计阅读 20,370）
一种高效无锁内存队列的实现（累计阅读 12,093）
Key-Value小数据库tmdb发布：原理和实现（累计阅读 8,348）
TT的作者出新作品鸟:kyoto tycoon （累计阅读 7,948）
程序中的“多线程” （累计阅读 7,322）
并发框架Disruptor译文（累计阅读 6,757）
7个示例科普CPU Cache （累计阅读 5,415）
进程和线程关系及区别（累计阅读 5,356）
Tips of Linux C programming （累计阅读 5,238）