深入理解Linux用户空间的锁机制

搜索研发部官方博客 2012-07-09 23:06:39 累计浏览 4,245 次

本机暂存

内容概览

这篇讲的是并发编程中如何选锁的经典问题。作者从Linux用户空间常见的几种同步原语——mutex、读写锁（rwlock）、以及自旋锁（spinlock）出发，梳理了它们在实现机制和适用场景上的核心差异。

关键在于实现层面：mutex在获取锁失败时会将调用线程挂起并让出CPU，涉及内核态切换，开销相对较大；读写锁允许多个线程同时持有读锁，但在有写锁时互斥；而自旋锁则让线程在原地“忙等”，不涉及上下文切换，但会持续消耗CPU资源。

这些根本区别直接决定了它们的战场：mutex适用于临界区较长且可能休眠的场景；读写锁是“读多写少”情况下的利器；自旋锁则留给那些临界区极短、且能保证持锁期间不被抢占的“硬核”代码路径。文章不仅讲清了区别，还点明了误用可能带来的性能损耗甚至死锁风险，对实际编码很有指导价值。

1. 缘起

随着SMP(Symmetrical Multi-Processing)架构的流行和epoll类系统调用对非阻塞fd监视的支持，高性能服务器端的开发已经能够实现CPU计算和IO的分离。为了充分发挥CPU的计算能力，服务器端的设计必须要尽量减少线程切换。引起线程切换最重要的原因之一就是对mutex和semaphor等锁的使用。本文从计算机体系架构、操作系统的支持和mutex的实现彻底分析Linux用户空间mutex的实现，分析的源码版本是glib-2.3.4和kernel-2.6.8。

2. 体系结构和指令的支持

在UP(uni processor)架构下，从用户空间的角度看，中断打断了程序的正常执行。操作系统在处理完中断之后，返回用户空间的之前，重新调度系统中的线程执行。由于CPU是在执行汇编指令结束后响应中断，那么单条汇编指令的执行就是原子的。

在SMP下，由于存在CPU Local Cache和每个CPU的指令周期不同，单条汇编指令的执行不会是原子的。X86 SMP提供了一个lock指令前缀，使得某些汇编指令的执行是原子的。看如下x86_64体系结构的汇编代码，来自glibc。

Intel® 64 and IA-32 Architectures Software Developer’s Manual Volume 2中对cmpxchg指令的解释如下：

This instruction can be used with a LOCK prefix to allow the instruction to be executed atomically.

所有以lock为前缀的指令都起内存栅栏的作用。内存栅栏使编译器确保对RAM中数据的改变对所有CPU都是可见的。

上述汇编对应的伪代码：

原图已失效

Intel® 64 and IA-32 Architectures Software Developer’s Manual Volume 2中对cmpxchg指令的解释如下：

This instruction can be used with a LOCK prefix to allow the instruction to be executed atomically.

所有以lock为前缀的指令都起内存栅栏的作用。内存栅栏使编译器确保对RAM中数据的改变对所有CPU都是可见的。

上述汇编对应的伪代码：

3. 操作系统支持

按照操作系统的经典定义，进程是资源分配的最小单位，线程是调度的最小单位。Linux操作系统提供了futex系统调用以支持mutex等锁的实现。futex的主要功能是使得线程以TASK_INTERRUPTIBLE状态等待处于进程空间的某变量的改变，或者使得某线程可以唤醒等待该变量的其他线程。

2.6.8版的Kernel中，futex的实现使用一个futex_hash_bucket。操作系统用户空间任何线程如果在等待mutex或者semaphore的up操作，都是以每个锁的address等为key，将自身线程挂到该futex_hash_bucket等待被唤醒。

实现wait的步骤如下：

A. down_read(&current->mm->mmap_sem); 得到当前线程整个地址空间的读锁，从该步起到up_read()，与线程同一个进程的其他线程mmap()和brk()系统调用都会挂起，mmap()和brk()是malloc()和free()的基础。

B. 调用find_extend_vma(),以确认用户空间锁的地址是否是shared or private mapping. shared mapping一般是进程有多个线程引起的。find_extend_vma()会搜索整个进程地址空间段组成红黑树，以确定该地址空间的类型。

C. 计算key。如果是单进程单线程，Key为用户空间地址。如果为单进程多线程，需要执行spin_lock(&current->mm->page_table_lock);得到用户地址对应的page，然后spin_unlock(&current->mm->page_table_lock)。 page_table_lock会影响相应进程的page fault的处理。

D. 将自身线程加入到futex_hash_bucket，futex_hash_bucket的每个桶有一个spin lock保护。

E. up_read(&current->mm->mmap_sem);

F. __set_current_state(TASK_INTERRUPTIBLE);

G. __set_current_state(TASK_RUNNING); 此时线程已经被其他线程唤醒。

H. 将自身从futex_hash_bucket移除。

实现wake up的步骤如下：

A. 执行wait的A到C。

B. spin_lock(&bh->lock);给相应桶加锁。

C. 唤醒在锁上的一个等待线程。

D. spin_unlock(&bh->lock);

E. up_read(&current->mm->mmap_sem);

4. pthread_mutex实现分析

pthread_mutex_lock()实现在glibc-2.3.4 pthread_mutex_lock.c文件的33行，该函数会根据mutex在init的时候设置的属性，选择不同的执行路径。mutex的属性有四种：

A. PTHREAD_MUTEX_TIMED_NP：默认属性。pthread_mutex_lock()直接调用lll_mutex_lock()。

B. PTHREAD_MUTEX_RECURSIVE_NP：检查 mutex owner 是否为当前线程。该属性允许线程多次获取该锁。

C. PTHREAD_MUTEX_ERRORCHECK_NP：如果同一线程两次lock，会返回错误。

D. PTHREAD_MUTEX_ADAPTIVE_NP：该锁会先n次调用lll_mutex_trylock()，n为用户定义和100的最小值。如果仍然失败，则调用lll_mutex_lock()。lll_mutex_trylock()不会调用futex。

5. spin lock实现

nginx实现了spin lock以保护多进程对listen port的互斥accept。spinlock的实现如下：

原图已失效

Spinlock本质上是一个“忙等”锁，由于其不存在下节中总结的mutex的缺点，其对于小资源是最高效的锁。相比上节中mutex的PTHREAD_MUTEX_ADAPTIVE_NP属性，nginx的spinlock是一个更完美的实现方案。

6. 总结

在设置PTHREAD_MUTEX_TIMED_NP属性和单进程多线程模型下，pthread_mutex_lock()对同进程的其他线程的影响如下：

A. pthread_mutex_lock()占用的大部分CPU时间当中，直接影响其他线程调用mmap()，brk()，malloc和free()。

B. 对进程处理page fault也会有影响。

C. 如果整个操作系统的用户进程使用了过多的mutex之类的锁，那么所有锁共享的futex_hash_bucket将是一个瓶颈。

D. 最重要的是，锁的使用会引起线程的频繁切换，导致cpu cache miss和TLB miss。

同分类推荐文章

SmartPerfetto 2026.06.04-07.17 六周更新复盘：从 v1.0.28 到 v1.1.1 （2026-07-17 00:00:00）
用 CLIProxyAPI 把 Codex 变成一个 OpenAI 兼容的 API 服务（2026-07-12 22:05:00）
读完 Bun 用 Rust 重写：1 个人 11 天重写 50 万行代码是怎么做到的（2026-07-12 08:00:00）

查看更多后端文章 →

建议继续学习

如何成为Python高手（累计阅读 55,059）
Linux如何统计进程的CPU利用率（累计阅读 16,385）
我的 RHCA 之路（累计阅读 14,072）
Linux内存点滴用户进程内存空间（累计阅读 13,332）
给程序员新手的一些建议（累计阅读 13,151）
Linux 性能监控、测试、优化工具（累计阅读 13,063）
关于linux内存free的一些事情（累计阅读 12,971）
include(“./file.php”)和include(“file.php”)区别（累计阅读 12,872）
ps - 按进程消耗内存多少排序（累计阅读 12,737）
Google怎么用linux （累计阅读 12,665）