开源世界中的算法与数据结构 3 -- Linux Kernel List 和GList

kernelchina blogs 2012-02-05 23:19:26 累计浏览 3,997 次

本机暂存

内容概览

这篇讲的是 Linux 内核和 GLib 中两种经典链表实现的设计哲学与实践权衡。作者没有纠缠于基本的增删操作，而是从工程实现的底层逻辑出发，对比了它们的差异。

核心差异在于内存模型：Linux 内核链表是侵入式的，它不另立节点存储数据，而是将 `list_head` 结构体直接“嵌”到你的数据结构里，通过 `container_of` 宏从节点反推出宿主对象。这带来了极致的内存效率和访问速度，节点与宿主数据一体，缓存友好。但代价是链表节点不能脱离宿主数据独立存在。

相反，GLib 的 `GList` 是通用的、非侵入式的。每个节点都是独立的内存块，通过 `prev` 和 `next` 指针串联，节点里用一个 `gpointer data` 指向实际数据。这带来了灵活性——节点可以被多个链表共享，生命周期也容易管理。但每一次插入、删除或访问数据，都需要额外的指针解引用，在性能敏感的内核路径上可能无法接受。

文章正是通过这两种截然不同的设计，揭示了在“通用性/灵活性”与“高性能/低开销”之间做选择时的典型工程考量。读完能理解，为何没有完美的链表，只有最适合特定场景的实现。

List是工程师的基本功，这里并不描述list增删这些细节的内容，仅仅根据我的理解写一下工程中List库的设计和实践考量。

看过几个不同的list库的实现，基本上涉及到如下的设计考量：

1.List数据结构上的差异

有没有头结点，是否循环，是否双向。这样就有多种组合，不罗嗦。

2.list的读写的保护。

3.List直接指针遍历还是仿照STL的Iterator方式遍历。

4.List同实际用户数据是采取一体式还是干湿分离式。

5.系统对于数据结构和算法的影响

1.从数据结构上将，Linux Kernel之中的List是双向无头节点链表。

空链表如下：

非空链表如下：

我觉得维护头结点的理由之一就是可以存放list size，而无需用户在应用部分进行维护。如果没有list size，用户需要在List删减的结束的时候维护list size，如果不愿意如此麻烦，只能悲催的在需要读取链表长度的时候for 循环并“++”一遍。实际上glist库提供get length之类的函数就是遍历list“++”

guint
g_list_length (GList *list)
{
guint length;
length = 0;
while (list)
    {
      length++;
      list = list->next;
    }
return length;
}

同样的Linux的kernel list需要的时候也只能如此这般。

2.List的读写保护

我这里提到的读写保护是在多线程之间的访问保护，如果需要在遍历和增删之间要有读写锁，list库不会内部维护锁，因为锁是OS相关的。

linux的list库提供了名为list_for_each_safe的宏也是用于读写访问，起保护范围仅仅在for循环内部，其实现如下：

#define list_for_each_safe(pos, n, head) \
for (pos = (head)->next, n = pos->next; pos != (head); \
pos = n, n = pos->next)

使用n缓存post->next，这样在遍历过程中如果删除pos，不会影响遍历。

3.List直接指针遍历还是仿照STL的Iterator方式遍历。

GList和Linux List都是直接指针进行遍历，我觉得使用迭代子的get next方法间接访问next node可以引入灵活性。

4.有关干湿分离或者一体化

linux的list head定义如下：

struct list_head {
struct list_head *next, *prev;
};

在list库里面没有提供data指针，因此比较适合一体化的方式。

其实干湿分离的优点是可以将任何对象link进来而不用在用户对象内部必须填充list head，不影响用户数据结构，数据的独立性更好，GList就是干湿分离式。

struct _GList
{
gpointer data;
GList *next;
GList *prev;
};

5.系统对于数据结构和算法的影响

我在“有关Cache -(1) linux list之中的Prefetch”提到过：

“linux的list实现之中有如下东东：

#define list_for_each(pos, head) \
for (pos = (head)->next; prefetch(pos->next), pos != (head); \
pos = pos->next)

在遍历过程中使用了prefetch，其功能是数据的预先读取。当你确认后继续要读取某内存的信息的时候，可以采用prefetch将这一块数据读取到cache之中，以便后继快速访问。我的理解是条件不止这些，如果后继读取的内容仅仅被访问一次，那么是否prefetch也就没有意义了。后继访问的内存单元多次被读写才有意义。对于上述的list操作，在循环内部往往还会访问next指向的structure的内容，因此访问多次是可以期待的。”

6.其他

Linux List之中有很多类似“list_for_each”，“list_for_each_entry_safe_reverse”之类的宏。这类的宏在C语言编程中常见，最大的好处就是减少了重复代码书写可能带来的错误。

Linux 2.4 List之中list_for_each定义如下：

#define list_for_each(pos, head) \
for (pos = (head)->next, prefetch(pos->next); pos != (head); \
pos = pos->next, prefetch(pos->next))

同分类推荐文章

Four Levels Of Customer Understanding （2026-05-22 21:00:00）
除法的意义（2026-04-12 20:52:17）
第五章：共识算法（2026-03-18 08:00:00）

查看更多算法文章 →

建议继续学习

Linus：利用二级指针删除单向链表（累计阅读 13,172）
HashMap解决hash冲突的方法（累计阅读 12,562）
Redis作者谈Redis应用场景（累计阅读 7,614）
Tips of Linux C programming （累计阅读 5,197）
我的内核配置文件（累计阅读 4,767）
深入理解 VXLAN （累计阅读 4,536）
软件开发的硬约束（累计阅读 4,464）
Redis源代码分析（累计阅读 4,374）
一个 VLA （可变长度数组）的实现（累计阅读 4,332）
一个绝妙的 exploit （累计阅读 4,294）