深入剖析 redis 数据结构 intset
这篇讲的是 Redis 中整数集合 intset 的底层实现细节。当 set 中所有元素都是整数时,Redis 会优先使用 intset 这种紧凑的数据结构,只有遇到非整数时才升级为更通用的 dict。作者深入源码,拆解了 intset 如何做到高效存储与操作。 intset 本质是一个有序、不重复的整型数组。它的精巧之处在于通过 `encoding` 字段动态记录当前数组中整数的位宽(16、32或64位),从而在保证功能的前提下极致节省内存。查找操作直接利用数组的有序特性,采用经典的二分查找算法,效率很高。 文章的重点和亮点在于对插入过程的剖析。当插入的新整数超出了当前编码范围(例如向一个全是 16 位整数的集合插入一个 32 位整数),intset 不会简单拒绝,而是会触发一次“编码升级”(`intsetUpgradeAndAdd`)。升级过程非常巧妙:它会重新分配内存,将现有所有元素转换为新编码,并逆序移动元素以避免数据覆盖。由于新整数必然是最大或最小值,最终将其放置在数组头部或尾部即可。这种按需升级的设计,平衡了内存效率与灵活性。 整体来看,intset 是一个为特定场景高度优化的微型数据结构。它通过有序数组+二分查找+动态编码升级,为 Redis 提供了一个内存极其友好且高效的整数集合实现,是理解 Redis 空间优化哲学的一个绝佳范例。