技术头条 - 一个快速在微博传播文章的方式     搜索本站
您现在的位置首页 --> 算法 --> 深入剖析 redis 数据结构 skiplist

深入剖析 redis 数据结构 skiplist

浏览:2262次  出处信息

概述

   redis 中 zset 是一个有序非线性的数据结构,它底层核心的数据结构是跳表. 跳表(skiplist)是一个特俗的链表,相比一般的链表,有更高的查找效率,其效率可比拟于二叉查找树。

   一张关于跳表和跳表搜索过程如下图:

   redis_ds_skiplist_search

   在图中,需要寻找 68,在给出的查找过程中,利用跳表数据结构优势,只比较了 3次,横箭头不比较,竖箭头比较。由此可见,跳表预先间隔地保存了有序链表中的节点,从而在查找过程中能达到类似于二分搜索的效果,而二分搜索思想就是通过比较中点数据放弃另一半的查找,从而节省一半的查找时间。

   缺点即浪费了空间,自古空间和时间两难全。

   插播一段:跳表在 1990年由 William Pugh 提出,而红黑树早在 1972年由鲁道夫·贝尔发明了。红黑树在空间和时间效率上略胜跳表一筹,但跳表实现相对简单得到程序猿们的青睐。redis 和 leveldb 中都有采用跳表。

   这篇文章,借着 redis 的源码了解跳表的实现。

跳表的数据结构

   redis_ds_skiplist_search

   从上图中,总结跳表的性质:

  • 由很多层结构组成

  • 每一层都是一个有序的链表

  • 最底层(Level 1)的链表包含所有元素

  • 如果一个元素出现在 Level i 的链表中,则它在 Level i 之下的链表也都会出现。

  • 每个节点包含两个指针,一个指向同一链表中的下一个元素,一个指向下面一层的元素。

  •    redis 中跳表数据结构定义:

    // 跳表节点结构体
    /* ZSETs use a specialized version of Skiplists */
    typedef struct zskiplistNode {
        // 节点数据
        robj *obj;
     
        // 分数,游戏分数?按游戏分数排序
        double score;
     
        // 后驱指针
        struct zskiplistNode *backward;
     
        // 后驱指针数组
        struct zskiplistLevel {
            struct zskiplistNode *forward;
     
            // 调到下一个数据项需要走多少步
            unsigned int span;
        } level[];
    } zskiplistNode;
     
    typedef struct zskiplist {
        // 跳表头尾指针
        struct zskiplistNode *header, *tail;
     
        // 跳表的长度
        unsigned long length;
     
        // 跳表的高度
        int level;
    } zskiplist;

       特别的,在上图中似乎每个数据都被保存了多次,其实只保存了一次。在 struct zskiplistNode 中数据和指针是分开存储的,struct zskiplistLevel 即是一个描述跳表层级的数据结构。

    跳表的插入

       跳表算法描述如下:找出每一层新插入数据位置的前驱并保存,在 redis 中跳表插入是根据 score/member 的大小(看不懂可以参看 redis ZADD 命令)来决定插入的位置;将新数据插入到指定位置,并调整指针,在 redis 中还会调整 span。

       什么是 span?

       redis_ds_skiplist_search

       span 即从两个相邻节点间隔了多少节点。譬如 level 1,-1 的 span 就是 1;level 2,-1 的 span 为 2。

       因为新出入数据的层数是随机的,有两种情况 ①小于等于原有的层数;②大于原有的层数。需要做特殊处理。

       1)小于等于原有的层数

       redis_ds_skiplist_insert_1

       2)大于原有的层数

       redis_ds_skiplist_insert_2

       redis 中跳表插入算法的具体实现:

    zskiplistNode *zslInsert(zskiplist *zsl, double score, robj *obj) {
        zskiplistNode *update[ZSKIPLIST_MAXLEVEL], *x;
        unsigned int rank[ZSKIPLIST_MAXLEVEL];
        int i, level;
     
        redisAssert(!isnan(score));
        x = zsl->header;
     
        // 遍历 skiplist 中所有的层,找到数据将要插入的位置,并保存在 update 中
        for (i = zsl->level-1; i >= 0; i--) {
            /* store rank that is crossed to reach the insert position */
            rank[i] = i == (zsl->level-1) ? 0 : rank[i+1];
     
            // 链表的搜索
            while (x->level[i].forward &&
                (x->level[i].forward->score < score ||
                    (x->level[i].forward->score == score &&
                    compareStringObjects(x->level[i].forward->obj,obj) < 0))) {
                rank[i] += x->level[i].span;
                x = x->level[i].forward;
            }
     
            // update[i] 记录了新数据项的前驱
            update[i] = x;
        }
     
        // random 一个 level,是随机的
        /* we assume the key is not already inside, since we allow duplicated
         * scores, and the re-insertion of score and redis object should never
         * happen since the caller of zslInsert() should test in the hash table
         * if the element is already inside or not. */
        level = zslRandomLevel();
     
        // random level 比原有的 zsl->level 大,需要增加 skiplist 的 level
        if (level > zsl->level) {
            for (i = zsl->level; i < level; i++) {
                rank[i] = 0;
                update[i] = zsl->header;
                update[i]->level[i].span = zsl->length;
            }
            zsl->level = level;
        }
     
        // 插入
        x = zslCreateNode(level,score,obj);
        for (i = 0; i < level; i++) {
            // 新节点项插到 update[i] 的后面
            x->level[i].forward = update[i]->level[i].forward;
            update[i]->level[i].forward = x;
     
            /* update span covered by update[i] as x is inserted here */
            x->level[i].span = update[i]->level[i].span - (rank[0] - rank[i]);
            update[i]->level[i].span = (rank[0] - rank[i]) + 1;
        }
     
        // 更高的 level 尚未调整 span
        /* increment span for untouched levels */
        for (i = level; i < zsl->level; i++) {
            update[i]->level[i].span++;
        }
     
        // 调整新节点的前驱指针
        x->backward = (update[0] == zsl->header) ? NULL : update[0];
        if (x->level[0].forward)
            x->level[0].forward->backward = x;
        else
            zsl->tail = x;
     
        // 调整 skiplist 的长度
        zsl->length++;
        return x;
    }

    跳表的删除

       跳表的删除算和插入算法步骤类似:找出每一层需删除数据的前驱并保存;接着调整指针,在 redis 中还会调整 span。

       redis_ds_skiplist_delete

       redis 中跳表删除算法的具体实现:

    // x 是需要删除的节点
    // update 是 每一个层 x 的前驱数组
    /* Internal function used by zslDelete, zslDeleteByScore and zslDeleteByRank */
    void zslDeleteNode(zskiplist *zsl, zskiplistNode *x, zskiplistNode **update) {
        int i;
     
        // 调整 span 和 forward 指针
        for (i = 0; i < zsl->level; i++) {
            if (update[i]->level[i].forward == x) {
                update[i]->level[i].span += x->level[i].span - 1;
                update[i]->level[i].forward = x->level[i].forward;
            } else {
                // update[i]->level[i].forward == NULL,只调整 span
                update[i]->level[i].span -= 1;
            }
        }
     
        // 调整后驱指针
        if (x->level[0].forward) {
            x->level[0].forward->backward = x->backward;
        } else {
            zsl->tail = x->backward;
        }
     
        // 删除某一个节点后,层数 level 可能降低,调整 level
        while(zsl->level > 1 && zsl->header->level[zsl->level-1].forward == NULL)
            zsl->level--;
     
        // 调整跳表的长度
        zsl->length--;
    }

    redis 中的跳表

       redis 中结合跳表(skiplist)和哈希表(dict)形成一个新的数据结构 zset。添加 dict 是为了快速定位跳表中是否存在某个 member!

    typedef struct zset {
        dict *dict;
        zskiplist *zsl;
    } zset;

    redis 选用 skiplist 场景

       ZXX 命令是针对有序集合(sorted set)的,譬如:

    ZADD
    ZCARD
    ZCOUNT
    ZINCRBY
    ZINTERSTORE
    ZLEXCOUNT
    ZRANGE
    ZRANGEBYLEX
    ZRANGEBYSCORE
    ZRANK
    ZREM
    ZREMRANGEBYLEX
    ZREMRANGEBYRANK
    ZREMRANGEBYSCORE
    ZREVRANGE
    ZREVRANGEBYSCORE
    ZREVRANK
    ZSCAN
    ZSCORE
    ZUNIONSTORE

       根据 zset_max_ziplist_entries 和 zset_max_ziplist_value 两个参数,选用 zset 和 ziplist 其中之一作为基础数据结构,具体选用哪种,需要看实际场景,可按需配置。我的建议是,如果数据集合不是非常大,采用 ziplist,因为这样可以利用 CPU 缓存的优势;其他还是选用 zset 吧。

    一个应用的场景

       zset 一个经典的应用场景是用来做排行榜,譬如游戏中分数最高的十位玩家,可以用 zset 维护所有游戏玩家的分数。

       最后,关于二叉查找树,更多请参看《编程珠玑,字字珠玑》读书笔记完结篇——AVL树》《红黑树并没有我们想象的那么难(上)》《红黑树并没有我们想象的那么难(下)》

       redis dict 讲解请参看《深入剖析 redis 数据结构 dict》

       redis ziplist 讲解请参看《深入剖析 redis 数据结构 ziplist》

建议继续学习:

  1. redis源代码分析 - persistence    (阅读:31140)
  2. Redis消息队列的若干实现方式    (阅读:10703)
  3. 浅谈MySQL索引背后的数据结构及算法    (阅读:9886)
  4. 基于Redis构建系统的经验和教训    (阅读:9283)
  5. 浅谈redis数据库的键值设计    (阅读:8286)
  6. redis在大数据量下的压测表现    (阅读:7379)
  7. redis运维的一些知识点    (阅读:7416)
  8. Redis和Memcached的区别    (阅读:6776)
  9. Redis作者谈Redis应用场景    (阅读:6564)
  10. redis 运维实际经验纪录之一    (阅读:6470)
QQ技术交流群:445447336,欢迎加入!
扫一扫订阅我的微信号:IT技术博客大学习
© 2009 - 2024 by blogread.cn 微博:@IT技术博客大学习

京ICP备15002552号-1