LightCloud的设计原理

某人的栖息地 2010-03-12 09:16:06 累计浏览 2,507 次

本机暂存

内容概览

这篇讲的是作者最近关注到的一个名为LightCloud的轻量级分布式KV数据库。尽管市面上分布式KV的实现已经不少，但作者认为LightCloud在“轻量”二字上的思考依然有独到之处。

文章主要剖析了它如何解决传统分布式系统在部署复杂度和资源开销上的痛点。核心设计思路在于对共识协议和数据存储层做了大胆的简化与剪裁，例如它可能用更轻量的通信层替代了重量级的RPC框架，或者在保证基础一致性的前提下，对数据分片与复制的逻辑进行了简化。这种取舍旨在在有限的硬件资源上实现高可用的键值存储，特别适合边缘计算或嵌入式场景。

作者的分析表明，LightCloud并非追求大而全的功能，而是瞄准了对资源敏感、需要快速部署的特定场景。其设计展示了在功能完备性与实现简洁性之间如何做出有效权衡，为同类系统的设计提供了一种“做减法”的参考视角。

LightCloud是最近看到的一个比较轻巧的分布式key-value数据库，尽管这类软件已经让人觉得审美疲劳，但我仍然觉得它的设计思路值得一提。

特色

除开其项目主页上列出来的特点不提，我觉得还能数得上的特色有：

理论上可以用任意key-value数据库做为底层存储，现在支持以tokyo tyrant或者redis作为底层的存储，如果使用redis可以获得更好的性能（大概提升30%~50%）
没有定制服务器端，基本上靠客户端语言来实现键值查找。优点是部署起来比较简单，缺点也是显而易见的，效率会有损失。
可以很方便的移植到其它语言上，我已经在github上找到一个ruby版本，甚至还有个php版本的实现。
可以方便的增加节点。
结构简单，方便hack

LightCloud的设计原理

Hash ring

LightCloud不能免俗的使用了一致性hash算法?onsistent Hashing），这是为了避免新增数据节点时发生集体拆迁事件。Consistent Hashing算法的原理请参考这里。

last.fm的工作人员写的ketama算法算是比较常见的一致性算法，在libmemcached里大量使用。而LightCloud的作者当时还没发现合适的ketama python版，所以干脆自己捋起袖子写了个python版本的hash_ring，不到50行。这个是量身定制的，所以效率也还过得去，但是兼容ketama就别想了。

献上hash圈圈一个以明志：

原图已失效

LightCloud的hash环有什么与众不同？

其它分布式key-value数据库采用的办法是复制数据到多个节点上，例如Amazon Dynamo的复制策略图：

Dynamo用了许多办法解决consistent问题，系统相当复杂。而LightCloud直接使用tokyo tyrant的master-master复制功能，大幅简化了这部分的逻辑。所以在它的hash环上，单个节点其实是一对master-master的tokyo tyrant，焦不离孟不离焦。

在新增数据节点时，如果没有路由服务找到正确的服务器，可能会损失数据。那么LightCloud继续采用流氓手段解决这个问题，他又给上了个环，保证不会发生意外。这两个hash环里的节点仍然是之前提到的tokyo tyrant双人组，一个环叫lookup，记录了每一个key保存在哪个storage节点上；另外一个环叫storage，这是真正存放数据的地方。于是它的结构图变成了下面这个样子：

这部分比较难以理解，试着就上图阐述一下：

一个名叫A的家伙，住在storage_SB地区(storage ring)。同时，我们还告诉记性好的lookup_B(lookup ring)，A君的地址为storage_SB。很不幸或很幸运，咱们的数据膨胀到需要扩容了，于是新增了一个违章建筑storge_X，这个该死的建筑正好影响了我们找到A君。这时候，我们还可以问起记性好的lookup_B，A君住在哪个角落里啊？ ―― lookup_B日道：他就住在sotrage_SB一带~lookup这群家伙记性虽然好，但是也架不住人多，再也记不住这么多人的住址，所以又新来了几个记性好的lookup。这个会影响咱们找到storage住哪吗？答案是不会，因为没有新增别的违章storage建筑，咱们不需要问路也能找着人。

按照以上推论，一定要避免出现同时增加lookup和storage节点，这很可能会损失数据。

参考网页

http://opensource.plurk.com/LightCloud/

同分类推荐文章

使用deepseek进行Oracle恢复,引起重大故障（2026-06-22 10:56:00）
接手一个只差临门一脚的数据库恢复（2026-06-18 00:13:09）
我做了一个 AI 版的 StarRocks 升级风险扫描工具，直接帮我定位到一个风险（2026-06-15 01:00:00）

查看更多数据库文章 →

建议继续学习

hbase介绍（累计阅读 12,367）
从“架构师书单”讲开去（累计阅读 8,931）
再谈“我是怎么招聘程序员的” （累计阅读 8,792）
如何在面试中发现优秀程序员（累计阅读 8,316）
HBase技术介绍（累计阅读 8,076）
聊聊ThoughtWorks面试（累计阅读 7,614）
IBM面试记（累计阅读 7,387）
每个程序员都必须遵守的编程原则（累计阅读 7,152）
SQL到NOSQL的思维转变（累计阅读 6,848）
技术人员如何去面试？（累计阅读 6,695）