讨论:一则并行聚合计算方案的设计
这篇讲的是作者在构建一个实时数据看板时遇到的并行聚合计算难题。场景很具体:一个最多10万元素的数据集,每秒会收到数百到数千次字段修改(远多于增删操作),系统需要实时计算并维护多达50条聚合规则(如求和、平均、加权平均)在最多5层分组下的完整结果树。所有数据都在内存中,要求能立刻响应任何滚动查看。 作者首先实现了一个高效的串行方案:让聚合器监听集合变动,利用更新前后的值进行差值计算,避免全量重算。但面对更高的性能需求,他开始探索并行化。简单的“每次变动后并行计算”不可行,会导致持续高负载和并发错误。他尝试借鉴Erlang的Actor模型,将每个聚合器独立为消息驱动单元,但随之带来了新问题:在传递元素属性更新消息时,是否需要携带整个元素“快照”?直接携带开销太大,不携带则可能因并发修改导致聚合计算拿到中间状态的数据。作者发现,或许只有分组字段变更时才需要快照,这大幅降低了开销。 文章详细剖析了一个从串行到并行演进中的经典权衡:如何在保证实时性的同时,平衡计算延迟、系统负载与数据一致性。作者不仅给出了清晰的问题定义,更分享了思考路径与初步尝试,为面临类似挑战的读者提供了宝贵的讨论起点。