标签：Randomization

共 2 篇相关文章

IT 累计浏览 2,353

ABTest 平台设计 - 如何进行流量分桶

这篇讲的是ABTest平台设计中的一个核心难题：如何科学地进行用户流量分桶。作者从实践中常见的错误切入——比如简单用UserID取模或手机尾号分桶，指出这种做法虽看似随机，但在长期、多实验场景下会导致实验间相互干扰、用户群体行为产生偏差，且流量利用率极低。文章的核心方案是介绍业界主流的“可重叠分层分桶”方法。其关键思路是将流量划分为多个逻辑层（如UI层、算法层），在每一层内使用不同的哈希函数（以层信息作为Seed）对用户ID进行分桶，从而确保各层之间的流量正交，互不影响。这样一来，一份流量可以同时参与多个层的不同实验，极大提升了迭代效率。作者还提到了适用于海量并行实验的“无限分层”思路，以及这对组织协调能力提出的更高要求。对于想设计或优化自己实验平台的技术团队，这篇文章从错误案例到系统方案，梳理得相当清晰，文末也附上了Google相关的经典论文供深入研究。

IT 累计浏览 1,929

基于hash计算的多层实验流量切分的实现

这篇讲的是大型互联网平台实验系统中，一个关键但容易被忽略的技术点：如何让多个AB实验在同一用户身上互不干扰地并行运行。作者从实验平台的实际挑战出发：当公司内同时进行数十个甚至上百个实验时，不同实验层之间的流量如何划分才能保证数据的纯净与正交？文章没有停留在简单的“按比例随机”这种初级方案上，而是详细拆解了基于hash计算的多层切分实现。核心思路是对用户ID等唯一标识进行多次hash运算，生成不同的伪随机值，分别用于决定该用户是否进入某个实验层、具体落在哪个流量桶。这样，理论上任何两个不同实验层的流量分配都是相互独立的。文章不仅给出了算法原理，还结合具体业务场景（比如不同实验层可能有着不等比例的流量需求）进行了说明。这种设计确保了实验结果的可对比性和统计显著性，是构建可靠、可扩展实验平台的基础设施。对于需要处理复杂实验矩阵的工程师来说，其中关于hash函数选择与流量正交性的讨论，提供了直接的工程参考。