IT技术博客大学习 共学习 共进步
全部 移动开发 后端 数据库 AI 算法 安全 DevOps 前端 设计 开发者

标签:Randomization

共 2 篇相关文章

IT 累计浏览 2,353

ABTest 平台设计 - 如何进行流量分桶

这篇讲的是ABTest平台设计中的一个核心难题:如何科学地进行用户流量分桶。作者从实践中常见的错误切入——比如简单用UserID取模或手机尾号分桶,指出这种做法虽看似随机,但在长期、多实验场景下会导致实验间相互干扰、用户群体行为产生偏差,且流量利用率极低。 文章的核心方案是介绍业界主流的“可重叠分层分桶”方法。其关键思路是将流量划分为多个逻辑层(如UI层、算法层),在每一层内使用不同的哈希函数(以层信息作为Seed)对用户ID进行分桶,从而确保各层之间的流量正交,互不影响。这样一来,一份流量可以同时参与多个层的不同实验,极大提升了迭代效率。作者还提到了适用于海量并行实验的“无限分层”思路,以及这对组织协调能力提出的更高要求。 对于想设计或优化自己实验平台的技术团队,这篇文章从错误案例到系统方案,梳理得相当清晰,文末也附上了Google相关的经典论文供深入研究。

IT 累计浏览 1,929

基于hash计算的多层实验流量切分的实现

这篇讲的是大型互联网平台实验系统中,一个关键但容易被忽略的技术点:如何让多个AB实验在同一用户身上互不干扰地并行运行。 作者从实验平台的实际挑战出发:当公司内同时进行数十个甚至上百个实验时,不同实验层之间的流量如何划分才能保证数据的纯净与正交?文章没有停留在简单的“按比例随机”这种初级方案上,而是详细拆解了基于hash计算的多层切分实现。核心思路是对用户ID等唯一标识进行多次hash运算,生成不同的伪随机值,分别用于决定该用户是否进入某个实验层、具体落在哪个流量桶。这样,理论上任何两个不同实验层的流量分配都是相互独立的。 文章不仅给出了算法原理,还结合具体业务场景(比如不同实验层可能有着不等比例的流量需求)进行了说明。这种设计确保了实验结果的可对比性和统计显著性,是构建可靠、可扩展实验平台的基础设施。对于需要处理复杂实验矩阵的工程师来说,其中关于hash函数选择与流量正交性的讨论,提供了直接的工程参考。