10 连抽保底的概率模型--技术头条 -- 微博大V帮你宣传技术博文开发者头条码农头条

【简介】

网游里有很多抽卡、开箱子之类的赌性玩法，在最开始，游戏设计者实现的时候，仅仅给这些抽取概率简单的设置了一个值。比如抽卡抽出橙卡的概率是 10% ，那么就是说，玩家每次抽一张卡，有 90% 的可能是白卡，10% 的可能是橙卡。

但大 R 玩家是大爷，需要小心伺候。如果感受不好，人跑了就亏大了。概率这个东西靠改进伪随机数发生器是解决不了体验问题的，大爷要是连抽 20 张都出不来橙卡，那是要怒删游戏的。

连抽 20 张 10% 概率橙卡一张都抽不到的机会多不？一张抽不中的概率是 0.9 ，20 张都抽不中的概率是 0.9 ^20 = 12.2% 。这可不算小数字啊。平均 8 个大 R 就会碰到一次，一下子赶跑了 1/8 的金主，这个责任小策划可担当不起。

所以、一般网游都会用各种规则来避免玩家出现连抽不中的尴尬。例如，我忘记是谁发明的 10 连抽规则：如果你购买一个大包连抽 10 次，我在规则上就保证里面一定至少有一张橙卡。实现它应该并不困难，按常规概率生成 10 张的卡包，如果里面没有橙卡，那么我加一张即可。

但如果我想把 10 抽保底的规则惠及日常抽卡的玩家该怎么做呢？

就是说，我希望任何玩家任何时候，接连抽了 10 张卡，我都想保证这 10 张卡里至少有一张橙卡。

首先，要说明的一点：如果你同时想保证橙卡掉落率是 10% ，也就是在极大范围内，比如系统投放了一万张卡片中，其中要有一千张橙卡。那么同时保证每 10 张卡里有至少一张橙卡的话，结果一定是完全不随机的，也就是必须每抽 9 张白卡，必出一张橙卡。

所以、如果即想要随机（出橙卡的概率稳定），又想有 10 张出一张的保底，那么橙卡投放量是一定超过 1/10 的。

我们之前的游戏用了个很粗暴的方案：记录玩家已经连续几次没有抽中，如果连续次数超过 9 ，就必给他一张橙卡。为什么我说这个方案粗暴，因为它其实破坏了抽卡的自然体验。虽然玩家的确更高兴了，但是概率却很不自然。不自然的方案（其实是生硬的打了个补丁）实现起来还容易出错，我们前段时间就因为实现 bug 多发放了很多稀有物品，这个 bug 就不展开说了。

下面来看看，为什么这么做不自然。

假设橙卡的掉率是 10% ，那么你在获得一张橙卡后，再抽下一张橙卡的概率就是 0.1 。下一张是白卡，再下一张是橙卡的概率是 0.9 * 0.1 ，下两张是白卡，第三张是橙卡的概率是 0.9^2 * 0.1 ……

后续有 10 张及 10 张以上的概率总共有多少呢？我算了一下，大约是 35% 左右。

我们把抽到两张橙卡之间会抽取到的白卡张数排成一个数列的话，这个数列的值的范围是 0 到正无穷。是的，非洲酋长可能永远抽不到橙卡。当然这只是理论值。

如果你读过大学，学的是理工科，没有逃课的话，就应该知道，这个数列是大致符合指数分布的。指数分布正是用来表示独立随机事件发生的时间间隔的。

当我们把这个数列中大于 9 的数字都强行改成 9 ，那么 9 的出现频率就陡然跳变，这是极不自然的。（分布不平滑）

从一致分布的随机数，转换为指数分布的随机数非常简单。如果你懒得自己推导，那么可以在爆栈网上找到公式。

让我们回答前面的问题，如果我希望获得一个大约每 10 张卡里出一张橙卡的随机数列，除了每次 random 一个 [0,10) 的整数，判断证书是不是 0 以外，还有一个方法。那就是每次抽到一个橙卡后，都从一个指数分布的随机数列中取一个值出来，作为接下来会抽取到白卡的张数。按这个张数去发放白卡，等计数器减到 0 ，就发一张橙卡给玩家。这个白卡张数的数值范围是 [0, inf) 。

用 lua 实现的话，大概是这样的：

math.floor(math.log(1-math.random()) * (-rate)) 其中 rate = 10 。

好了，如果我们想加上 10 张保底，又想让间隔大致符合指数分布怎么办？简单：
function erand(rate)
while true do
local p = math.floor(math.log(1-math.random()) * (-rate))
if p < rate then
return p
end
end
end

让产生出来的数字小于 10 的时候重来一次就好了。如果你担心这里死循环（实际并不会），也可以加上循环上限：

function erand(rate)
for i = 1, 100 do -- 100 可以随便写
local p = math.floor(math.log(1-math.random()) * (-rate))
if p < rate then
return p
end
end
return rate-1
end

当然，一旦加上了 10 张保底，单张出橙卡的概率就大大增加了，增加到多少呢？大约是 21%。如果你希望保持 10% 左右的投放率，那么保底张数大约应该设置在 23 张左右。

ps. 今天在公司群里讨论这个问题时，雷先生提了这么一个问题，说是可以用来做数值策划的面试题：

已知橙卡的抽取率是 10% ，抽一次卡是 1 块钱；而 10 连抽的包可以帮你按同样概率连抽 10 次，但如果没有抽到橙卡的话，系统会补偿一张橙卡给你，换掉 10 张白卡中的一张。

假设白色一文不值，只有橙卡值钱。

那么请问：这个 10 连抽的包到底价值多少？

点击查看原文 >>

由 @技术头条 2017-03-12 00:04 / 0个评论

赞过的人： @技术头条

【大模型系列】指令微调 (hubojing.github.io)

本文总结了大模型中的指令微调（Instruction Tuning）技术，重点介绍了如何通过指令化数据对大语言模型进行参数微调以提升任务性能。文章探讨了数据构建方法如Self-Instruct和Evol-Instruct，以及微调策略包括优化设置和高效微调方法。通过这些技术，模型可以在多任务场景中表现出色。此内容对希望提升大语言模型能力的研究者和开发者具有参考价值。

by @技术头条 2024-08-06 08:12 查看详情

【大模型系列】提示学习 (hubojing.github.io)

本文介绍了提示学习（Prompt Learning）的基础概念和应用场景。作者详细讨论了提示学习在大语言模型中的作用，以及如何通过优化提示来提高模型的任务表现。文章还分享了在实际应用中调整和设计提示的技巧，并探讨了该技术在自然语言处理中的未来发展趋势。这篇文章为希望利用大模型进行高效自然语言处理的开发者提供了有价值的见解。

by @技术头条 2024-08-06 08:11 查看详情

大批量动画模型的优化 (blog.codingnow.com)

最近和公司一个开发团队探讨了一下他们正在开发的游戏中遇到的性能问题，看看应该如何优化。这个游戏的战斗场景想模仿亿万僵尸(They are billions）的场景。在亿万僵尸中，场景中描绘了上万的僵尸潮，但我们这个游戏，超过 500 个僵尸就遇到了性能问题。固然，手机的硬件性能比不上 PC ，但 500 这个数量级还是略低于预期。

对于游戏中大量类似的动画物体，肯定有方法可以优化。

by @技术头条 2024-05-05 23:26 查看详情

从存储模型聊一聊时序数据库的应用场景 (www.codedump.info)

本文介绍时序数据库的存储模型，只有理解了时序数据的存储模型，才能更好的了解时序数据库的优缺点以及其适用场景。

by @技术头条 2024-03-21 23:25 查看详情

图解一致性模型 (www.codedump.info)

本文使用大量的图例，同时没有难懂的公式，意图解释清楚一致性模型要解决什么问题，以及三种一致性模型：顺序一致性、线性一致性、因果一致性。

by @技术头条 2024-03-21 23:23 查看详情

使用零一万物 200K 模型和 Dify 快速搭建模型应用 (soulteary.com)

本篇文章，我们聊聊如何使用 LLM IDE (Dify) 快速搭建一个模型应用，以及使用超长上下文的 200K 模型，完成懒人式的电子书翻译。

by @技术头条 2024-03-21 22:55 查看详情

带你认识本地大模型框架Ollama(可直接上手) (wiki.eryajf.net)

自 OpenAI 公司于2022 年 11 月 30 日发布 ChatGPT 以来，经过 23 年一整年的发展之后，大模型的概念已逐渐普及，各种基于大模型的周边产品，以及集成层出不穷，可以说已经玩出花来了。在这个过程中，也有不少本地化的模型应用方案冒了出来，针对一些企业知识库问答的场景中，模型本地化是第一优先考虑的问题，因此如何在本地把模型调教的更加智能，就是一个非常重要的技能了。在 23 年的时候，我也接触过一些本地模型的开源项目(比如 LocalAI)，当时在本地部署跑起来之后，发现交互的体验，回答的速度，以及智能程度，都远低于预期。最近又一次了解本地模型的玩法，从微信群里了解到了 ollama，经过几天业余时间的研究及了解，发现现在模型本地化的玩法，以及能力都早已不可同日而语，本文，将记录我这几天来对于 ollama 的粗浅认识以及快速入门玩起来。

by @技术头条 2024-03-12 22:53 查看详情

使用 llama.cpp 在本地部署 AI 大模型的一次尝试 (blog.yuanpei.me)

本文旨在尝试使用 llama.cpp 在本地部署 AI 大模型，随着人工智能的快速发展，我们逐渐认识到私有化部署的重要性和潜力。在此背景下，llama.cpp 作为一个纯 C/C++ 实现的 LLaMA 模型推理工具，提供了在本地环境下高性能的 AI 推理能力。在这篇文章中，我们可以了解到 llama.cpp 具有在 GPU 和 CPU 环境下运行的灵活性，满足私有化部署的需求。文章详细介绍了 llama.cpp 编译和部署的过程，为读者提供了一份在本地部署 AI 大模型的教程。私有化部署的 AI 大模型，相比于 ChatGPT 这类通用大模型，更注重数据隐私和安全性，对云服务的依赖更少，可以做到更好的本地化控制。虽然编译 llama.cpp 有一定的复杂性，AI 大模型的下载、转化、量化需要一定的耐心，可当本地的 AI 应用运行起来的那一刻，博主觉得这一切完全值得。

by @技术头条 2024-03-12 22:29 查看详情

白话 Pulsar Bookkeeper 的存储模型 (crossoverjie.top)

最近我们的 Pulsar 存储有很长一段时间数据一直得不到回收，但消息确实已经是 ACK 了，理论上应该是会被回收的，随着时间流逝不但没回收还一直再涨，最后在没找到原因的情况下就只有一直不停的扩容。

为了防止类似的问题再次发生，我们希望可以监控到磁盘维度，能够列出各个日志文件的大小以及创建时间。

这时就需要对 Pulsar 的存储模型有一定的了解，也就有了这篇文章。

by @技术头条 2024-01-17 23:10 查看详情

CPU 混合推理，非常见大模型量化方案：“二三五六” 位量化 (soulteary.com)

本篇文章聊聊网上聊的比较少的具体量化操作，非常见整型位数的量化，来自让各种开源模型能够在 CPU 环境、CPU & GPU 环境混合推理的技术方案：llama.cpp 。

by @技术头条 2023-12-26 22:06 查看详情