您现在的位置:首页 --> 查看专题: 随机
有这样一道算法题:
给定一个能够生成均匀1~5随机枚举数的函数,请设计一个能够生成均匀1~7随机枚举数的函数。
就是说,有一个生成随机数的函数rand5,可能返回1、2、3、4、5这5个枚举值,其中每个值被返回的概率都是严格的1/5,现在需要设计一个类似的随机数函数rand7,可能返回1、2、3、4、5、6、7这几个枚举值,每个值被返回的概率都是严格的1/7。
假设数组为:array(100,200,300,400),开始是从1,1000这个概率范围内筛选第一个数是否在他的出现概率范围之内, 如果不在,则将概率空间,也就是k的值减去刚刚的那个数字的概率空间,在本例当中就是减去100,也就是说第二个数是在1,900这个范围内筛选的。这样筛选到最终,总会有一个数满足要求。就相当于去一个箱子里摸东西,第一个不是,第二个不是,第三个还不是,那最后一个一定是。这个算法简单,而且效率非常高,关键是这个算法已在我们以前的项目中有应用,尤其是大数据量的项目中效率非常棒。
根据最近生产环境使用的经验,更多的项目的采用,以及采用了更加自动的测试平台,对HBase做了更多的场景的测试,在这篇blog中来分享下纯粹的随机写和随机读的性能数据,同时也分享下我们调整过后的参数。 ps: 强烈推荐同事的blog,其中记录了很多我们对HBase的改进,以及我们在运维HBase项目时碰到的各种奇怪、诡异的问题。
随机读取数据库记录,搜索发现很多人都使用 order by rand() 来达到该目的,这是mysql提供的功能。但是实际上存在非常严重的性能问题。 如果表里记录不多,偶尔用一下也可以。但是如果数据多的话,就会凸显出查询的性能问题。 随机查询5条记录: SELECT * FROM `table` ORDER BY RAND() LIMIT 5; 在数十万记录的表里,这样的查询大概要5-8秒,甚至更多时间。
在日常工作中,经常需要使用随机算法。比如面对大量的数据, 需要从其中随机选取一些数据来做分析。 又如在得到某个分数后, 为了增加随机性, 需要在该分数的基础上, 添加一个扰动, 并使该扰动服从特定的概率分布。本文主要从这两个方面出发, 介绍一些算法, 供大家参考。 首先假设我们有一个使用的随机函数float frand(), 返回值在(0, 1)上均匀分布。...
[ 共7篇文章 ][ 第1页/共1页 ][ 1 ]
近3天十大热文
- [47] WEB系统需要关注的一些点
- [47] Oracle MTS模式下 进程地址与会话信
- [45] android 开发入门
- [45] 【社会化设计】自我(self)部分――欢迎区
- [45] Go Reflect 性能
- [45] IOS安全–浅谈关于IOS加固的几种方法
- [44] Twitter/微博客的学习摘要
- [42] 图书馆的世界纪录
- [42] find命令的一点注意事项
- [41] 关于恐惧的自白
赞助商广告