您现在的位置:首页 --> 查看专题: Bloom
背景: 我现在在一个网站工作,每天都有很多网络爬虫和恶意攻击。我想根据http访问日志统计一下每个IP每天的访问次数,然后大于1万的都认为是机器人。现在寻求一个高效且实时的算法解决这个问题。 最简单的做法,就是用一个map来记录所有IP的访问次数。那么这可能会需要几百兆的内存。有一个更好的办法,可以在O(1)的空间复杂度中解决这个问题。
[ 共1篇文章 ][ 第1页/共1页 ][ 1 ]
近3天十大热文
-
[57] memory prefetch浅析
-
[54] 转载:cassandra读写性能原理分析
-
[47] 深入浅出cassandra 4 数据一致性问
-
[46] MySQL半同步存在的问题
-
[42] 《web前端最佳实践》—高维护性css
-
[41] javascript插入样式
-
[41] 获取Dom元素的X/Y坐标
-
[38] MySQL vs NoSQL 效率与成本之争
-
[36] 不是书评 :《我是一只IT小小鸟》
-
[35] 基本排序算法的PHP实现
赞助商广告