您现在的位置:首页 --> 查看专题: 估算
分布式数据仓库(TDW)是一个以hive + hadoop为基础的大规模分布式系统,它提供了一种类SQL语言(称为HQL)让用户可以方便在其上进行编程开发。在数据分析领域,经常需要计算数据集不同元素的唯一值(Distinct值),也称为基数计算。 精确的基数计算需要消耗过多的计算资源,当数据量非常大时,这种资源的消耗就更加严重。因此在大数据领域,采用估值算法降低基数计算的成本成为一种新的选择。
[ 共1篇文章 ][ 第1页/共1页 ][ 1 ]
近3天十大热文
- [445] Go Reflect 性能
- [31] 正态分布的前世今生(一)
- [17] 公钥私钥加密解密数字证书数字签名详解
- [17] 基于HTTP缓存轻松实现客户端应用的离线支持
- [15] osx平台上lol英雄联盟launcher启
- [14] Joomla反序列化漏洞的查漏补缺
- [14] 在JavaScript中什么时候使用==是正
- [13] 无锁HashMap的原理与实现
- [13] SSL多域名绑定证书的解决方案
- [13] rsync同步的艺术
赞助商广告