您现在的位置:首页 --> 查看专题: HLLC
分布式数据仓库(TDW)是一个以hive + hadoop为基础的大规模分布式系统,它提供了一种类SQL语言(称为HQL)让用户可以方便在其上进行编程开发。在数据分析领域,经常需要计算数据集不同元素的唯一值(Distinct值),也称为基数计算。 精确的基数计算需要消耗过多的计算资源,当数据量非常大时,这种资源的消耗就更加严重。因此在大数据领域,采用估值算法降低基数计算的成本成为一种新的选择。
[ 共1篇文章 ][ 第1页/共1页 ][ 1 ]
近3天十大热文
- [56] WEB系统需要关注的一些点
- [49] Oracle MTS模式下 进程地址与会话信
- [49] Go Reflect 性能
- [48] find命令的一点注意事项
- [47] Twitter/微博客的学习摘要
- [46] 如何拿下简短的域名
- [45] 【社会化设计】自我(self)部分――欢迎区
- [44] 关于恐惧的自白
- [44] 流程管理与用户研究
- [44] android 开发入门
赞助商广告