您现在的位置:首页 --> 查看专题: HLLC
分布式数据仓库(TDW)是一个以hive + hadoop为基础的大规模分布式系统,它提供了一种类SQL语言(称为HQL)让用户可以方便在其上进行编程开发。在数据分析领域,经常需要计算数据集不同元素的唯一值(Distinct值),也称为基数计算。 精确的基数计算需要消耗过多的计算资源,当数据量非常大时,这种资源的消耗就更加严重。因此在大数据领域,采用估值算法降低基数计算的成本成为一种新的选择。
[ 共1篇文章 ][ 第1页/共1页 ][ 1 ]
近3天十大热文
-
[1128] WordPress插件开发 -- 在插件使用 -
[54] 解决 nginx 反向代理网页首尾出现神秘字 -
[53] Java开发岗位面试题归类汇总 -
[46] web开发设计人员不可不用的在线web工具和 -
[34] 手机产品设计方向 -
[33] 一句话crontab实现防ssh暴力破解 -
[32] Rax 系列教程(长列表) -
[28] 程序员疫苗:代码注入 -
[28] 我对学习oracle与成长的理解 -
[27] 最萌域名.cat背后的故事:加泰与西班牙政府
赞助商广告



