Infobright 数据仓库心得总结
在这里,我将结合我自己的使用以及对开源数据仓库的了解,INFOBRIGHT做下简单的介绍。
INFOBRIGHT产品分为社区版ICE和企业版IEE。相信大家对ICE都有很多的了解。ICE具备了INFOBRIGHT大部分的功能,我列举如下:
1. 超高的压缩比例。 普通10:1, 在极限情况下可以达到40:1 甚至更高。
2. 超强劲的数据导入性能。 ICE 有自己专业的数据导入工具BHLOADER, 不过受到了一些限制,比如不能利用到多核导入。
3. 超强的数据查询能力。 特别适合对于数据统计以及报表生成类得查询。
4. 超大的单表存放规模。 正是因为第一点,超强的压缩比,所以可以存放大量的数据, 节约了磁盘的存储,大大节省了成本。
5. 申请了专利的知识网格体系,这点是其他开源数据仓库哪怕是商业的数据仓库产品所没有的。
6. 与主要的BI分析工具的兼容性。 比如Pentaho等等。
但是除了以上的优点外, ICE 有以下的限制:
1. 不支持数据更新。 这个限制对于我们即要求查询性能外还要对数据库进行写入的需求, 造成了很大的不变。 这个估计是很多人试用后放弃试用ICE的第一个原因。
2. 不支持对多核的使用。 不但不支持查询的多并发,而且连导入导出也没有这样的支持。这个也是放弃ICE的一个原因。 谁也不愿意自己的强劲的硬件只能被用到1%,这样也会被老板给骂死的,他的钱不能白白的被这样折腾。
3. 只能单机使用,不具备任何的复制以及扩展。 这点对于我们现在的大规模海量数据情何以堪那?
所幸的是, INFOBRIGHT提供了商业版本IEE。IEE支持ICE的所有优点,并且弥补了他的不足, 放宽了对他的限制。 特别是早新的版本4.0.x里面提供了一套令人更加兴奋的工具:DLP---分布式数据导入工具。DLP 优点如下:
1. 减轻了数据库服务器的负载,使它能处理更多的请求。
2. 对应用完全透明, 不用编写额外的代码来处理复杂的导入工作。
3. 数据库的导入时间随着DLP部署的机器的增多二线性减少。当然,这些机器可以是非常廉价的PC服务器,也可以是旧的机器。节省了大量的成本。
4. 减少了对网络带宽的占用。 DLP在导入之前对原始数据已经进行了高效的压缩。
你还在等什么? 还对INFOBRIGHT有顾虑吗? 赶快使用企业版。 害怕,担心,复杂的业务代码?? 统统走掉吧!!!
建议继续学习:
- 列式数据仓库引擎之Infobright (阅读:3594)
- Infobright的架构 (阅读:2964)
- MySQL Infobright 数据仓库快速安装笔记[原创] (阅读:2649)
- Infobright 数据仓库 (阅读:2246)
- 关于Infobright 的几种数据格式 (阅读:1766)
扫一扫订阅我的微信号:IT技术博客大学习
- 作者:david_yeung 来源: 上帝,咱们不见不散!-51CTO技术博客
- 标签: Infobright
- 发布时间:2011-11-24 00:03:13
- [69] Twitter/微博客的学习摘要
- [67] IOS安全–浅谈关于IOS加固的几种方法
- [66] 如何拿下简短的域名
- [65] android 开发入门
- [63] find命令的一点注意事项
- [62] Go Reflect 性能
- [61] 流程管理与用户研究
- [60] Oracle MTS模式下 进程地址与会话信
- [59] 图书馆的世界纪录
- [57] 读书笔记-壹百度:百度十年千倍的29条法则