IT技术博客大学习 共学习 共进步
全部 移动开发 后端 数据库 AI 算法 安全 DevOps 前端 设计 开发者

Infobright 数据仓库心得总结

上帝,咱们不见不散!-51CTO技术博客 2011-11-24 00:03:13 累计浏览 3,017 次
本机暂存

在这里,我将结合我自己的使用以及对开源数据仓库的了解,INFOBRIGHT做下简单的介绍。

INFOBRIGHT产品分为社区版ICE和企业版IEE。相信大家对ICE都有很多的了解。ICE具备了INFOBRIGHT大部分的功能,我列举如下:

1. 超高的压缩比例。 普通10:1 在极限情况下可以达到40:1 甚至更高。

2. 超强劲的数据导入性能。 ICE 有自己专业的数据导入工具BHLOADER 不过受到了一些限制,比如不能利用到多核导入。

3. 超强的数据查询能力。 特别适合对于数据统计以及报表生成类得查询。

4. 超大的单表存放规模。 正是因为第一点,超强的压缩比,所以可以存放大量的数据, 节约了磁盘的存储,大大节省了成本。

5. 申请了专利的知识网格体系,这点是其他开源数据仓库哪怕是商业的数据仓库产品所没有的。

6. 与主要的BI分析工具的兼容性。 比如Pentaho等等。

但是除了以上的优点外, ICE 有以下的限制:

1. 不支持数据更新。 这个限制对于我们即要求查询性能外还要对数据库进行写入的需求, 造成了很大的不变。 这个估计是很多人试用后放弃试用ICE的第一个原因。

2. 不支持对多核的使用。 不但不支持查询的多并发,而且连导入导出也没有这样的支持。这个也是放弃ICE的一个原因。 谁也不愿意自己的强劲的硬件只能被用到1%,这样也会被老板给骂死的,他的钱不能白白的被这样折腾。

 

3. 只能单机使用,不具备任何的复制以及扩展。 这点对于我们现在的大规模海量数据情何以堪那?

 

 

所幸的是, INFOBRIGHT提供了商业版本IEEIEE支持ICE的所有优点,并且弥补了他的不足, 放宽了对他的限制。 特别是早新的版本4.0.x里面提供了一套令人更加兴奋的工具:DLP---分布式数据导入工具。DLP 优点如下:

1. 减轻了数据库服务器的负载,使它能处理更多的请求。

2. 对应用完全透明, 不用编写额外的代码来处理复杂的导入工作。

3. 数据库的导入时间随着DLP部署的机器的增多二线性减少。当然,这些机器可以是非常廉价的PC服务器,也可以是旧的机器。节省了大量的成本。

4. 减少了对网络带宽的占用。 DLP在导入之前对原始数据已经进行了高效的压缩。

 

 

你还在等什么? 还对INFOBRIGHT有顾虑吗? 赶快使用企业版。 害怕,担心,复杂的业务代码?? 统统走掉吧!!!

同分类推荐文章

  1. 使用deepseek进行Oracle恢复,引起重大故障 (2026-06-22 10:56:00)
  2. 接手一个只差临门一脚的数据库恢复 (2026-06-18 00:13:09)
  3. 我做了一个 AI 版的 StarRocks 升级风险扫描工具,直接帮我定位到一个风险 (2026-06-15 01:00:00)

查看更多 数据库 文章 →

建议继续学习

  1. 看源代码那些事 (累计阅读 10,601)
  2. 介绍几个QQ开源项目及协议下载 (累计阅读 10,220)
  3. Hive的入口 -- Hive源码解析 (累计阅读 5,961)
  4. 程序员不是包身工 (累计阅读 5,002)
  5. 列式数据仓库引擎之Infobright (累计阅读 4,886)
  6. 还记得这些 Linux 发行版吗?(四) (累计阅读 4,534)
  7. 为什么GPL是更好的开源许可证? (累计阅读 4,487)
  8. 从淘汰Oracle数据库的事情说起 (累计阅读 4,433)
  9. Linux发展编年表 (累计阅读 4,069)
  10. 开源PHP监控扩展:witness简介 (累计阅读 3,892)