IT技术博客大学习 共学习 共进步

关于Infobright 的几种数据格式

上帝,咱们不见不散!-51CTO技术博客 2012-06-04 23:52:43 浏览 2,701 次

如果大家用到INFOBRIGHT,对这个字眼就不陌生了。 

 
目前有4种格式。
1. binary.
2. txt_variable
3. mysql
4. infobright
 
代表什么意思呢,我来详细解释下。
BINARY 代表二进制数据。 也就是说,原始数据是以特定格式的二进制来保存。 具体格式,可以参见官方的白皮书,很容易下载到。
 
TXT_VARIABLE 代表 CSV格式文本。默认的列分隔符为“;”。 
 
MYSQL 代表和MYSQL兼容的CSV格式文本。默认分隔符为“水平制表符“。
 
INFOBRIGHT 呢,代表分布式导入工具(DLP)生成的中间结果集, 只能用来导入DLP的中间数据。
 
 
这几种格式的载入速度按照以下顺序,由高到低排列:
INFOBRIGHT   --->   BINARY ---> TXT_VARIABLE ---> MYSQL。
可以看到MYSQL载入最慢。 但是MYSQL能打印出来更多的错误信息以供调试。
 
 
设置方法:
set @bh_dataformat = '随便一种';
即可。

建议继续学习

  1. MySQL数据库在实际应用一些方面的介绍 (阅读 36,283)
  2. 我对技术方向的一些反思 (阅读 11,143)
  3. Using MySQL as a NoSQL (阅读 6,962)
  4. MySQL协议分析 (阅读 5,843)
  5. Python连接 MySQL 数据库的超时问题 (阅读 5,045)
  6. 基于MySQL的高可用可扩展架构探讨 (阅读 4,883)
  7. 列式数据仓库引擎之Infobright (阅读 4,742)
  8. 分析MySQL的授权许可 (阅读 4,605)
  9. MySQL和MongoDB设计实例对比 (阅读 4,520)
  10. cacti 增加 Mysql 监控 (阅读 4,340)