技术头条 - 一个快速在微博传播文章的方式     搜索本站
您现在的位置首页 --> Oracle --> ORACLE BITMAP INDEX

ORACLE BITMAP INDEX

浏览:2272次  出处信息
ORACLE的bitmap索引,我们用的很少。在我们的常理认识当中,我们用的最多就是类似性别,类型这种属性的字段,因为他们字段的种类很少。其实 BITMAP还是有很多优势以及一些特性的。

    首先在传统的INDEX里,我们在索引的存储上,一般是分为:header+index length+index value+rowid组成。如图:

2010-05-24_142946

    bitmap的存储结果相对来说,复杂一点。 bitmap 不存储rowid。那么rowid存储在哪里呢?答:每一个bitmap的头部,都存储了rowid的启示位置与结束位置。ORACLE通过自己的内部算 法,算出来相应的ROWID。

    位图中的每一位,都记录是否有值。

    如表的记录是这样存储的:

row-value
male
female
female
male

    那么对应的bitmap则是这样存储的:

rowid的启示位置与结束位置 rowid的启示位置与结束位置
male female
1 0
0 1
0 1
1 0

    由 此可见,存储的空间大大的节省了,另外带来的收益就是扫描的BLOCK也大大减少了。

    如果查找性别是male的数据,ORACLE只会去 搜索MALE这一列,然后是1的记录,返回即可。

    如果是针对BITMAP字段本身做OR,AND这样的查询,那么ORACLE会在 BITMAP索引内部,先做一次判断,找出符合结果的,再去计算ROWID,最后给出相应的VALUE,示意图如下:

dwhsg093

    bitmap join index

    bitmap join index,它的特点就是将多张表的JOIN结果,存储在一个索引里面,然后使用BITMAP的形式进行存储。图难画了,请见谅,改天有空的时候,再把图 补上。这个对于类似DW那样的多表join效率提高很明显。

    我今天做了一个测试,是用3张表join来做的,原来的SQL是这样的:

    zeus@CRMDB> select wt_customer.company_name,wt_customer.gmt_create

    2 from wt_customer,wt_CUSTOMER_EXT ,wt_CUSTOMER_BOOK

    3 where wt_customer.id=wt_CUSTOMER_EXT.Customer_Id

    4 and wt_CUSTOMER_BOOK.Customer_Id=wt_customer.id;

    58 rows selected.

    Elapsed: 00:00:00.01

    Execution Plan

    ―――――――――――――――――――-

    ―――――――――――――――――――――――――――――――――-

    | Id | Operation | Name | Rows | Bytes | Cost (%CPU)|

    ―――――――――――――――――――――――――――――――――-

    | 0 | SELECT STATEMENT | | 54 | 2484 | 179 (0)|

    | 1 | NESTED LOOPS | | 54 | 2484 | 179 (0)|

    | 2 | NESTED LOOPS | | 177 | 7257 | 179 (0)|

    | 3 | INDEX FULL SCAN | wt_CUSTOMER_BOOK_UK | 177 | 1062 | 1 (0)|

    | 4 | TABLE ACCESS BY INDEX ROWID| wt_CUSTOMER | 1 | 35 | 2 (0)|

    |* 5 | INDEX UNIQUE SCAN | wt_CUSTOMER_PK | 1 | | 1 (0)|

    |* 6 | INDEX RANGE SCAN | wt_CUSTOMER_EXT_CID_IND | 1 | 5 | 0 (0)|

    ―――――――――――――――――――――――――――――――――-

    一 个3表join,效率很差。如果我们创建BITMAP JOIN INDEX则可以避免这种情况的发生:

    zeus@CRMDB>CREATE BITMAP INDEX cust_wt_test

    2 ON wt_customer(wt_customer.company_name)

    3 FROM wt_customer,wt_CUSTOMER_EXT ,wt_CUSTOMER_BOOK

    4 WHERE wt_customer.id=wt_CUSTOMER_EXT.Customer_Id

    5 and wt_CUSTOMER_BOOK.Customer_Id=wt_customer.id

    6 tablespace zeus_ind ;

    Index created.

    Elapsed: 00:00:00.08

    再来看看SQL的执行计划:

    zeus@CRMDB>select wt_customer.company_name,wt_customer.gmt_create

    2 from wt_customer,wt_CUSTOMER_EXT ,wt_CUSTOMER_BOOK

    3 where wt_customer.id=wt_CUSTOMER_EXT.Customer_Id

    4 and wt_CUSTOMER_BOOK.Customer_Id=wt_customer.id;

    58 rows selected.

    Elapsed: 00:00:00.00

    Execution Plan

    ―――――――――――――――――――-

    ―――――――――――――――――――――――――――――

    | Id | Operation | Name | Rows | Bytes | Cost (%CPU)|

    ―――――――――――――――――――――――――――――

    | 0 | SELECT STATEMENT | | 1834K| 61M| 219K (1)|

    | 1 | TABLE ACCESS BY INDEX ROWID | wt_CUSTOMER | 1834K| 61M| 219K (1)|

    | 2 | BITMAP CONVERSION TO ROWIDS| | | | |

    | 3 | BITMAP INDEX FULL SCAN | CUST_WT_TEST | | | |

    ―――――――――――――――――――――――――――――

    请 着重注意红色部分。逻辑读大大降低!!

    BTW:

    我觉得我们除了传统的NESTLOOP,MERGE JOIN,HASH JOIN。这样看来又多了一种优化JOIN的方式。

    总结:

    bitmap我们可能平时使用的不多,但是觉得它在特殊的应用场景,还 是有优势的。bitmap join index更是一种多表JOIN的新方式,很有意思。

建议继续学习:

  1. 由浅入深探究mysql索引结构原理、性能分析与优化    (阅读:14615)
  2. 浅谈MySQL索引背后的数据结构及算法    (阅读:9634)
  3. 由浅入深理解索引的实现(2)    (阅读:6100)
  4. HBase二级索引与Join    (阅读:5622)
  5. 如何建立合适的索引?    (阅读:5135)
  6. InnODB和MyISAM索引统计集合    (阅读:4977)
  7. Innodb 表和索引结构    (阅读:4592)
  8. mysql查询中利用索引的机制    (阅读:4413)
  9. MySQL索引背后的数据结构及算法原理    (阅读:4282)
  10. 多维度分类排行榜应用:用位图索引    (阅读:3937)
QQ技术交流群:445447336,欢迎加入!
扫一扫订阅我的微信号:IT技术博客大学习
© 2009 - 2024 by blogread.cn 微博:@IT技术博客大学习

京ICP备15002552号-1