标签：Index

共 14 篇相关文章

IT 累计浏览 1,820

如何获取 MySQL innodb 的 B+tree 的高度

这篇文章深入讲解了如何获取MySQL InnoDB存储引擎中B+树索引的实际高度。作者从树高直接影响查询性能这一核心点出发，指出通常3到4层较为理想，并通过一个包含百万条数据的具体示例，演示了两种实用的获取方法。首先，文章详细说明了如何通过查询`INNODB_SYS_INDEXES`等系统表获取索引根页的页号，然后结合`innodb_page_size`和`hexdump`工具直接读取`.ibd`数据文件，从中解析出表示树高的`PAGE_LEVEL`字段。这种方法能让你直观地看到主键、`name`、`age`等索引分别处于第几层。其次，文章还提供了一个不依赖数据库权限的估算思路：基于B+树结构，计算非叶子节点和叶子节点单页可容纳的索引项数量，从而推算出特定数据量下树的大致高度。例如，通过计算得出百万级数据下，`age`索引的高度就达到了3层。整个过程既有动手操作的命令，也有原理性的估算，让读者不仅能“知其然”，还能“知其所以然”，非常适合希望深入理解InnoDB底层存储机制的开发者参考。

IT 累计浏览 2,520

MySQL索引之主键索引

这篇文章厘清了MySQL中主键索引和辅助索引的几处关键区别。作者从两者的定义出发，指出主键索引是唯一标识记录、不可为NULL的索引，而辅助索引则包括唯一索引和非唯一索引。核心对比在于不同存储引擎下的行为差异：在MyISAM中，一个不允许NULL的唯一索引与主键索引本质相同，性能也相当；但在InnoDB中，主键索引即聚集索引，而辅助索引（无论是否唯一）存储的都是指向主键的指针，因此通过辅助索引查找数据需要额外的转换步骤。文章用一组测试数据直观地展示了性能区别：在100万行数据的MyISAM表上，普通索引的随机检索效率比主键索引慢了30%以上；而在InnoDB表上，唯一索引比主键索引慢约9%，普通索引的差距则扩大到50%以上。这清楚地说明，理解这些索引机制对于InnoDB的表结构设计与查询优化至关重要。

IT 累计浏览 3,241

git术语解释staging，index，cache

这篇讲的是Git里三个让人头疼的术语：staging、index和cache。作者从自己的困惑出发——为什么《Pro Git》里叫staging area，`git-reset`的文档里叫index，而`git-rm`的参数却是`-cached`？这三个词到底是不是一回事？文章追溯了问题的根源，发现这其实是Linus Torvalds当年的“一念之差”。在开发Git初期，为了管理Linux内核的补丁，他设计了一个“目录缓存”来保存完整的目录树快照。这个缓存的内容结构，在源码里被存储在一个叫`index`的文件中。因此，在Git的底层实现（源码）里，操作这个缓冲区的变量都带着“cache”前缀；而“index”这个名字则因为它作为文件直观地出现在了`.git`目录里。随着时间推移，普通用户更多通过文档而非源码接触Git，“index”成为了更通用的称呼。而“cache”一词则逐渐退居幕后，仅在讨论内部实现时使用，其过去分词“cached”则作为一个形容词保留下来，用于描述“已通过`git add`放入暂存区”的状态。通过引用git核心维护者Junio C Hamano的解释，文章理清了这三个术语的历史脉络和细微差别，帮你理解为什么同一个东西会有这么多名字。

IT 累计浏览 2,900

有关Cache 2 - 基本结构

这篇讲的是《计算机体系结构量化方法》一书中关于Cache原理的部分章节。作者分享了阅读附录B后的感悟，认为书中将Cache比喻为“一种将小而快的存储器与大而慢的存储器结合使用的巧妙机制”这一描述非常精准。文章从一个常见误区切入：我们往往笼统地说Cache能提升性能，但它具体是怎么提升的？书中一句话点明了关键：Cache对“时延”和“带宽”的改善是分离的。Cache通过提供靠近CPU的快速存储，极大地降低了数据访问的“时延”（第一个比特到达的时间）；而其通过预取和块传输的设计，又在一定程度上保证了后续数据传输的“带宽”。作者特别欣赏这种化繁为简的论述方式。通过这个清晰的视角，Cache不再是一个模糊的“加速器”，而是一个在成本、容量与性能之间进行精细权衡与协同设计的系统核心部件。这种理解方式，能让工程师在架构设计和性能分析时，有更明确的思考方向。

IT 累计浏览 2,740

DB2数据迁移之load

这篇文章聚焦DB2数据库中用于大批量数据迁移的LOAD工具。作者从LOAD的底层原理入手，解释了它为何在处理海量数据时，能显著快于常规的IMPORT操作。其核心在于LOAD是直接向数据库文件中注入数据页，并几乎跳过了大部分日志记录和约束检查，从而实现了极高的效率。文章也清晰地指出了这种高效背后的关键：LOAD操作会暂时绕开常规的数据库逻辑，因此可能带来事务日志空间管理、表空间重组以及约束触发等方面的潜在问题。作者结合实际场景，对比了LOAD与IMPORT在功能、性能和适用场合上的核心差异，比如LOAD适用于初始数据填充或整体恢复，而IMPORT则更适合需要完整日志记录和触发约束的小规模更新。最终，文章得出的结论是，掌握LOAD工具的正确用法和风险，是DBA进行高效数据迁移的关键一课。它能将数小时的任务压缩到几分钟完成，但前提是使用者必须清楚其内部机制和操作后需要执行的必要步骤，比如收集统计信息和重组表空间。

IT 累计浏览 2,160

执行计划中常见index访问方式

这篇讲的是通过一系列针对单表单索引的测试，系统总结了Oracle数据库中几种常见的Index访问方式。作者从实际的执行计划出发，用不同的hint组合，模拟了Oracle执行计划中几种典型的index访问路径。测试核心聚焦于Hint对优化器选择索引访问方式的直接影响。文章展示了在相同数据和索引条件下，使用不同hint（如`INDEX`、`INDEX_FFS`等）后，执行计划中的代价、成本以及具体的I/O读取方式会发生怎样的变化。有趣的是，文章没有去深究为什么每种路径的IO和成本会呈现这样的结果，而是直接给出了不同hint下的统计对比。它更像一份精心准备的“实验报告”，通过具体的执行计划统计，直观展示了hint对优化器选择index访问方式的直接影响。其价值在于，它把经常让人困惑的`INDEX FULL SCAN`与`INDEX FAST FULL SCAN`等概念，放到了一个可观察、可对比的实验场景里。对于想理清“hint如何改变索引使用方式”这一具体问题的开发者，这份实测数据提供了一个清晰的参考起点。

IT 累计浏览 6,661

mysql查询中利用索引的机制

这篇讲的是 MySQL 查询优化中一个典型的“索引陷阱”。作者从一次实际遇到的问题出发：明明数据表已经建立了合适的索引，EXPLAIN 执行计划也明确显示会使用该索引，但实际查询时却“言行不一”，最终还是扫描了全表，导致性能低下。文章详细复盘了这个排查过程。关键在于，EXPLAIN 的预估仅仅是优化器的“想法”，而最终是否使用索引还会受到运行时数据分布、统计信息是否准确、查询条件与索引的匹配度等多个细节因素的影响。作者在文中一步步分析了可能的原因，并最终定位到了问题的症结所在。对于经常与 SQL 性能打交道的开发者而言，这篇文章提供了一个鲜活的案例。它提醒我们，当“理论上应该走索引”而“实际没走索引”时，不能只看 EXPLAIN 的表面结果，更需要结合表结构、数据量和查询写法进行综合诊断，才能真正揪出性能瓶颈。

IT 累计浏览 3,040

MySQL 数据库性能优化之SQL优化

这篇讲的是 MySQL 数据库性能优化系列的第三部分，作者将焦点从索引转向了 SQL 语句本身。文章指出，即便索引设计得当，不合理的查询写法同样会拖垮性能，因此 SQL 优化是整个调优链条中至关重要的一环。作者从 SQL 执行的常见瓶颈出发，系统梳理了多个关键的优化方向。比如，如何避免导致全表扫描的写法，怎样利用执行计划（EXPLAIN）来分析和重写低效查询，以及在复杂的关联查询和子查询中需要注意哪些陷阱。文章并非空谈理论，而是通过具体的代码示例，对比了优化前后的写法差异，并解释了其背后的执行逻辑变化。最终，文章强调了 SQL 优化的核心目的：让数据库引擎能以最高效、最精准的方式获取数据，从而在索引优化的基础上，进一步释放查询性能的潜力。对于日常编写和维护数据库应用的开发者来说，这些实践建议能直接帮助减少不必要的负载和延迟。

IT 累计浏览 5,081

geohash：用字符串实现附近地点搜索

这篇文章从实际应用中的性能瓶颈出发，探讨了如何用 geohash 这一精巧的数据结构，来解决传统经纬度范围搜索在大型系统中遇到的难题。文章开头就点明了旧有方案的痛点：直接用经纬度范围查询，在数据量大时速度慢、索引效率低，并且生成的 SQL 语句高度动态，几乎无法被数据库有效缓存。针对这些问题，作者引入了 geohash 这一方案。它的核心思想是将二维的经纬度坐标，通过一种空间填充曲线算法，映射为一维的、具有空间邻近特性的字符串。这串字符本身就可以直接用来建索引、做前缀匹配，从而将“附近的点在哪”这个二维空间搜索问题，巧妙地转化为一次高效的字符串范围查询。通过这种方式，geohash 不仅提升了查询速度，更重要的是让查询条件变得稳定可控，使得查询计划的缓存成为可能，这对高并发、大数据量的应用架构意义重大。文章还隐含地指出了技术选型中的权衡：geohash 通过牺牲一点精度（将点映射到网格内）来换取巨大的性能收益，并且在处理网格边界附近的“邻居”时需要进行额外处理。这种从实际问题出发，逐步推导解决方案，并揭示其工程权衡的叙述方式，为面临类似挑战的开发者提供了清晰的思路。

IT 累计浏览 4,520

order by 与 limit 的优化

作者从自己团队“提倡简单SQL”的实践出发，探讨了一个高频但易被忽视的优化点。在避免JOIN、子查询的风格下，`ORDER BY`与`LIMIT`成了支撑业务查询的主力，其性能直接影响用户体验。这篇文章没有空谈理论，而是聚焦于这类简单查询可能带来的性能陷阱。作者强调，在面对这些看似基础的语句时，真正的技巧往往藏在细节里。他批判了仅凭模糊经验就下结论的浮躁心态，转而提倡一种更严谨的态度：对每一条涉及排序和分页的SQL，都需要仔细分析其执行计划与底层逻辑，学习并借鉴已被验证过的优化方法。文章的价值在于将关注点从“炫技”式的复杂查询，拉回到大量简单查询的实战优化上，提醒开发者对基础保持敬畏。这种基于真实业务场景的思考，对于追求数据库稳定与效率的团队来说，是很有参考意义的务实分享。

IT 累计浏览 2,480

为什么Oracle不使用我的索引?!

这篇讲的是一个典型的 Oracle 索引失效问题，但根因却藏在统计信息里。作者在分析一个真实案例时发现，开发者明明在查询条件中使用了索引列，且 `SELECT` 了需要的字段，Oracle 却总是顽固地选择全表扫描。深入诊断后发现问题出在 CBO（基于成本的优化器）所依赖的统计信息上。由于表上的列分布发生了剧烈变化（例如一个10G的表上跑了半年的DDL），旧的统计信息与现实严重不符，导致优化器对索引选择性的估算出现了致命偏差。更有趣的是，文中还提到了 `cardinality feedback` 这个机制，它在首次硬解析时选择了全表扫描，并在软解析时“锁死”了这个错误的执行计划，让问题变得更加隐蔽。解决方法看似简单却容易被忽视：及时使用 `DBMS_STATS` 包刷新相关对象的统计信息，让优化器能基于准确的“地图”来规划路径。这个案例提醒我们，当索引“不工作”时，除了检查查询写法和索引本身，数据库的统计信息健康状态是必须排查的关键环节。

IT 累计浏览 3,921

改变了对Mysql子查询的看法

这篇讲的是作者对MySQL查询优化的一次观念刷新。他过去从SQL Server转向MySQL时，发现官方文档更推荐JOIN，而子查询用`EXPLAIN`分析常表现不佳，于是形成了“MySQL子查询效率差”的刻板印象，在项目中一律改用JOIN写法。然而一次线上故障改变了他的看法。网站因访问缓慢被排查，管理员发现涉及几张小表的查询平均耗时高达40秒。作者拿到慢查询日志，发现正是典型的JOIN写法，且`EXPLAIN`结果显示使用了临时表和文件排序。常规添加索引并未奏效，在尝试将JOIN改写为`IN`子查询后，执行计划瞬间变为使用索引，查询效率恢复正常。作者随后对网站近10条类似语句进行了优化，网站整体速度得到显著提升。这个案例生动地说明了，数据库查询优化不应拘泥于固定的教条或过往的经验，必须针对具体的引擎版本、数据规模和执行计划进行实测与分析。MySQL的查询优化器在不同场景下对JOIN和子查询的选择可能存在差异，实践出真知。

IT 累计浏览 3,382

Mysql的一些记录

作者在多年与MySQL打交道的过程中，养成了随时记录的习惯。这篇“流水账”式的笔记，恰恰汇集了许多从实战中提炼出的零散但关键的经验片段。它不像系统性的教程，更像是作者遇到具体问题时的真实思考与解决痕迹。内容可能覆盖了如何为慢查询精准选择索引、特定版本下的某个“坑”如何规避、备份与恢复脚本里几个易错的参数，或是优化器做出意外决策时的排查思路。这些点状的记录，共同勾勒出一个资深DBA或后端开发者日常面对MySQL时的典型工作流。对于读者而言，其价值不在于知识的系统构建，而在于提供了一种“问题-解决”的即时参考。当你在相似的场景下卡住时，这篇笔记里的某个细节，或许正是能让你快速找到方向的那把钥匙，避免了重复踩坑的时间消耗。它展现了一种务实的知识管理方式。

IT 累计浏览 3,281

说oracle优化之一

这篇讲的是作者在一年内完成超过百项Oracle性能优化的实践复盘。从体系架构的改造、缓存策略的应用，到具体实现方式的调整，乃至添加提示、建立索引等细节调优，文章系统梳理了这些形形色色的案例。作者并未停留在罗列技术点，而是着重提炼了进行有效优化所必须具备的思维与执行路径：如何诊断瓶颈、选择正确的优化层次（是架构、代码还是SQL），以及如何评估改动带来的实际效果。文章的核心在于将零散的实战经验沉淀为可复用的方法论。它没有泛泛而谈理论，而是基于“解决真实生产问题”这一主线，穿插了具体的优化措施与背景。例如，如何权衡架构改动带来的长期收益与短期风险，或者一个简单的索引变更背后需要考虑哪些因素。对于面临类似挑战的数据库工程师或开发者来说，这篇总结提供了宝贵的实践视角和决策参考。