杨万富 -- IT技术博客大学习 -- 共学习共进步！

首页 / 杨万富

IT 2010-09-06 22:22:30 / 累计浏览 3,180

思考mysql内核之初级系列14---innodb的旧式记录结构

这篇讲的是InnoDB如何组织其最底层的行数据——旧式记录结构。作为“思考MySQL内核”系列的延伸，在讨论完簇页管理后，作者将焦点转向了页内的微观世界。文章的核心，是剖析InnoDB在早期（兼容旧版本）使用的那套复杂而精巧的记录存储格式。这并非简单的字段拼接，而是一套涉及字段编码、NULL值处理、变长字段长度偏移，乃至溢出页指针设计的完整实现。作者通过具体的结构拆解，揭示了这套设计如何在有限的页空间内，努力兼顾存储紧凑性与读取效率，同时支持像TEXT/BLOB这样的大数据字段。这种对“旧式”结构的深挖，其价值在于理解InnoDB演进的起点。当我们明白旧结构在面对现代复杂查询和高并发写入时，在空间管理和性能上遇到了哪些瓶颈，才能真正领会新式紧凑记录格式的改进究竟解决了哪些根本问题。对于想深入理解InnoDB存储引擎行为（比如数据页为何那样满、行锁范围如何确定）的开发者而言，这篇从最底层记录结构入手的分析，提供了一个关键视角。

本机暂存

IT 2010-09-06 22:20:32 / 累计浏览 2,980

思考mysql内核之初级系列13---innodb的簇页管理

这篇文章延续了上一篇对簇描述结构的探讨，深入InnoDB存储引擎内核，具体剖析了簇页（Cluster Page）这一专门用于管理簇结构的核心机制。作者通过两位技术人员的对话，层层递进地讲清楚了簇页在底层是如何运作的。首先，文章厘清了簇页的角色——它并非存储用户数据，而是负责“管理”数据簇本身。接着，核心内容聚焦于簇页的管理思路：它详细介绍了簇页的三种类型及其不同职责，阐述了簇描述信息在簇页中的具体组织方式，比如如何通过页内结构来记录簇的范围、状态等关键元数据。文中还特别提到了链表结构在其中起到的关键作用，以及页面空间是如何被动态管理以容纳这些管理信息的。整篇文章的巧妙之处在于，它将内核中原本抽象、静态的“管理页”概念，通过实际的对话拆解为动态的流程和具体的结构，把“谁管理谁”、“信息怎么存”、“空间怎么用”这些底层问题讲得相当透彻。这种源自内部视角的梳理，有助于理解InnoDB在磁盘上组织海量数据时，那份不为人知的“账本”是如何写就的。

本机暂存

IT 2010-08-22 10:04:28 / 累计浏览 2,380

思考mysql内核之初级系列12---innodb的簇描述结构

这篇讲的是InnoDB存储引擎中一个关键但常被忽略的内部结构——簇描述结构（extent）。作者从上一篇讨论的页编号自然延伸，带领读者深入理解InnoDB是如何高效管理磁盘空间的。核心思路在于，InnoDB并非孤立地分配和管理单个16KB的页，而是将连续的64个页（共1MB）组织成一个“簇”（extent）作为更大的分配单位。这种设计大大减少了频繁分配零散页所带来的磁盘碎片和随机I/O开销，是InnoDB提升顺序读写性能的底层基石之一。文章通过对话形式，清晰地解释了簇描述结构的定义、作用以及它与页管理之间的关联。理解extent机制，是洞察InnoDB表空间管理、文件碎片产生原因以及进行深度性能调优的重要前提。

本机暂存

IT 2010-08-15 09:51:14 / 累计浏览 3,160

思考mysql内核之初级系列11---innodb的页编号

这篇讲的是MySQL InnoDB存储引擎中“页编号”这个看似简单却至关重要的概念。作者从整个系列的脉络出发，在前10篇铺垫了基础知识与调试方法后，于本篇正式进入InnoDB存储结构的深水区。文章聚焦于“页编号”这一核心标识符，它就像是InnoDB数据世界里的门牌号。作者没有直接堆砌定义，而是从实际应用场景切入，解释了InnoDB为何需要页编号、它如何唯一标识一个数据页，以及它如何将磁盘上的物理存放与内存中的逻辑管理连接起来。对于理解后续的页分裂、页合并、缓冲池管理等复杂操作，页编号是必不可少的基石。为了让描述更清晰，作者在本篇刻意隐去了一些底层细节，为后续深入讲解B+树等结构埋下伏笔。这种由表及里、循序渐进的剖析方式，让读者能先建立起清晰的框架认知。读完这篇，你会明白为什么每个数据页都需要一个全局唯一的编号，它正是InnoDB高效组织与访问海量数据的逻辑起点。

本机暂存

IT 2010-08-15 09:41:55 / 累计浏览 3,080

思考mysql之初级系列10---mysql内核调试方法

这篇讲的是MySQL初级系列中转向学习方法论的一篇。作者bingxi和alex在梳理了InnoDB的几种核心数据结构后，在这篇里将焦点从“是什么”转向了“怎么学”。他们认为，仅仅阅读源码或理论讲解是不够的，强烈推荐通过调试的方式来深入理解MySQL内核。文章集中分享了在Windows环境下调试MySQL代码的常用方法和实践经验。作者们详细介绍了如何在本地搭建调试环境，以便能够单步跟踪代码执行、观察变量状态，从而直观地理解那些复杂的内核机制是如何一步步运作的。这种“动手拆解”的学习路径，虽然看似需要投入更多精力，但能让你对代码逻辑和内部工作流程获得远比被动阅读更深刻、更牢固的掌握。整篇文章就像一次实用的同行经验分享，其核心观点是：主动调试是通往内核理解的一条高效路径。它为希望从理论读者转变为主动探索者的开发者，提供了一套具体可行的操作指南。

本机暂存

IT 2010-08-01 20:09:16 / 累计浏览 3,340

思考mysql内核之初级系列9---innodb动态数组的实现

这是MySQL内核思考系列的第九篇，继前文探讨了list结构之后，作者将目光转向了InnoDB另一个基础数据结构——动态数组（dyn）。与普通的动态数组不同，InnoDB的dyn需要兼顾性能与内存管理的灵活性。文章的核心在于拆解其设计思路：它并非简单地在内存不足时进行 realloc，而是采用了内存预分配与按需扩展相结合的策略，有效避免了频繁的系统调用开销。文中会剖析其内部如何通过链表节点组织内存块，以及如何在保证元素连续性的同时，处理可能发生的内存重定位。这种实现巧妙地在开发便捷性与运行效率之间取得了平衡。理解dyn的实现，对于深入InnoDB如何高效管理其内部缓冲池、自适应哈希索引等核心组件的内存有着直接的帮助，也能让读者窥见数据库引擎在底层数据结构上的精细考量。

本机暂存

IT 2010-08-01 20:05:50 / 累计浏览 2,780

思考mysql内核之初级系列8---innodb的list算法

这篇讲的是MySQL内核初级系列的第八篇文章，承接上一篇关于hash表的讨论，将视角转向了另一个基础数据结构：list，也就是双向链表。作者从InnoDB存储引擎的内核实现出发，剖析了list算法的具体应用。虽然双向链表在《数据结构》课程中很常见，但在MySQL这样的工程实践中，其实现需要考虑更多因素。文章重点指出了一个关键的实现细节：为了屏蔽底层数据差异或平台差异，InnoDB通过宏（macro）来封装和实现链表操作，这与上一篇hash表的实现思路一脉相承，体现了MySQL内核代码的抽象与封装艺术。理解list在内核中如何被定义和使用，对于看清诸如LRU链表、刷新链表等内存管理机制的实现原理很有帮助。这篇文章为内核初学者从熟悉的数据结构切入，去理解更复杂的存储引擎逻辑，提供了一个不错的起点。

本机暂存

IT 2010-07-25 20:19:35 / 累计浏览 3,140

思考mysql内核之初级系列7---innodb的hash表实现

这是系列文章《思考MySQL内核之初级》的第7篇，前文讨论了InnoDB文件系统管理时引出了两个基础结构：hash_table_t和UT_LIST_NODE_T。本篇接着这个线索，专门聚焦于hash_table_t这个在内核中被广泛使用的哈希表结构。作者从这两个常用结构切入，旨在带领读者理解哈希表在数据库存储引擎内核中的具体实现与核心作用。文章并未停留在概念层面，而是深入到了实现细节，探讨了InnoDB如何利用哈希表这一经典数据结构来高效管理其内存与数据元信息。这种对底层数据结构实现的剖析，恰恰是理解大型软件系统内存管理和性能优化的关键。它揭示了在复杂的数据库内核中，一个看似基础的工具是如何被精巧地设计和应用的。对于想进一步了解InnoDB内部运作机制或学习系统级编程的读者来说，这篇聚焦于一个具体实现点的讨论，提供了扎实且有价值的视角。

本机暂存

IT 2010-07-25 20:15:09 / 累计浏览 2,860

思考mysql内核之初级系列6---innodb文件管理

这篇讲的是 InnoDB 内核中一个核心但常被忽略的模块——文件管理（fil）。作者从上篇的 information_schema 探索收尾，指出那只是在 Innodb 外围打转，这次他们真正推开了进入 InnoDB 内部的第一扇门。文章聚焦于 fil 这一层如何对磁盘文件进行管理。它解释了 InnoDB 如何组织和管理数据文件、日志文件等物理存储，如何通过 fil 层的抽象来实现上层逻辑空间与底层物理文件之间的映射。这包括文件的打开、关闭、读写操作，以及如何维护这些文件的元数据信息。理解 fil 是后续深入理解表空间管理、缓冲池以及数据如何持久化的关键基础。作者将复杂的实现拆解为清晰的逻辑层次，让读者能够跟随着他们的思考，一步步看清 InnoDB 管理文件的思路。这种从外围功能逐步切入内核核心模块的写法，为想要理解数据库底层原理的开发者提供了一个不错的入门路径。

本机暂存

IT 2010-07-25 09:56:08 / 累计浏览 2,580

思考mysql内核之初级系列5---information_schema不是innodb数据字典

上次聊到InnoDB缓冲区里的页被数据字典使用后，作者这次想搞清楚一个关键问题：information_schema里的那些表，和真正的InnoDB数据字典到底是不是一回事。文章的核心结论可能颠覆一些常识——它们并不是一回事。作者通过分析指出，`information_schema` 中的InnoDB相关表，更像是一层动态生成的“视图”，其数据来源于InnoDB引擎在运行时填充到内存中的结构。而真正的InnoDB数据字典，则是引擎内部用于管理表、索引、列等定义的持久化存储结构，其核心页面直接缓存在Buffer Pool中。两者的关键差异在于数据来源与更新机制。当你查询 `information_schema` 时，触发的可能是对内存数据结构的读取，甚至可能引发代价高昂的表扫描（比如 `information_schema.tables`）。而直接理解InnoDB内部的字典存储，则关乎对引擎元数据管理的根本认识。这对于理解DDL操作的性能开销、监控数据库真实状态，乃至进行深度的性能调优都至关重要。所以，这篇文章引导读者区分数据库的“外部视图”与“内部真相”。作者从缓冲区观察出发，层层剖析，最终落脚于一个根本性认知：要真正懂MySQL，得看透这层由 `information_schema` 提供的、便于查询但并非元数据本身映射。

本机暂存

IT 2010-07-25 09:51:57 / 累计浏览 3,300

思考mysql内核之初级系列4--innodb缓冲区管理

这篇来自MySQL内核思考系列的文章，将视角从基础的查询层转向了存储引擎的核心——InnoDB。作者并未停留在概念阐述，而是直接切入代码层面，剖析了InnoDB缓冲区（Buffer Pool）的管理实现。文章从Buffer Pool要解决的内存与磁盘I/O效率问题出发，梳理了其内部的数据结构组织方式，比如如何通过链表管理页面、哈希表如何加速查找。核心的实现思路在于如何高效地缓存和管理数据页，作者重点解读了其改进的LRU算法，解释了如何通过设置“年轻”和“年老”区域来避免全表扫描等操作冲刷掉热点数据，这体现了内核设计的巧妙权衡。通过这种源码级的剖析，读者不仅能理解缓冲区“是什么”，更能看清它“如何工作”以及“为何这样设计”，为后续深入事务锁等更复杂的机制打下基础。

本机暂存

IT 2010-07-25 09:49:19 / 累计浏览 1,960

思考mysql内核之初级系列3---办理业务的流程

这篇讲的是MySQL内核在接收到一条SQL语句后，最开始的那一步是如何进行的。作者从“办理业务的流程”这个比喻出发，将SQL语句比作需要办理的“业务”，而MySQL内核就是处理这个业务的“办事大厅”。文章聚焦于这个大厅的入口处，即语法结构处理的初级环节——Lex词法分析。核心思路是拆解Lex如何将一段连续的SQL文本，按照预定义的规则（如关键字、标识符、运算符），切割成一个个有意义的“词法单元”（Token）。这个过程有点像阅读理解前先划分句子成分，是后续语法分析和执行的基础。文章没有停留在概念介绍，而是结合MySQL源码，展示了Lex规则文件（.l文件）的具体结构以及生成的词法分析器是如何工作的。读完能清晰理解，在复杂的优化和执行之前，MySQL正是通过Lex这样看似简单却扎实的切割工作，将无结构的文本转化为计算机可处理的结构化数据，这是整个内核流程稳定且高效的第一块基石。对于想从底层了解数据库工作原理的开发者来说，这篇文章提供了一个非常具体的切入点。

本机暂存

IT 2010-07-25 09:45:57 / 累计浏览 2,120

思考mysql内核之初级系列2---我可以为你服务什么？

这篇讲的是MySQL内部服务模型的一个生动比喻。作者从日常生活中“去营业厅办业务”的场景出发，将MySQL内核中复杂的连接处理、任务分发和服务执行过程，类比为一套清晰的服务流程：Alex取号相当于客户端发起连接请求，客户经理小张则代表了MySQL中专门处理该请求的服务线程或组件。文章通过这个初级系列的第二篇，重点探讨了MySQL能够为不同类型请求（比如查询、管理操作）提供什么样的“服务”。文章的核心在于对比与阐释。它通过这个服务台的比喻，帮助读者直观地理解MySQL内部各模块（如连接管理器、线程池、查询执行器）如何像一个高效的服务团队一样分工协作。你不仅能看到“取号-叫号-办理”这一表面流程对应着MySQL中的握手、认证、查询分发与执行，更关键的是，作者揭示了这套模型背后的设计思想，比如为提升并发处理能力而采用的多线程或异步机制，以及如何保证“服务”的稳定与高效。对于刚接触MySQL源码或想理解其工作原理的开发者而言，这种将抽象内核逻辑与具体生活经验挂钩的讲解方式，大大降低了理解门槛，让你能快速建立起对MySQL服务生命周期的宏观认知。

本机暂存

IT 2010-07-25 09:42:22 / 累计浏览 3,200

思考mysql内核之初级系列1--- mysql的启动过程

这篇文章记录了两位开发者探索MySQL内核的一次独特尝试。他们没有采用常见的代码调试或资料检索的方式，而是从“思考”出发，试图在对内核不甚了解的前提下，通过逻辑推演与逐步验证来理解MySQL的启动过程。作者将焦点对准了MySQL服务从启动到就绪这一看似平凡却至关重要的过程。他们梳理了从命令发出到进程就绪的关键步骤与核心逻辑链，将启动过程分解为可理解的阶段。这种“从零开始、边想边试”的路径，不仅揭示了启动流程的实现细节，更呈现了一种通过构建心智模型来学习复杂系统的方法。对于想初窥MySQL内核门径的读者，尤其是那些面对庞大源码感到无从下手的开发者，这篇分享提供了一种亲切的起点：它展示了如何将一个宏大的目标拆解，并通过思考与验证相结合的方式，逐步接近系统的内部运作原理。

本机暂存