标签：MySQL Replication

共 2 篇相关文章

IT 累计浏览 3,393

Heartbeat+DRBD+MySQL Replication故障处理

这篇讲的是一次真实的“心惊肉跳”运维实录。作者的 Heartbeat+DRBD+MySQL Replication（H-D-M）高可用架构在一次意料之外的机房断网中全线崩溃，看似准备充分的架构在现实故障面前暴露出诸多问题。文章按处理顺序，详细复盘了三大故障：MySQL主从同步意外撞上一个“古董级”Bug，导致从库relay log数据异常，只能重建；DRBD在断网后发生脑裂，双方互争Primary，最终通过手动调整角色并经历漫长的数据重同步解决；而最棘手的是Heartbeat服务在切换后陷入僵死状态，CPU占满并产生僵尸进程，不得不在业务低谷期强制终止并重启服务才恢复。整个过程不仅是技术排错，更是一次深刻的教训。作者坦言，之前对这套架构的理解仅停留在“能搭起来”的层面，对于资源切换机制、脑裂数据影响、日志深度解读等核心运维知识仍显不足。这次“很囧”的经历恰恰提醒了我们，技术方案的稳定性需要建立在真正透彻的理解和反复的极端测试之上。

IT 累计浏览 6,571

mysql 主从同步原理

这篇讲的是 MySQL 主从复制背后的工作原理。作者从主从架构的基本形态切入，详细拆解了从主库将数据变更传递到从库的完整过程。核心在于二进制日志（binlog）的写入、从库 I/O 线程的拉取与写入中继日志（relay log），以及从库 SQL 线程的重放执行。文章还对比了基于语句（Statement）与基于行（Row）两种复制模式的差异，指出它们在数据一致性与网络负载上的不同权衡。更进一步，文章探讨了复制延迟的常见成因，比如大事务、从库性能瓶颈或网络抖动，并提到了使用 GTID（全局事务标识符）来简化故障恢复和拓扑管理的方案。这些细节让读者不仅能理解“怎么做”，还能明白“为什么”以及在实际运维中需要关注什么。对于需要搭建或维护高可用、读写分离 MySQL 环境的工程师来说，这篇梳理提供了清晰的底层逻辑地图，帮助在设计和排查问题时抓住关键节点。