数据库

共 1083 篇文章

IT 2009-10-11 22:38:50 / 累计浏览 2,364

mysql中now和sysdate的区别

这篇讲的是开发者在实际运维中遇到的一个诡异现象：同一条记录，在MySQL主库和备库上查询到的创建时间戳竟然不一致。起初怀疑是系统时钟漂移，但考虑到binlog本身带有时间戳，这个猜测很快被推翻。经过排查，根本原因被定位到了`NOW()`与`SYSDATE()`这两个看似相似的函数上。文章指出了它们的核心差异：`NOW()`返回的是语句开始执行时的时间点，在一个事务中所有语句看到的`NOW()`值都是相同的；而`SYSDATE()`返回的则是函数实际被调用时的实时系统时间。在基于语句的复制（SBR）模式下，备库重放binlog时，`SYSDATE()`的取值时机与主库执行时必然存在微小的时间差，这就导致了数据不一致。作者不仅解释了原理，也给出了解决方案：要么在会话级别设置`SET SQL_LOG_BIN=0`或`SET TIMESTAMP`来固定时间，要么在业务代码和DDL中统一使用`NOW()`或明确转换成`UTC_TIMESTAMP()`。这个案例生动地说明了，在分布式和复制架构中，对时间函数的细微差别保持敬畏，是保证数据一致性的关键细节。

本机暂存

IT 2009-10-11 22:38:32 / 累计浏览 2,982

Mysql中的导数据脚本

这篇文章讲的是，作者在对线上数据库进行初始化时，面对海量数据需要导入的场景，采用了MySQL自带的`load data`命令作为核心解决方案。相比于逐条执行`INSERT`语句，`load data`的优势在于极高的导入效率，尤其适合处理GB级别的初始数据集。文章分享了从准备格式化数据文件（如CSV）到编写具体导入脚本的完整过程，涵盖了指定字段分隔符、处理字符集、控制事务提交频率等实际操作细节。作者还提及了在实施中可能遇到的典型问题，比如如何处理文件路径权限或如何中断后快速恢复，给出了针对性的配置建议。最终，通过一个相对简单的Shell脚本结合`load data`命令，作者成功实现了大规模数据的快速、稳定初始化。这篇分享为需要进行数据库初始化或大批量数据迁移的开发者，提供了一个经过验证的、高效且开销低廉的实践路径。

本机暂存

IT 2009-10-11 22:38:09 / 累计浏览 4,461

用Mysql来搭建可扩展的SNS网站

这篇讲的是在Web 2.0时代，如何利用MySQL的特性来搭建能够应对流量与数据增长的可扩展社交网络（SNS）系统。文章从现实背景出发：随着网站访问量和数据量的急剧膨胀，传统的集中式数据库架构逐渐成为性能瓶颈，难以进行有效的水平扩展，例如实施读写分离。而作者指出，这恰恰是MySQL的优势所在——它天生设计易于扩展，能够灵活地应对这些挑战。基于此，文章阐述了选择MySQL作为数据平台的核心考量。无论是初创的小企业还是规模庞大的网站，都在有意识地转向MySQL，正是看中了它在分布式架构和可扩展性方面的潜力。通过利用MySQL，开发者可以更自然地构建出能够随业务一同成长的系统架构，从而突破传统数据库的限制。结论是，MySQL凭借其易扩展的特性，正在从一种“备选”方案，逐渐演变为许多企业构建可扩展网络应用时的新标准选择。

本机暂存

IT 2009-10-11 22:37:18 / 累计浏览 3,983

Mysql中大批量删除数据

这篇聊的是MySQL中一个非常常见但容易“踩雷”的场景：如何高效清理大批量过期数据。很多开发者遇到表数据膨胀、性能下降时，第一反应可能是简单粗暴的`DELETE FROM`。但作者指出，这种操作在数据量巨大时几乎不可行——它会长时间锁表、产生海量的binlog日志，甚至导致主从同步延迟，对线上服务影响巨大。文章的核心方案是引导读者采用“化整为零”和“巧用工具”的思路。比如，分批次删除数据，并在每批之间预留时间让数据库喘息；或者通过创建新表、迁移有效数据再切换的方式，实现“无损”清理。作者很可能还介绍了一些具体工具（如`pt-archiver`）或利用延迟关联来优化删除流程的技巧。关键结论在于，处理大批量删除绝不能图省事，必须根据数据量、业务容忍度和技术栈来选择合适策略，以最小化对线上业务的影响。掌握正确的姿势，才能让数据库维护从“事故”变为日常运维的一部分。

本机暂存

IT 2009-10-11 22:36:39 / 累计浏览 4,341

Mysql .frm损坏后如何恢复

当MySQL因.frm文件损坏而拒绝启动时，数据库可能会变得无法访问，业务也随之停摆。这篇文章深入剖析了这一棘手故障的排查与恢复路径。作者从.frm文件的核心作用讲起，它存储着表的元数据定义，一旦损坏，InnoDB或MyISAM引擎都无法正确识别表结构，导致服务异常。文章的核心价值在于其提供的多层次、可操作的解决方案。它不仅讲解了如何从逻辑备份或数据字典中重建表定义这种“软恢复”思路，还详细介绍了利用ibdata或.ibd文件进行“强制导入”的进阶技巧。对于更严重的情况，甚至探讨了通过解析二进制文件来逆向提取表结构的可能性。每一种方法都附带了适用场景、潜在风险与具体步骤，比如在使用强制导入时，必须确保新旧表结构严格一致，否则可能导致数据损坏。对于运维人员而言，这不仅是一份故障应急手册，更揭示了MySQL元数据管理的底层逻辑。文章强调，定期备份.frm文件或采用独立表空间模式，是避免此类问题的根本之道。它让读者在解决当前困境的同时，也能建立起更稳健的数据库维护习惯。

本机暂存

IT 2009-10-11 22:36:09 / 累计浏览 3,000

Mysql中的存储过程

这篇介绍MySQL存储过程的文章，从它作为MySQL 5.0引入的重要特性切入，并直接将其与Oracle存储过程进行对比。作者指出两者在核心思想上相似，但在具体语法上存在差异，这为熟悉Oracle的开发者迁移到MySQL环境提供了清晰的参照。文章的核心价值在于提供了一个可直接套用的存储过程编写模板。通过这个具体的例子，读者能直观地了解如何在MySQL中定义参数、编写逻辑块以及处理结果集。这种以模板为导向的讲解方式，省去了从零摸索的过程，特别适合需要快速应用到实际项目中的开发者。总的来说，文章聚焦于MySQL存储过程的基础用法与迁移要点，将语法差异点和实用模板作为重点呈现。对于想快速掌握或应用这一功能的开发者而言，它提供了简洁明了的实践指南。

本机暂存

IT 2009-10-11 22:35:55 / 累计浏览 3,620

Mysql中的alter table操作原理

这篇讲的是MySQL中`ALTER TABLE`操作背后的运行原理。当执行这条命令时，数据库并非直接修改原表，而是先创建一份原表的临时副本，在副本上进行所有修改操作，完成后再删除旧表并将新表重命名。这种“复制-修改-替换”的策略保证了操作的原子性。作者进一步解释了这个机制对业务的影响：在修改过程中，其他用户仍然可以读取原表的数据，但任何写入操作都会被暂时阻塞。直到新表完全准备好并接管后，这些被挂起的修改请求才会自动应用到新表上。这意味着`ALTER TABLE`操作可能会引发短暂的写延迟，尤其是在处理大表时。理解这个实现原理，能帮助开发者更合理地规划表结构变更，比如在低峰期执行，或者考虑使用在线DDL工具来减少对线上服务的影响。

本机暂存

IT 2009-10-11 22:35:22 / 累计浏览 2,641

Mysql中rand（）的实现方式

这篇讲的是 MySQL 中 `rand()` 函数的工作原理。作者从实际查询中 `ORDER BY rand()` 的性能问题入手，带我们深入看了下它的底层实现。核心思路是：MySQL 的 `rand()` 默认使用一种名为“线性同余”的算法来生成伪随机数。每次查询如果没有指定固定的随机种子（seed），MySQL 会基于当前时间等动态值生成一个种子，之后的一系列“随机数”都是由这个种子通过公式计算出来的。这就解释了为什么在一次查询里，`rand()` 对每一行返回的值是“固定”的（因为种子固定了），但不同查询之间结果却不同。文章还点出了一个常见的误解：`rand()` 生成的随机数序列并不均匀，且存在可预测性。对于需要强随机性或安全性的场景，它并不适用。作者通过分析源码级别的细节，让我们明白了这个看似简单的函数背后的确定性逻辑，也理解了它为什么在大数据量下会成为性能瓶颈。对日常写 SQL 的人来说，这篇文章提供了一个从“会用”到了解“为何这样用”的视角，下次面对随机查询的优化时，思路会更清晰。

本机暂存

IT 2009-10-11 22:35:06 / 累计浏览 5,605

Mysql中的排序优化

这篇讲的是 MySQL 处理 `ORDER BY` 时的底层排序机制与优化路径。核心在于，MySQL 的理想排序是“索引排序”——通过将排序字段包含在索引中，让数据天然有序，从而避免昂贵的排序操作与额外的回表开销。当无法利用索引排序时，MySQL 就会在内存的 sort buffer 中执行两种算法之一。一种是经典的两阶段算法：先读取排序字段和行指针，在 sort buffer 中排序完成后再回表取出全部字段。另一种是优化器在某些场景下会采用的“一次性排序”，它直接取出查询需要的所有字段放入 sort buffer，一次排序就完成所有工作，省去了第二次的回表读取。理解这两种算法的关键差异，就能明白为什么“让排序字段走索引”是性能优化的黄金法则。同时，这也提示我们在设计索引时，不仅要考虑 WHERE 条件，将排序字段也纳入其中，往往是让查询免于排序的关键一步。

本机暂存

IT 2009-10-11 22:34:47 / 累计浏览 4,762

Mysql中的分页写法

这篇讲的是 MySQL 里一个常见但容易被忽略的细节：分页查询的实现。作者开门见山，直接点出常见的分页写法是通过两个独立的 SQL 完成的——一个用 `COUNT(*)` 获取总数，另一个获取当前页的数据列表。这是一种典型的“两次查询”模式。文章的核心对比在于这种常规写法与更高效的游标分页（例如使用 `WHERE id > last_id`）之间的差异。关键的区别在于性能和适用场景：传统的 `LIMIT offset, size` 写法在 offset 值非常大时，数据库需要跳过大量已检索的行，导致查询效率显著下降；而游标分页通过利用索引（如主键）直接定位起始点，避免了深分页的性能陷阱，特别适用于数据量巨大、需要持续向后翻页的场景，比如信息流或实时日志浏览。作者通过具体的 SQL 示例和可能的性能分析，清晰地揭示了不同方案背后的取舍。对于日常开发，这提醒我们在面对海量数据时，简单直接的 `LIMIT` 可能并非最优解，选择与业务场景匹配的分页策略至关重要。

本机暂存

IT 2009-10-11 22:34:28 / 累计浏览 3,283

Mysql执行计划中的Using filesort

这篇讲的是MySQL执行计划中一个常见但关键的现象——Using filesort。作者从执行计划的基本原理切入，解释了这个术语的具体含义：当MySQL无法利用索引来完成排序时，就需要进行额外的文件排序操作。具体来说，数据库会保存排序关键字和行的指针，然后对这些关键字进行排序，最后按排序顺序检索行。这个过程通常在查询涉及排序或分组，且缺少可用索引时出现。在对比方面，文章将Using filesort与Using index等其他执行计划类型进行了区分。关键差异在于效率：Using index表示直接通过索引排序，性能较高；而Using filesort则需要额外的排序开销，可能对查询速度产生负面影响。这种对比突出了索引设计的重要性——在合适的场景下创建索引，可以避免不必要的文件排序，从而优化查询性能。文章进一步讨论了各自的适用场景：对于小数据量或简单查询，Using filesort的影响可能有限；但对于大数据集或高频查询，它往往会成为性能瓶颈。通过EXPLAIN工具识别并分析Using filesort，开发者可以针对性地调整索引或查询语句，比如在ORDER BY子句上建立索引。最后，作者总结道，理解Using filesort的机制有助于在日常开发中做出更明智的数据库优化决策，从而提升整体系统效率。

本机暂存

IT 2009-10-11 22:34:07 / 累计浏览 1,883

Mysql时间函数

这篇讲的是 MySQL 中各种时间函数的使用指南。文章从获取当前日期时间讲起，比如 `CURRENT_TIMESTAMP` 和 `NOW()` 的区别，再到精确获取日期 (`CURDATE()`) 或时间 (`CURTIME()`) 的函数。它着重对比了多个相似函数在返回值和精度上的不同，例如指出 `NOW()` 返回语句执行时间，而 `CURRENT_TIMESTAMP` 是标准 SQL 函数。除了基础用法，文章还梳理了函数在特定场景下的选择：进行日期加减时用 `DATE_ADD()`，格式化输出用 `DATE_FORMAT()`，计算时间戳间隔则用 `UNIX_TIMESTAMP` 和 `FROM_UNIXTIME`。这些对比点出了每个函数最适合的典型应用，帮助读者在实际查询中做出准确选择，避免因混淆函数而导致的逻辑错误或性能问题。

本机暂存

IT 2009-10-11 22:33:44 / 累计浏览 3,283

说oracle优化之一

这篇讲的是作者在一年内完成超过百项Oracle性能优化的实践复盘。从体系架构的改造、缓存策略的应用，到具体实现方式的调整，乃至添加提示、建立索引等细节调优，文章系统梳理了这些形形色色的案例。作者并未停留在罗列技术点，而是着重提炼了进行有效优化所必须具备的思维与执行路径：如何诊断瓶颈、选择正确的优化层次（是架构、代码还是SQL），以及如何评估改动带来的实际效果。文章的核心在于将零散的实战经验沉淀为可复用的方法论。它没有泛泛而谈理论，而是基于“解决真实生产问题”这一主线，穿插了具体的优化措施与背景。例如，如何权衡架构改动带来的长期收益与短期风险，或者一个简单的索引变更背后需要考虑哪些因素。对于面临类似挑战的数据库工程师或开发者来说，这篇总结提供了宝贵的实践视角和决策参考。

本机暂存

IT 2009-10-11 22:33:18 / 累计浏览 3,941

Mysql如何使用内存

这篇文章讲的是MySQL数据库底层的内存使用机制。作者从MySQL服务器整体的内存结构出发，重点剖析了每个数据库连接（session）所占用的内存是如何分配和管理的。文章的核心在于对比MySQL中几种不同的内存类型。它详细说明了像“连接缓冲区”、“排序缓冲区”这类每个session独有的内存区域，其特点是随连接创建而分配，随连接关闭而释放。同时，文章也指出了与之相对的、所有连接共享的“全局内存区域”，例如最著名的InnoDB缓冲池，这部分内存的分配和释放策略与session内存截然不同。作者通过具体的参数（如`join_buffer_size`、`sort_buffer_size`）和场景，解释了不合理的内存设置可能带来的影响，比如并发连接数过高时，每个session的私有内存累加可能导致系统内存迅速耗尽，从而引发性能问题甚至崩溃。这帮助开发者理解，为什么有时单纯增加物理内存并不能线性提升数据库性能，关键在于内存的使用方式。文章没有停留在概念层面，而是引导读者去思考：如何根据实际的业务负载和连接模式，来平衡全局共享内存与session私有内存的比例。这对于进行数据库性能调优和容量规划的工程师来说，提供了清晰的决策思路。

本机暂存

IT 2009-10-11 22:32:51 / 累计浏览 3,624

Mysql中如何批量生成脚本

这篇讲的是如何高效地从MySQL数据库批量生成所需的SQL脚本，例如建表语句、数据导出脚本等。作者直接从命令行操作切入，展示了利用`mysql`客户端结合特定参数（如`-e`执行命令或利用系统表）来实现脚本的自动化生成。相比于手动编写或单个表导出，这种方法特别适合需要一次性处理大量数据库对象的场景，比如在数据迁移、环境复制或生成标准化备份脚本时，能极大提升工作效率和准确性。文章的核心在于介绍一个实用的运维技巧，即通过一条或几条组合命令，让数据库自己“说出”其结构或内容，从而生成可重复执行的脚本。对于经常需要维护数据库或进行跨环境部署的开发者和DBA来说，这个方法能有效避免人工操作遗漏，是工具箱里一个值得掌握的小利器。

本机暂存

IT 2009-10-11 22:32:05 / 累计浏览 4,082

Shared pool和library cache latch

这篇技术文章聚焦于Oracle数据库中一个关键却常被忽略的底层机制：Shared pool latch。作者从其核心作用切入——它主要负责保护共享池的内部结构，在内存分配、释放乃至老化处理时都需要被获取，是维护共享池稳定性的关键“门锁”。文章清晰地梳理了一个重要的技术演进。在Oracle 9i版本之前，整个共享池由单一的Shared pool latch统一保护。而自9i开始，Oracle引入了多子池（sub pool）设计：当服务器CPU核心数超过4个，且`shared_pool_size`设置大于250MB时，共享池会被动态划分为多个子池（最多7个），每个子池拥有独立的内存结构、LRU列表以及自己的latch。这意味着对共享池的操作竞争，从单一的“瓶颈”被分散到了多个子池的latch上，从而提升了在高并发环境下的性能。此外，文章也指出了人工干预的可能性，管理员可以通过`_kghdsidx_count`参数来手动设定子池的数量，为性能调优提供了一个更精细的调控点。对于理解Oracle内存管理机制和进行性能诊断的DBA来说，厘清这一 latch 的作用与演变历史，是诊断共享池竞争问题的重要基础。

本机暂存

IT 2009-10-11 22:31:21 / 累计浏览 6,701

如何建立合适的索引？

这篇文章从一个典型的运维场景出发：当你在 statspack 报表中发现逻辑读、物理读极高的 SQL，分析过表统计信息且执行计划已走索引时，该如何进一步判断其是否真正优化？作者没有停留在表面指标，而是深入探讨了在“看似合理”的表象下，如何验证索引选择的效能与 SQL 语句执行质量之间的深层关联。文章的核心在于提供一种系统性的诊断思路，而不仅仅是工具使用教程。它引导读者超越“是否走了索引”这个二元判断，去追问索引类型（比如是否是覆盖索引）、访问路径（如回表次数）、以及索引效率与数据分布的实际匹配度。通过对这些细节的剖析，文章旨在帮助读者建立一套从性能现象反推至设计根源的完整优化逻辑。读完能感受到，真正的优化工作往往从那些“看起来已经优化过了”的地方开始。它教会我们如何拆解一个“标准答案”，并在实际业务场景中做出更精准、更有效的判断，这对于任何需要与数据库性能打交道的工程师来说，都是一次扎实的思维训练。

本机暂存

IT 2009-10-11 22:30:14 / 累计浏览 4,422

我这几年

作者从大学时代对联想、方正这些“洋气”大公司的憧憬谈起，回忆了自己毕业后意外加入方正春元的幸运经历——没有复杂面试，因为公司急需人手而直接入职。这篇小文的核心，并非讲述一个逆袭的职场故事，而是借由这段初期经历，剖析了“第一份工作”的潜在价值。大公司带来的系统性训练让他印象深刻：从做人做事的规范，到学习方法、客户沟通技巧，甚至每日工作日志的要求，这些看似刻板的流程，实则为他搭建了职业世界的底层框架。作者认为，正是这段经历让他“明白了以后要做什么”，其重要性甚至超越了技能本身。这段平实的回顾提醒我们，职业生涯的起点或许不在于岗位的光鲜，而在于能否获得一次完整的、结构化的职业启蒙。它帮助新手从“学生思维”切换到“职业思维”，看清自己未来的方向——这可能是比起薪更宝贵的初始馈赠。

本机暂存

IT 2009-10-11 22:29:05 / 累计浏览 3,501

如何使用dbms_stats分析统计信息？

这篇讲的是Oracle数据库中一个非常实用的程序包——dbms_stats的入门使用。作者从Oracle 8i版本引入dbms_stats这一背景切入，提到它如今已广泛推荐用来替代传统的analyze命令，主要优势在于让统计信息的生成与处理变得更加便捷高效。文章简明地梳理了dbms_stats的基本定位：它不仅仅是一个工具，更是现代Oracle优化器赖以准确评估SQL执行计划的数据基石。作者分享了自己的学习笔记视角，没有停留在概念堆砌，而是隐含地指向了一个关键对比——与analyze命令相比，dbms_stats在并行处理、分区统计以及历史信息管理等方面都更为强大和灵活，这也解释了为何它能逐渐成为行业标准。对于希望理解优化器工作原理或进行SQL调优的DBA与开发者而言，掌握dbms_stats是必不可少的一环。这篇文章提供了一个清晰的起点，帮助读者从“知道有这么个工具”迈向“理解为何要用它以及如何用好它”，为后续更深入的统计信息管理实践打下基础。

本机暂存

IT 2009-10-11 22:27:37 / 累计浏览 3,382

library cache pin和lock的区别

这篇讲的是Oracle数据库中library cache pin与library cache lock这两个常被混淆的概念。作者从一个经典的面试问题出发，坦言自己曾被难住，并在与同事的深入讨论和查阅官方文档后，终于理清了二者的本质区别。文章的核心在于细致对比。简单说，lock保护的是对象在共享池中的存在性（如一个游标的打开状态），而pin则保护的是对象本身的内容（如SQL语句的执行计划）不被修改或刷出。关键差异体现在阻塞场景上：lock通常阻塞DDL或依赖管理操作，而pin则直接阻塞那些需要执行SQL的会话。它们就像数据库门卫和内容保镖的不同分工。作者没有停留在概念，还结合了V$SESSION_WAIT视图的观测，剖析了它们在争用时的不同等待事件。这种从实际讨论到理论梳理，再回归实践验证的路径，为理解Oracle共享池的底层保护机制提供了清晰的逻辑线索。

本机暂存