数据库

共 1099 篇文章

IT 2026-06-03 09:03:23 / 累计浏览 93

StarRocks 物化视图创建与刷新全流程解析

本文详细解析了StarRocks物化视图从创建到刷新的完整技术流程。在创建阶段，系统首先对SQL语句进行语义分析与校验，随后通过本地元数据服务完成一系列核心操作，包括验证数据库与视图的存在性、初始化列定义与刷新策略（如异步定时刷新）、根据存算一体或分离架构创建对象、处理分区映射逻辑，以及将关键数据序列化至元数据中以支持重启恢复。元数据通过FE集群的checkpoint机制定期快照，确保一致性。创建完成后，刷新流程会立即触发，其核心步骤在于同步物化视图与基础表的分区状态。对于常见的Range分区，系统通过特定分区器计算分区差异，并执行删除旧分区与添加新分区的操作，以确保物化视图的数据范围与基础表保持一致，随后基于此差异计算并执行具体的数据刷新任务。整个流程紧密围绕分区管理和元数据持久化展开，是理解StarRocks物化视图机制的关键。

本机暂存

IT 2026-06-03 09:03:23 / 累计浏览 78

SQLite + zstd：定时任务日志压缩优化实践

针对定时任务日志系统的性能与存储压力问题，我们重构了原有基于MySQL的Webcron系统。原系统因日志查询与主业务共用数据库，导致页面加载严重超时；同时高频任务产生的海量日志数据急剧膨胀，占用大量磁盘空间。为此，我们采用SQLite替代MySQL作为独立的日志存储引擎，以消除对主业务的影响。核心优化在于应用zstd压缩算法，针对大于150字节的日志内容进行压缩，相比明文存储和gzip，实现了更优的压缩比与性能平衡。我们设计了按月分库的存储策略，将每月日志存入独立的SQLite文件，既简化了数据清理，也保证了查询性能的稳定。最终方案使用Go语言结合GORM与zstd库实现，达到每10万条日志仅占约10MB的压缩效果，并在数百万条日志中实现了毫秒级查询。此实践证明，对于中小型系统，SQLite配合压缩技术是一种轻量、高效且易于维护的日志管理方案。未来可探索DuckDB及动态字典等方向进一步优化。

本机暂存

IT 2026-06-03 09:03:23 / 累计浏览 74

扒一扒h2database远程代码执行

H2 Database Web Console存在通过JDBC注入实现远程代码执行的安全漏洞。该漏洞主要影响1.4.198之前的版本，攻击者可利用其控制台接口构造恶意的JDBC URL，通过特定语法执行系统命令。此漏洞的核心在于H2数据库的JDBC驱动允许在连接字符串中执行内嵌的SQL代码块，从而实现任意命令执行。在1.4.198版本中，官方添加了`-ifNotExists`选项，默认禁止远程创建数据库。这一改动显著提高了攻击门槛，因为攻击者必须事先能够访问或控制一个已存在的H2数据库实例，无法再通过远程新建数据库的方式直接发起攻击。因此，对于暴露在公网且未及时更新的H2控制台，风险依然存在。针对该漏洞，最有效的缓解措施是及时升级至安全版本，并遵循最小权限原则，避免将H2控制台直接暴露于不受信任的网络。同时，应对数据库连接请求进行严格的输入校验，防止恶意JDBC URL的注入。该案例凸显了数据库组件安全配置与及时更新的重要性。

本机暂存

IT 2022-06-19 12:01:23 / 累计浏览 5,240

Python连接 MySQL 数据库的超时问题

这篇文章深入分析了Python开发中一个常见的“坑”：使用Flask-SQLAlchemy连接MySQL时，为何会突然抛出“MySQL server has gone away”的异常。作者从实际案例出发，先拆解了MySQL服务端的`wait_timeout`机制（默认8小时，常被企业调至600秒）和Flask-SQLAlchemy客户端的连接回收策略（`SQLALCHEMY_POOL_RECYCLE`默认2小时），指出了问题的核心——两端的超时设置不匹配，导致数据库端已关闭空闲连接，而客户端仍试图使用该失效连接。针对这个具体的超时错位问题，文章提供了三种切实可行的解决方案：一是执行无意义的`SELECT 1`来预先检测连接活性；二是调整客户端的回收时间，使其低于服务端超时阈值（文章推荐使用新的`SQLALCHEMY_ENGINE_OPTIONS`配置方式）；三是使用后主动关闭连接。作者结合企业实践，最终选择了调整客户端配置这一更便捷的方法。文章的分析紧扣故障现场，将超时参数的具体数值、异常产生的典型堆栈以及配置修改的代码示例一一呈现，为遇到同类问题的开发者提供了清晰的排查路径和落地参考。

本机暂存

IT 2021-05-28 08:35:26 / 累计浏览 2,594

这几年在存储上犯的错

这篇讲的是作者从亲身经历出发，分享这些年在存储和运维上踩过的真实大坑。文章从一起线上数据误删事件切入，没有说教，而是直接讲述了几个让作者“想死的心都有”的故障现场：比如用错误配置上线，瞬间拖垮了整个数据库集群；在恢复误删数据时，不慎将 DROP TABLE 命令也一并执行，导致只恢复出了一个豆列；以及在进行数据库主从切换时，因与同事短暂交谈分心，在从库同步未追平的情况下就进行了操作，最终引发数据冲突。每个案例都像一部微型灾难片，详细描述了错误的决策瞬间、连锁反应以及在巨大精神压力下的补救过程。作者坦诚地剖析了背后的直接原因，例如对配置项的误解（SET GLOBAL SQL_LOG_BIN）、脚本操作的风险以及流程中的侥幸心理。文章的结尾给出了沉痛而实用的教训：“备份不做，日子甭过”，并强调了任何危险操作都应确保可回滚，工具应该比人更可靠。它并非一篇技术方案，而是一面镜子，照见了运维工作中那些不可避免的“人为因素”，也体现了团队在危机中相互支持的宝贵文化。对于每一位需要和线上系统打交道的工程师，这都是一次难得的经验共情。

本机暂存

IT 2021-05-27 22:26:51 / 累计浏览 2,656

Oracle 各种删除操作对空间返还的说明

DBA们常常遇到这样的困惑：对Oracle表执行DELETE、DROP还是TRUNCATE？这些操作对空间到底有何影响？这篇技术说明正是为厘清这些差异而写。文章将三种常见删除操作（DELETE SQL、DROP TABLE、TRUNCATE TABLE）放在一起对比，从多个维度拆解其不同。关键差异点包括：DELETE操作不会将空间归还给表空间或文件系统，空间仅能被原表重用，但可能产生“高水位”；而DROP和TRUNCATE默认都会释放表空间，但依然不会自动收缩数据文件。此外，在本地管理表空间下，这些操作基本不会造成表空间碎片，但在老旧的字典管理表空间中，DROP和TRUNCATE则可能导致碎片。对于追求“干净”释放空间的场景，文章也给出了务实建议：例如使用`shrink space`整理表，或对索引执行`coalesce`。最终目的是帮助DBA们根据实际需求（是彻底删除、快速清空还是谨慎释放）选择合适的操作，并管理好预期——Oracle默认不会自动将空间返还给操作系统。

本机暂存

IT 2021-05-26 23:07:42 / 累计浏览 1,634

按照重要程度划分数据库级别

这篇讲的是一个为数据库重要性分级的实用框架。作者没有空谈理论，而是直接给出了从S级到D级的清晰划分，并为每个级别匹配了具体的业务场景、潜在影响范围以及相应的灾难恢复成本。比如，一个仅影响几十人的测试系统（D级）与像12306这样的大型公共应用（S级），在业务类型、灾难救援价格（从几千元到50万元以上）以及需要的备份与灾备设施（从“几乎无任何有效备份”到“全冗余部署”）上，有着天壤之别。这套体系的价值在于，它让技术团队能清晰地评估和沟通数据库资产的业务价值，并据此决定投入多少资源来保障其数据安全与业务连续性。文章用一个简洁的表格呈现了这种对应关系，对于需要制定数据保护策略的团队来说，这是一个非常直观的决策参考。

本机暂存

IT 2021-05-17 23:26:41 / 累计浏览 1,743

修复 MySQL 编码问题

这篇文章讲的是一个技术人在升级MySQL后遭遇的乱码危机。作者发现自己的博客内容全都变成了乱码，查看建表语句后发现问题根源：数据表以latin1字符集存储了UTF-8编码的内容。传统的ALTER TABLE转换方案效果不佳，于是作者转向了更灵活的mysqldump与重新导入策略。他先用 `mysqldump --default-character-set=latin1` 将数据按原貌导出，避免二次错误编码；接着通过sed命令将导出文件中的字符集声明从latin1批量替换为utf8；最后删除SET NAMES latin1语句，用utf8编码重新导入。这套组合拳成功将数据“救”了回来，避免了更糟糕的情况（如使用zfs回滚）。整个过程清晰展示了面对编码“坑”时，如何通过理解底层原理（字符集与连接设置）来设计修复方案，而不仅仅是依赖单一命令。对于同样遭遇字符集问题的开发者，这份具体可复现的操作记录提供了直接的解决思路。

本机暂存

IT 2020-02-05 15:06:55 / 累计浏览 1,883

如何获取 MySQL innodb 的 B+tree 的高度

这篇文章深入讲解了如何获取MySQL InnoDB存储引擎中B+树索引的实际高度。作者从树高直接影响查询性能这一核心点出发，指出通常3到4层较为理想，并通过一个包含百万条数据的具体示例，演示了两种实用的获取方法。首先，文章详细说明了如何通过查询`INNODB_SYS_INDEXES`等系统表获取索引根页的页号，然后结合`innodb_page_size`和`hexdump`工具直接读取`.ibd`数据文件，从中解析出表示树高的`PAGE_LEVEL`字段。这种方法能让你直观地看到主键、`name`、`age`等索引分别处于第几层。其次，文章还提供了一个不依赖数据库权限的估算思路：基于B+树结构，计算非叶子节点和叶子节点单页可容纳的索引项数量，从而推算出特定数据量下树的大致高度。例如，通过计算得出百万级数据下，`age`索引的高度就达到了3层。整个过程既有动手操作的命令，也有原理性的估算，让读者不仅能“知其然”，还能“知其所以然”，非常适合希望深入理解InnoDB底层存储机制的开发者参考。

本机暂存

IT 2020-02-01 19:46:44 / 累计浏览 1,816

修改重置MySQL5.7得root登录密码

作者从一台测试服务器忘记MySQL root密码的实际问题出发，分享了在MySQL 5.7环境下重置密码的完整流程。文章直接切入痛点，说明了问题的根源：长期未登录导致密码遗忘。解决方法的核心是利用MySQL的配置跳过启动时的密码验证。具体操作上，需要在配置文件`/etc/my.cnf`的`[mysqld]`部分添加`skip-grant-tables=1`，然后重启服务。此时可以直接用root用户免密登录数据库，通过`update user`命令直接修改`authentication_string`字段来设置新密码。这里作者特别指出，5.7版本将密码字段名从`password`改为`authentication_string`，这是一个关键的版本差异，照搬旧教程会出错。完成密码更新后，必须记得删除配置行并再次重启服务，才能让数据库恢复正常的安全校验。整篇文章步骤清晰，从问题复现到最终解决形成了一个闭环，对遇到同类问题的开发者来说，是一个可直接按步骤操作的实用指南。

本机暂存

IT 2019-04-08 00:54:00 / 累计浏览 1,612

MGR监控及优化点

这篇从实战角度出发，详细梳理了MySQL Group Replication（MGR）在日常运维中需要关注的核心监控指标与性能调优参数。文章开篇指出了MGR官方文档在监控优化方面资料较少的现状，因此作者结合自身教学经验进行了系统总结。内容主要分为两大块。监控部分，不仅列出了判断节点状态（是否Online、是否可写）的SQL语句，更深入讲解了如何量化复制延迟（通过对比GTID）以及检查节点执行队列堆积情况。对于MGR特有的“流控”机制，文章解释了其触发条件（默认在延迟达25000个GTID时Block写操作），并给出了关闭流控的建议与注意事项，特别提到在多IDC部署时推荐关闭。优化部分则直指复制性能的瓶颈，给出了具体的参数调整建议，例如将复制并行类型改为LOGICAL_CLOCK、增加并行线程数，以及针对大事务场景调整压缩阈值以减少CPU消耗。这些调优点都紧扣MGR基于逻辑重放的本质。总的来说，这篇文章并非泛泛而谈，而是提供了许多即查即用的监控命令与可落地的优化参数，对需要实际运维或深入理解MGR性能机制的技术人员来说，是一份很好的实践参考。

本机暂存

IT 2019-03-25 23:29:04 / 累计浏览 1,926

删库跑路救命策略

这篇文章从作者亲身经历的“血泪教训”出发：休假期间因备份脚本的字符集设置错误，导致数据回滚失败，最终背锅降绩效。基于这次事故，作者系统梳理了MySQL误删数据的常见“坑”、预防措施以及紧急恢复方案。预防篇提出了五条实用建议，比如将 `rm` 改为 `mv`、删除对象先 `rename` 归档、操作前善用事务与小批量验证等，核心在于培养操作习惯并保持敬畏之心。恢复篇则针对误删库表、物理文件被删、未提交事务的 `delete` 等不同场景，给出了从“立刻 kill 进程”到利用 `innodb_force_recovery` 启动恢复模式等具体的急救步骤。文章结尾强调，无论平台如何发展，物理与逻辑备份都是不可替代的底线。这篇分享将事故复盘与实战经验结合，对所有涉及数据库操作的人员都是一次生动的安全警示。

本机暂存

IT 2019-01-01 20:44:30 / 累计浏览 2,607

图数据库简介

这篇讲的是图数据库的核心概念与适用场景。作者从NoSQL的大家族中引出图数据库，指出它用节点和边来存储高度关联的数据，比如社交网络中用户之间的关注关系。文章重点解释了当前流行的“带标签的属性图”模型，节点和边都可以拥有多个属性和标签，这使得数据建模非常灵活。文章将图数据库与传统关系数据库进行了对比。核心差异在于：关系数据库擅长处理结构规整的事务，但在进行多层、反向的关联查询（比如“谁的朋友的朋友买了什么”）时，会产生大量表连接，导致性能骤降。而图数据库将节点和关系视为一等公民，采用原生存储和双向指针，使得这类复杂关系遍历的查询速度能保持在很高水平。因此，作者得出的结论是，图数据库并非要取代关系型数据库，而是为社交网络、推荐系统等依赖复杂关系图谱的场景提供了更高效的解决方案。它的优势在于更自然的数据建模、更快的关联查询性能以及更灵活的Schema调整。

本机暂存

IT 2018-07-05 13:43:57 / 累计浏览 3,223

分表优化：千万级数据的插入方法

这篇讲的是对千万级数据进行分表存储时，如何高效地查询和迁移数据。作者没有停留在理论层面，而是直接给出了实操性很强的PostgreSQL SQL片段。具体来说，文章先展示了两种从数字字段中提取首位字符的查询写法：一种是标准的子字符串函数调用，另一种是更常见的简写形式。核心技巧在于，作者演示了如何利用这类字符串函数作为条件，通过一条 `INSERT INTO ... SELECT` 语句，将特定规则（例如 `adv_id` 首位为‘2’且 `media_id` 首位为‘6’）的数据批量复制到新的分表中。通过循环执行这样的复制操作，就能相对快速地完成海量数据的拆分。文章虽然简短，但抓住了分表场景中一个非常实际的动作——数据如何根据规则“落库”，并给出了清晰的语法参考。对于正在处理类似数据迁移或分表任务的开发者来说，这种直接可套用的片段往往比长篇大论更实用。

本机暂存

IT 2018-07-04 12:06:56 / 累计浏览 2,384

用户模型之三户模型

这篇讲的是电信与互联网系统中常用的“三户模型”。作者从eTOM框架出发，梳理了客户（Customer）、用户（User）和账户（Account）这三个核心实体如何以“以客户为中心”的理念进行构建与区分。关键在于厘清三者的边界：客户体现社会域信息，是自然人或法人的实体身份，即使不使用业务也客观存在；用户体现业务域信息，是客户登录和使用产品的账号实例；账户则体现资金域信息，负责交易记账。它们之间是归属与映射关系，但各自独立。文章以电信业务为例具体说明：一个客户（张三）可以开通多个用户（如手机和宽带），这些用户又由一个或多个账户来付费，形成了灵活的映射。在互联网实践中，客户归并（如通过身份证号识别同一人）、用户的生命周期管理（从注册到销户的复杂流程）、以及账户的多样化建模（支付、结算、风控等需求），都围绕这套模型展开，以支撑起以客户为中心的业务管理与数据统计。

本机暂存

IT 2018-06-26 12:28:00 / 累计浏览 1,413

如何在命令行中整理数据

数据审计中常遇到格式错误、乱码、控制字符等棘手问题，而许多人却执着于寻找昂贵的专用工具或编写复杂脚本。这篇文章作者结合自身兼职数据审计的经验，提出了一个返璞归真的解决方案：直接使用命令行工具链。作者处理过十万至百万行、包含多达两百个字段的导出表格，发现混乱无处不在。他指出，人们往往陷入“数据悲伤”的五个阶段，最终才承认需要帮助，并误以为必须依赖特定软件。实际上，Bash shell本身就是一个强大的工具箱。grep、cut、awk这些经典的文本处理器，在应对脏数据时既可靠又高效。文章用一个具体例子展示了威力：如何用一行组合命令（tail、cut、awk），在短短4秒内从超过112万条记录中精准找出某个字段的最长数据项，并封装成可重复使用的函数。作者强调，这种方法的安全优势尤为突出——所有操作都在数据库外部进行，使用的是导出后的纯文本副本，因此完全不影响原始数据库的结构与安全。对于受过Unix训练的读者，这或许是一次怀旧；但对于更多人，它是一个实用提醒：在追求复杂方案前，不妨先“保持冷静，打开一个终端”。

本机暂存

IT 2017-12-24 20:00:05 / 累计浏览 2,124

60 TB 数据：Facebook 是如何大规模使用 Apache Spark 的

这篇讲的是Facebook如何将一个关键的大数据流水线，从古老的Hive迁移到现代的Apache Spark上。背景是，他们用于实时实体排名的特征准备流程，原本基于Hive，由数百个小作业组成，耗时长达三天，且极其难以监控和维护。为了追求更快的速度和更好的可管理性，他们选择将整个流水线整合成一个单独的Spark作业，直接处理高达60TB的压缩数据。迁移过程并非一帆风顺。作者坦言，第一次甚至第十次尝试都未成功，因为要可靠地运行一个处理如此大规模shuffle数据的作业，挑战巨大。团队对Spark的可靠性进行了大量修补，例如提升节点频繁重启时的容错能力，修复了从PipedRDD获取失败到执行器内存溢出等一系列问题。这使得作业得以稳定运行。在性能优化上，他们的努力同样深入。通过自定义的火焰图等分析工具定位瓶颈后，他们对Spark底层进行了关键修改：修复排序器的内存泄漏带来了30%的速度提升；优化Snappy压缩调用节省了10% CPU；减少不必要的重排文件打开操作最高提升了50%的性能。最终，这个迁移项目不仅让Facebook自身受益，所有改进也被回馈给了开源Apache Spark社区。

本机暂存

IT 2017-10-15 09:57:25 / 累计浏览 1,415

Paradox 的数据文件格式

这篇文章探讨的是 Paradox 游戏引擎背后一套独特的数据文件格式。作者从游戏开发实践出发，比较了游戏行业常见的 CSV/Excel 表格模式与软件领域的 JSON/XML 模式，指出它们在处理复杂树状结构数据时各有局限。有趣的是，Paradox 的格式初看像 JSON，但作者在使用 lpeg 编写解析器时有了顿悟：其核心是嵌套的列表结构，这本质上是 Lisp 的思想。这种格式语法简洁（仅用大括号和等号键值对），却拥有比 JSON 和 CSV 更强的表达能力，能优雅地定义游戏事件、触发条件等复杂逻辑，同时保持了策划人员编辑友好的可能性。文章通过《群星》中一段具体的游戏事件代码作为实例，展示了这种格式如何清晰地组织条件判断、效果执行等游戏逻辑。作者最终得出结论：Lisp 模式在简洁性与表达力之间找到了一个更好的平衡点，为游戏数据的组织提供了一种优于传统方案的思路。

本机暂存

IT 2017-10-15 09:41:14 / 累计浏览 2,417

sqlite3导入到mysql

这篇讲的是如何将一个膨胀到15GB的SQLite3数据库（具体来自磁力链接抓取工具magnetico）成功迁移到MySQL。作者从实际问题出发：SQLite3文件过大且不支持分布式，因此需要“魔改”为MySQL，但迁移过程卡在了导入环节。文章清晰地拆解了整个流程：先用`.dump`导出SQL，但面对大文件，导入常常中途失败。作者的核心技巧在于利用`awk`按行号切分文件，从失败点重新开始。同时，必须调整MySQL的`max_allowed_packet`参数，并使用`sed`对导出的SQL进行“方言翻译”——比如将双引号包裹的表名改为反引号，并处理十六进制数据，以解决SQLite与MySQL的语法兼容问题。最终，通过这些针对性的步骤和一条关键的`-f`强制导入参数，完成了大规模数据的跨库迁移。对于面临类似场景的开发者，这提供了一套可复现的实战解决方案。

本机暂存

IT 2016-12-22 23:30:22 / 累计浏览 6,859

SQL里是否可以使用JOIN

这篇讲的是一个流传甚广的技术误区：很多公司出于“性能慢”的理由禁止程序员在SQL中使用JOIN。作者从这个常见的约定出发，通过一个查询最新帖子和用户信息的实例进行了直接对比。文章指出，用JOIN完成的操作，如果拆解成两次独立查询和代码层合并，其开销很可能更大，“用JOIN慢”其实是个没有严格论证的人云亦云的结论。作者进一步点明了真正值得考虑的问题所在——它并非性能，而是系统架构的灵活性。当使用JOIN时，你隐含地假设了相关的表将永远部署在同一个数据库实例上。一旦项目发展，表可能因拆分而“离婚”到不同实例，届时所有用到JOIN的地方都可能需要重构。因此，文章给出的核心建议是：如果相关表未来有独立部署的可能，就要谨慎使用JOIN；否则，完全可以用。所以，用JOIN慢往往不是问题的本质。下次如果听到别人以性能为由反对JOIN，或许可以指出，真正需要权衡的是对未来数据库架构变更的预判。

本机暂存