数据库

共 1099 篇文章

IT 2014-11-19 23:19:17 / 累计浏览 2,117

RDS典型客户工单——空间问题

这篇直击RDS运维中让人头疼的磁盘空间问题，它并非泛泛而谈理论，而是直接从一个个真实的客户工单切入，抽丝剥茧地分析典型场景。文章系统梳理了七大类空间异常情况，从临时表与日志文件膨胀导致的“飙升”，到磁盘超限触发实例只读锁定，再到新手常遇到的“未用先满”疑惑，以及因大字段或本地迁移引入的隐形空间消耗。针对每个问题，都给出了明确的根因，比如使用临时表的低效SQL、未及时清理的binlog、SQL Server大字段对日志的放大效应，并提供了具体的排查与解决路径，例如创建索引避免临时表、清理binlog、调整字段大小或升级数据库版本以优化undo日志回收。文章特别提到了一个因binlog累积与排序操作叠加导致空间暴涨的综合案例，展现了问题排查的复杂性。对于开发者和运维人员来说，这篇文章像一份实用的故障排查手册，把那些看似突发的空间锁定问题拆解成了可诊断、可预防的具体技术点，能帮助大家快速定位并解决生产环境中的类似棘手问题。

本机暂存

IT 2014-06-10 12:25:34 / 累计浏览 2,557

redis 数据结构综述

这篇讲的是 Redis 存储键值对的核心底层数据结构，从源码层面剖析了其设计与巧妙的权衡。文章从全局视角出发，逐一介绍了 dict 哈希表、可变类型的 redisObject、高效插入删除的 zset（跳表+哈希表组合）、经典的 adlist 双链表，以及为优化 CPU 缓存和内存而生的压缩列表 ziplist 和整数集合 intset 等关键结构。不止于理论，作者更将这些结构与具体的 Redis 命令联系起来，清晰地展现了不同场景下的选择逻辑。比如，SET 命令对应最简单的 sds 或数值类型；HSET 和 LPUSH 在特定条件下会使用紧凑的 ziplist 而非链表；SADD 会根据元素是否全为整数，在 intset 和 dict 之间动态切换；而 ZADD 有序集合则综合运用了 skiplist 和 dict，或采用 ziplist，具体取决于配置阈值。这种从底层实现到命令行为的串联分析，揭示了 Redis 在性能与内存之间精妙平衡的设计哲学。作者提到这只是系列开篇，后续将逐一深挖每个结构，值得对 Redis 内部机制感兴趣的技术人持续关注。

本机暂存

IT 2014-05-27 22:56:54 / 累计浏览 2,783

Dynamo和Cassandra海量存储基础

这篇讲的是Dynamo和Cassandra这两个经典分布式存储系统，在核心设计哲学上的对比与剖析。文章从它们共享的基石概念入手，比如用W+R>N公式如何决定读写一致性级别，并用主备复制、Quorum机制等实例具体说明了N、W、R取值的影响。真正的分歧点在于处理数据冲突的策略。Dynamo选择了更复杂的向量时钟，它像Git一样记录数据版本的来源，当检测到并行的、可能冲突的写入时，会保留所有版本交由应用层合并，适合能处理合并逻辑的场景。而Cassandra则采取了更粗暴的简化——时间戳方案，它不检测冲突，直接以最新时间戳的数据为准。这极大降低了复杂度，适用于大多数对冲突不敏感的场景。文章还追溯了两者共同的基础——Gossip协议，并提及了它在去中心化通信中的优势与维持一致性的挑战。作者的对比最终导向了一个深刻的观点：在大多数写入冲突概率较低的场景下，这种最终一致性模型比强一致全局排序（如Paxos）更高效。两种不同的冲突解决路径，正体现了在工程化实现中对一致性权衡的不同哲学。

本机暂存

IT 2014-05-27 22:47:54 / 累计浏览 2,689

深入剖析 redis 数据淘汰策略

这篇讲的是 Redis 在内存紧张时如何选择“淘汰谁”的策略。当数据集大小超过 maxmemory 限制时，Redis 会启动数据淘汰机制，而策略的选择直接关系到服务的稳定性和数据的访问模式。文章梳理了 Redis 提供的六种策略。核心思路分为三类：针对设置了过期时间的键（volatile）进行 LRU（最近最少使用）、TTL（最快过期）或随机淘汰；针对所有键（allkeys）进行 LRU 或随机淘汰；以及完全禁止驱逐。作者重点剖析了 LRU 和 TTL 两种机制的实现细节。有趣的是，Redis 的 LRU 并非一个严格的全局算法。它维护了一个每分钟更新的服务器级 lruclock，在每次淘汰时，会从数据集中随机抽取一批键（由 maxmemory_samples 控制），然后只在这批“样本”中找出 LRU 值最大的那个进行淘汰。TTL 策略的实现方式也类似，是随机采样后淘汰剩余存活时间最长的键。这是一种在性能与效果之间做出权衡的巧妙设计，牺牲了绝对的精确性，换来了极低的计算开销。文章通过源码揭示了 freeMemoryIfNeeded() 这个核心函数的工作流程：每次执行命令后检查内存，若超标则根据配置的策略，遍历数据库，通过采样找出要驱逐的键值对并删除，同时将此操作同步到 AOF 和从库。理解这些机制，能帮助我们更好地配置 Redis，在缓存命中率、内存使用和性能之间找到最佳平衡点。

本机暂存

IT 2014-04-13 22:38:27 / 累计浏览 2,570

如何在Redis里按模式删除数据

这篇讲的是一个Redis内存突然暴增导致宕机的排查案例。作者从服务器异常消耗几十G内存、最终因SWAP宕机说起，一开始和DBA同事以为是有大键占用了空间，但用工具分析后排除了这个可能。问题随后转向了另一个方向：即使单个键不大，但大量相同模式的键累计起来，占用的空间也可能非常可观。作者最初想用 `KEYS` 配合 `DEL` 命令批量删除可疑键，结果因为数据量太大，`KEYS` 命令直接让服务器再次崩溃——这暴露了KEYS命令在生产环境中的巨大风险。最终，作者改用支持游标迭代的 `SCAN` 命令，通过PHP脚本分批扫描并删除目标键，同时监控内存变化，成功锁定了问题源头。整个过程也强调了一个运维要点：除了关注大键，监控Redis键总数的变化幅度同样重要，这能帮助及早发现类似批量写入导致的隐患。

本机暂存

IT 2014-04-07 22:56:02 / 累计浏览 4,865

Linux大棚版redis入门教程

这篇是面向初者的Redis全景指南，从安装启动讲起，一直深入到核心数据结构、持久化机制和生产配置。文章不止停留在“是什么”，更用大量实际命令演示了如何操作。作者将Redis的五种数据结构——字符串、列表、集合、有序集合与哈希——拆解开来，配合代码示例讲明各自的用法与底层特性。比如，他指出lists在底层是链表，因此头部尾部操作是常数时间，但随机定位较慢，并以此引出其在消息队列等场景的应用优势。在掌握基础后，教程进一步引导读者理解RDB与AOF两种持久化的原理与选择，主从同步的机制，乃至事务处理。最后对redis.conf配置文件的逐项解读，让初学者也能看懂并调整安全、性能与限制相关的参数。整个系列循序渐进，覆盖了从“跑起来”到“用得好”的关键知识点，对于希望快速上手并扎实理解Redis的新手来说，是一份非常友好的实战手册。

本机暂存

IT 2014-03-19 22:47:55 / 累计浏览 4,622

undo异常总结和恢复思路

这篇讲的是Oracle数据库UNDO表空间故障的实战总结。作者从一线工作出发，集中汇总了如ORA-00704（bootstrap process failure）、ORA-00600[4194]、ORA-00600[kcfrbd_3]等一系列让很多DBA头疼的UNDO相关报错。文章的核心价值在于其系统性。它不仅罗列了千奇百怪的错误现象，更关键的是揭示了背后的常见根源：大多数UNDO异常并非文件本身损坏，而是因为Redo日志未被正常前滚，导致回滚段状态异常，最终阻碍数据库打开。针对这类问题，作者提供了一套清晰的渐进式恢复思路：从尝试修改UNDO管理方式（M MANUAL）、设置特定事件（10513），到逐步使用参数屏蔽问题回滚段，最后才考虑使用bbed或dul等底层工具。这个思路为遇到类似困境的DBA指明了从软到硬、风险递增的排查路径。当然，作者也坦诚地指出数据库恢复千变万化，无法照搬，并提供了进一步获取专业技术支持的途径。

本机暂存

IT 2013-09-23 13:54:28 / 累计浏览 3,569

关于sqlite的事务的使用

SQLite以读性能出色著称，但写入性能有时会让开发者头疼。这篇来自作者实践经验的文章，就从一个具体问题切入：批量插入500条小记录居然需要20多秒，异常缓慢。问题的根源是什么呢？作者通过strace工具追踪系统调用发现，高达88.73%的耗时（超过27秒）都花在了`fdatasync`系统调用上，调用次数多达2064次。这正是因为SQLite默认的“每次写入都落盘”的安全策略所致，频繁的磁盘同步成为了性能瓶颈。文章给出的解法很直接：使用事务。将多次写入操作包裹在一个事务中，使得数据能够一次性批量提交。优化效果立竿见影：`fdatasync`调用从2064次骤降至12次，整体耗时从27.6秒猛降到209毫秒，性能提升了百倍以上。作者也进一步探讨了相关话题，比如无法批量操作时可选用的nosync版本，以及面对超大数据量时分批提交事务的考量。这篇文章的价值在于，它用非常实证的数据，清晰展示了SQLite写入慢的核心原因以及事务优化带来的巨大提升。

本机暂存

IT 2013-09-23 12:20:01 / 累计浏览 1,455

Oracle中的Low HWM与 High HWM 高水位

这篇讲的是Oracle数据库在ASSM存储管理下，如何通过引入Low HWM和High HWM两个高水位标记来优化存储空间利用与并发性能。作者从传统MSSM模式下单一高水位标记的局限性切入，指出了其可能引发的锁竞争与IO性能问题。文章核心聚焦于ASSM的解决方案：通过两个高水位将数据块区域划分为已格式化（Low HWM以下）、未格式化但可能被重用（Low HWM与High HWM之间）以及完全未格式化（High HWM以上）三个区域。这种设计精妙之处在于，它允许在HWM以下存在未格式化的“空洞”，从而在直接路径加载数据时，能更灵活地复用空间，避免因频繁提升高水位而导致的锁等待和不必要的格式化IO开销。作者进一步解释了这一机制的关键细节：只有当当前extent及之前extent中的所有块均被格式化后，Low HWM才会上升；而High HWM的提升则与一级位图块管理的范围相关。在顺序读取时，系统以High HWM为终点，同时忽略其间未格式化的块，保证了查询效率。整篇内容深入到底层实现原理，为理解Oracle复杂的存储管理提供了清晰的视角。

本机暂存

IT 2013-09-15 22:26:43 / 累计浏览 2,468

Oracle JDBC中的语句缓存

这篇讲的是如何在Java应用中，利用Oracle JDBC驱动提供的语句缓存机制，来优化数据库访问性能，核心目标是实现“一次解析，多次执行”的高效模式。文章首先清晰梳理了Oracle数据库中硬解析、软解析等不同SQL解析方式的特点与潜在性能瓶颈，指出过多解析会导致latch争用等问题。随后，作者通过一个对比实验，直观展示了开启JDBC语句缓存前后的巨大差异：未缓存时，一条SQL语句执行200次就产生了200次解析；而开启缓存后，同样执行200次，解析次数仅为1次，显著降低了数据库负载。实现的关键在于通过OracleConnection对象设置`setStatementCacheSize`和`setImplicitCachingEnabled`，这能为每个连接自动缓存使用过的PreparedStatement。文章还深入一层，介绍了如何通过`setExplicitCachingEnabled`及手工指定Key的方式，进行更精细的缓存控制，以避免缓存不常用语句造成的内存浪费。通过具体的代码示例与数据库监控结果验证，文章为Java开发者提供了一个实用且效果明确的Oracle性能优化方案。

本机暂存

IT 2013-09-07 15:23:36 / 累计浏览 2,070

数据的存储介质-磁盘的硬件特性

这篇技术文章深入剖析了机械硬盘的硬件特性，从基础构造讲到性能原理，非常适合需要理解存储底层机制的开发者。作者从磁带机讲起，解释了磁盘如何通过电机旋转盘片、磁头移动寻道来实现随机访问，这个演进过程讲得清晰易懂。文章重点剖析了几个关键点：硬盘如何以“块”（通常为512字节）为单位进行读写，以及在异常断电时，系统如何通过在启动时清理未完成的数据块来保证数据的原子性，这是单机存储保证一致性的经典思路。更硬核的部分在于对性能指标的辨析。文章厘清了 IOPS（每秒读写次数）、吞吐量（MB/s）和延迟之间的关系，并指出它们适用的不同场景：数据库更看重影响 IOPS 的寻道时间，而大文件存储则更追求吞吐量。作者还用“飞机运旅客”的比喻，巧妙地说明了适度增加延迟可以提升整体吞吐量的原理。最后，文章总结了机械硬盘技术成熟、顺序读写性能好的优势，以及因机械结构导致随机访问性能下降的固有劣势。

本机暂存

IT 2013-09-07 15:22:50 / 累计浏览 3,480

数据的存储介质-磁盘的RAID

RAID作为存储领域的基石技术，其“分而治之”与“冗余复制”的核心思想，至今仍深刻影响着分布式存储系统的设计。这篇文章从数据存储的两个基本要素——通信管道与介质出发，清晰地拆解了RAID技术诞生的根本动因：通过合理组织多块磁盘，来突破单盘在IOPS与数据安全性上的瓶颈。文章对几种经典RAID模式（RAID 0/1/5/1+0）的阐述并非简单罗列，而是抓住了它们的核心逻辑与权衡。例如，指出了RAID 0的并行读写优势、RAID 1的镜像成本，以及RAID 5通过XOR校验在冗余与空间效率间的折衷。特别值得玩味的是，作者点明了RAID 0+1与RAID 1+0在故障场景下的关键差异，解释了为何后者是更优的选择，并自然引申到GFS、HDFS等现代文件系统其实都采用了“先复制、再切分”的类似策略。更深入一层，文章探讨了在单机环境下实现RAID时所面临的、类似于CAP问题的原子性写入挑战。它揭示了RAID卡如何利用“内存缓存+电池/SSD备份”这一巧妙而务实的方案来打破数据一致性的逻辑循环，既保证了性能，也解决了可靠性难题。文中对盘柜及新网络协议（如FC、iSCSI）的提及，则拓宽了读者对RAID物理实现形式的认知。整体而言，这篇文章将RAID技术置于更广阔的存储演进史中，不仅讲清了“是什么”和“为什么”，更通过与分布式系统的类比，帮助读者理解了这一传统技术历久弥新的底层逻辑。

本机暂存

IT 2013-09-07 15:22:07 / 累计浏览 2,964

数据的存储介质-固态存储SSD

这篇讲的是SSD固态硬盘的性能内幕。作者抛开基础科普，直击几个核心痛点：为什么不同品牌的SSD读写速度差距巨大？为什么解决了磁盘寻道问题后，4K随机写仍是性能瓶颈？而所有问题的答案，最终都指向了一个关键角色——FLASH控制器。文章从NAND闪存的底层特性说起，解释了SLC/MLC的区别、以及闪存“必须整块擦除”的特殊操作。正是这些硬件限制，导致了“写入放大”现象。作者指出，各家控制器处理垃圾回收、磨损均衡和写入策略的算法差异，直接造就了性能上的天壤之别。对于随机写瓶颈，文章分析了块回收跟不上写入请求时，延迟会从250微秒陡增至2250微秒的残酷现实。最后，文章探讨了控制器放在专用芯片还是共享主机CPU上的不同路线之争，并展望了随着控制器算法优化和闪存成本下降，SSD将在高性能存储领域全面取代机械硬盘的趋势。读完能让人明白，SSD的水，远比“无机械结构所以快”要深得多。

本机暂存

IT 2013-09-04 23:17:06 / 累计浏览 2,699

如何提高Oracle进程的优先级 - 实现进程实时调度

这篇讲的是在繁忙的Oracle系统中，如何为关键后台进程争取更多的CPU资源。作者从Oracle 10gR2引入的一个隐含参数 **_high_priority_processes** 出发，介绍了实现进程实时调度的具体方法。文章核心是讲解这个参数的使用：通过在数据库中设置它（例如 `_high_priority_processes="LMS*|LGWR|PMON"`），可以提升指定进程的优先级。作者通过Linux下的实际测试展示了效果：设置前PMON进程为普通分时调度（TS），重启数据库后即转变为实时调度（RR），从而能优先获取CPU。文章还对比了不同操作系统下的差异，例如Solaris上会使用RT实时模式。最后，作者也提醒了实际应用中的细节，比如在RAC环境中，提升所有LMS进程的优先级可能并非必要，反而会抢占资源，需要根据业务负载审慎配置。整篇文章从原理、设置方法到实际效果和注意事项，提供了一套完整的技术思路。

本机暂存

IT 2013-09-02 13:31:54 / 累计浏览 4,337

从需求出发来看关系模型与非关系模型–关系模型与非关系模型概述

这篇讲的是关系模型与非关系模型的选择根源。作者从当前对 NoSQL 的盲目追捧现象切入，指出许多项目初创团队都在纠结如何选择 NoSQL，却忽略了模型本身的本质。文章的核心是帮读者理清 RDBMS、NoSQL、CAP、BASE 这些概念的本源，并用一个“车”的例子清晰地对比了层次模型和关系模型的差异。关键在于，关系模型通过集合运算抽象了数据“关系”，让用户无需像层次模型那样关心从“车”到“轮子集合”再到“具体轮子”的存取路径，只需关注查询逻辑本身，这使得它严谨且被广泛接受。然而，随着面向对象编程的普及，关系模型带来了“阻抗失配”问题——将对象中的继承、组合映射到关系表变得非常痛苦。为解决此问题，业界尝试了 ORM 工具、在数据库层支持对象，以及利用脚本语言的动态特性来简化映射。这些方案各有代价，ORM 学习成本高且易导致低效查询，而用 Map 则会破坏封装性。随着互联网发展，对高性能和灵活数据结构的需求，让层次模型的变种——NoSQL 重新受到关注。文章接下来将从具体应用场景出发，剖析关系模型在哪些地方力不从心，以及 NoSQL 为何又能满足新的需求。

本机暂存

IT 2013-09-02 13:30:54 / 累计浏览 1,690

Solr之缓存篇

这篇讲的是Solr搜索引擎中“看不见”却至关重要的性能支柱——缓存系统。作者没有停留在配置层面，而是直接钻进源码，剖析了Solr四种核心缓存（filterCache、documentCache等）的生命周期是如何被 `SolrIndexSearcher` 牢牢掌控的。文章清晰地展示了，一次索引提交（commit）如何像一个开关，触发 `getSearcher()` 方法关闭旧的 `IndexReader`，并构建新的 `SolrIndexSearcher`。而新的Searcher一旦构建，它所管理的所有缓存实例便会随之重建。这意味着缓存并非永久存在，其生命周期与底层的索引阅读器严格绑定。更巧妙的部分在于“预热”机制的设计。文章通过代码片段揭示，当新Searcher被构建时，系统会在后台线程中将老缓存中的热点数据预先加载到新缓存中。这个过程有效避免了缓存“冷启动”带来的性能断崖，确保了搜索服务在索引更新后的平滑过渡。这种从实现原理出发的解读，让读者不仅能配置缓存，更能理解其背后的运行逻辑与优化思想。

本机暂存

IT 2013-09-01 21:54:25 / 累计浏览 5,926

nosql数据库选型

作者翻阅了《七天七数据库》一书后，结合自身多个项目从MySQL迁移到NoSQL的实际需求，分享了一套具体的数据库选型方案。他指出，不同的业务场景需要不同的数据库来发挥最大价值。对于社区网站中复杂的关系数据（如用户关注、图片关联），他摒弃了传统关联表，选择了原生支持图关系的Neo4j，这不仅简化了数据模型，也提升了查询性能和开发体验。而面对网站丰富且结构多变的内容模型（如用户、站点），他看中了MongoDB对复杂索引查询的良好支持，认为其能完美替代MySQL的大多数功能，并可能简化缓存层，甚至取代部分Redis的角色。在处理高写入、弱一致性要求的微博本地缓存时，他对比后认为Cassandra在写性能和可用性上优于MongoDB。对于极高并发的API服务，他则在Cassandra和Riak之间权衡，前者在列式存储和写性能上可能更具优势。整篇文章从具体业务痛点出发，详细对比了不同NoSQL数据库在一致性、查询能力、性能及运维复杂度上的关键差异，并给出了清晰的选型结论。这为同样面临类似技术过渡的开发者，提供了一个非常实用且可参考的架构思路。

本机暂存

IT 2013-08-26 23:03:44 / 累计浏览 3,001

Impala：新一代开源大数据分析引擎

这篇讲的是Cloudera推出的Impala，一个旨在解决Hive查询速度瓶颈的开源大数据分析引擎。文章详细拆解了Impala如何借鉴Google Dremel的思想，采用列式存储（Parquet格式）和多层查询树架构，摆脱MapReduce的批处理束缚，从而在交互式查询上实现数量级的性能提升。作者将Impala与同期的Shark、Apache Drill进行了横向对比。Impala的优势在于相对成熟的工程实现和快速的查询响应，但其容错机制较弱，且开源生态初期主要绑定Cloudera自家发行版。相比之下，基于Spark的Shark在内存计算和容错性上更有优势，而Apache Drill则更具平台开放性，尽管当时开发进度稍慢。文章通过性能对比图表指出，尽管Impala和Shark都远超Hive，但与Amazon Redshift等商业MPP数据库仍有差距。文章的最终观点是，大数据分析的未来不在于某一技术的独胜，而在于Hadoop生态（如YARN）将兼容并包，让不同引擎各司其职——Impala这类系统擅长秒级交互查询，而MapReduce则继续处理大规模批处理任务。这场技术竞争正推动大数据分析变得更成熟、易用和普惠。

本机暂存

IT 2013-08-21 13:09:24 / 累计浏览 2,034

SSDB 配置文件

这篇讲的是如何理解和定制 SSDB 的配置文件。文章开篇就点明，默认附带的配置文件无需修改即可运行，但若需高度定制，了解其配置项就很有必要。配置文件本身是层级 key-value 的静态格式，通过 TAB 缩进来表示结构，一目了然。文章逐一拆解了核心配置段：`work_dir` 指定了存放数据和日志的工作目录；`server` 段控制监听的 IP 与端口，出于安全考虑，可以将 IP 绑定为仅本机访问的 `127.0.0.1`；`replication` 段用于设置主从复制，明确了从服务器如何同步数据；`logger` 段管理日志级别、输出文件以及支持的大小轮转策略。最值得关注的是 `leveldb` 段的配置。文章特别指出，`cache_size` 参数直接影响性能——适当增大缓存能提升读性能，但过大的缓存反而会拖慢写速度。这种基于实际使用场景的调优建议，对管理员来说非常实用。总的来说，这篇文章将看似枯燥的配置文件讲解得清晰明了，不仅解释了“是什么”，还点出了“为什么”和“怎么调”，无论是初次接触 SSDB 的开发者，还是需要优化部署的运维人员，都能从中快速找到自己需要的配置要点。

本机暂存

IT 2013-08-15 13:40:09 / 累计浏览 4,276

基于Solr的空间搜索(3)

这篇讲的是如何在Solr中实现高性能的地理位置搜索。作者从纯使用GeoHash过滤效率不高的问题出发，介绍了一种结合**笛卡尔层（Cartesian Tiers）与GeoHash**的组合方案。核心思路是分两步走：在构建索引时，同时为每条记录计算其所属的不同精度层级的网格ID（tierBoxId）。查询时，先用笛卡尔层根据查询范围快速定位一个大致的网格集合，将这些网格下的文档ID存入一个BitSet，完成初步粗筛。随后，再将这个BitSet作为输入，传递给GeoHash距离过滤器。该过滤器遍历粗筛后的文档，通过GeoHash解码出精确经纬度，计算其与查询点的实际球面距离，并过滤掉超出范围的结果。实现上的一个巧妙之处在于利用了Lucene的FieldCache来缓存GeoHash值，并通过过滤链（Filter Chain）将两层过滤逻辑无缝衔接。作者还展示了一个本地查询实例，验证了这套方案在查询指定经纬度500公里内数据时的有效性。整体来看，这种“粗筛+精算”的两级过滤模式，显著减少了需要进行精确距离计算的文档数量，从而提升了查询性能。

本机暂存