标签：ASM

共 10 篇相关文章

IT 累计浏览 61

oracleasm createdisk破坏的acfs文件系统恢复

该案例涉及Oracle 12.2.0.1环境中，因误执行oracleasm createdisk命令导致ASM磁盘头被重置，进而使ASM磁盘组无法挂载，依赖ACFS的MySQL数据库服务中断。恢复过程首先使用kfed工具读取磁盘头信息，发现asmlib标记ORCLDISKDATA3，确认磁盘头破坏但未重建新磁盘组。通过分析alert日志，确认磁盘组配置为AU size 4M，并利用winhex验证了磁盘头备份和AU备份仍完好。直接还原AU备份后，CRS启动失败，进一步分析发现CRS磁盘的分区偏移量错误，源于磁盘分区问题。修复分区表后，重启CRS，所有服务自动恢复，数据零丢失。案例展示了在ASM环境中诊断磁盘头破坏、利用备份恢复以及处理分区错误的完整流程，强调了谨慎操作和备份验证的重要性。

IT 累计浏览 62

asm dd 10M导致system文件部分坏块修复

本文记录了Oracle数据库ASM磁盘头损坏的修复案例。客户因误用dd命令覆盖磁盘前10M数据，破坏了ASM元数据，导致DATA磁盘组无法挂载并报ORA-15042错误。通过19c版本的备份AU还原，磁盘组成功挂载，但ASM持续报ORA-15196块头校验错误，指示磁盘14存在损坏块。客户尝试添加磁盘触发Rebalance操作，但错误阻止了Rebalance执行，避免了磁盘组卸载。随后启动数据库时，system文件出现多个完全为零的坏块，涉及I_OBJ2索引和DEPENDENCY$表，报ORA-01578错误，导致启动失败。该案例展示了ASM存储故障的连锁反应，从磁盘头损坏到数据库文件损坏，突出了操作谨慎性和备份的重要性，并体现了Oracle 19c在错误处理上的改进。

IT 累计浏览 2,395

ASM HEADER 备份与恢复

这篇文章关注的是ASM（自动存储管理）中一个容易被忽视却可能导致严重故障的环节：ASM HEADER的备份与恢复。作者从实际遇到的几次生产环境故障切入——ASM HEADER损坏导致DATA GROUP无法正常MOUNT，进而使数据库停服，带来了巨大的排查和恢复成本。问题根源往往在于缺乏有效的HEADER备份预案。文章的核心内容在于提供了两种经过验证的备份与恢复方案。作者通过实验详细演示了如何使用操作系统底层的`dd`工具，以及Oracle专为ASM设计的`kfed`工具，来分别完成ASM HEADER的备份与恢复操作。这两种方法各有特点，`dd`更直接通用，而`kfed`则更为专用和安全。对于使用ASM作为存储架构的DBA和运维人员来说，这是一次重要的经验提醒。ASM HEADER如同数据分区的“身份证”，其损坏虽然不常见，但一旦发生就是灾难性的。文章敦促读者立即检查自己环境的ASM HEADER是否已妥善备份，避免“事后后悔”。掌握文中介绍的这两项技能，相当于为关键数据库存储增添了一份关键的保险。

IT 累计浏览 2,399

ASM的优点总结–关于日志文件调整

这篇讲的是ASM（Automatic Storage Management）在数据库日志文件调整中的实用优点。当数据库出现日志切换频繁、事务等待LGWR写入或归档延迟等问题时，调整日志组成为维护性能的关键。作者从这些日常挑战出发，展示了ASM如何通过规范日志成员命名和日志组编号，让管理变得简单直观。文章结合具体场景，比如通过SQL查询v$logfile和v$log视图来监控日志状态（如出现STALE或CURRENT状态），并演示了使用alter database add logfile命令添加新日志组的操作。这些细节体现了ASM在自动化存储管理中的便利性，使得管理员能快速响应日志问题，避免系统阻塞。总的来说，ASM不仅简化了日志文件的维护流程，还通过标准化命名和集中管理，提升了数据库的稳定性和可维护性。对于DBA来说，这是一种高效应对存储挑战的方法。

IT 累计浏览 2,897

用ASM和iSCSI实现的另类HA方案

这篇讲的是如何用常见组件拼出一套低成本HA方案。作者从一个现实痛点出发：普通PC没有共享存储，又不想用Dataguard（因其存在数据丢失风险且难以实现透明切换），该怎么办？他提出的方案核心是用iSCSI将本地磁盘共享出去，再借助Oracle ASM的failgroup功能做数据镜像，确保数据在两台机器上各有一份。同时配合Heartbeat进行故障探测，一旦主节点宕机，就在备机上拉起数据库和ASM服务。对于11g R2及以上版本，ASM的Preferred mirror read特性还能保证主库优先读本地盘，避免性能损失。文章坦诚分析了方案的局限：Heartbeat存在误判或无法切换的可能，但这几乎是所有HA软件的通病，包括IBM HACMP。作者更强调，完善的监控和应急措施比追求完美的切换机制更实际——比如他们通过定时模拟应用来检测数据库是否hang住。最后，作者也提醒，在11g R2之前，由于Voting Disk和OCR必须放在裸设备上，搭建RAC集群时可能会因投票盘丢失导致集群误判。而11g R2将几乎所有组件都移入ASM后，这个方案才变得真正可行。这算是一个经过验证、适合特定场景的务实选择。

IT 累计浏览 3,236

ASM的争论

这篇文章记录了部门内部一次关于ASM的技术激烈争论。讨论的焦点虽然表面上是技术方案的选择，但核心在于几位技术达人对同一底层原理（如内存管理、对象回收策略或性能权衡）的理解深度其实是相通的，只是在概念命名、实现细节的表达或类比举例上出现了偏差，导致讨论一度白热化。它揭示了一个有趣的现象：技术团队在进行方案评审或架构讨论时，很多时候争论的并非本质分歧，而是“语义鸿沟”。每个人的知识背景和思考路径不同，对同一技术点的表述框架自然会有差异。这篇复盘恰恰捕捉到了这种因“表达”而非“实质”引发的认知摩擦。对读者而言，这或许是一个提醒：下次技术讨论陷入胶着时，不妨先暂停方案层面的辩论，退一步厘清彼此对核心概念的定义是否对齐。建立共同的沟通语境，往往比急于说服对方更能高效地达成技术共识。

IT 累计浏览 3,424

ASM中如何配置多个控制文件

这篇讲的是，在使用了ASM自动存储管理的Oracle数据库环境中，如何避免因默认只创建一个控制文件而带来的潜在风险。对于使用ASM存储的数据库，如果初始仅创建了一个ASM磁盘组，控制文件会默认只有一个副本，这违背了多副本冗余保障数据库安全的最佳实践。作者从这一常见配置问题出发，指出了其中的安全隐患。文章的核心在于提供一套具体的配置方法，指导读者如何在ASM磁盘组中，将控制文件配置为多个独立的物理副本。这涉及到对ASM存储特性的理解和相应的管理操作。通过遵循文中所述的操作步骤，管理员能够轻松地在ASM环境下为控制文件建立多重保护。这确保了即使某个控制文件所在的磁盘组或文件发生损坏，数据库依然能够依靠其他副本保持稳定运行，有效提升了系统的可用性与容灾能力。

IT 累计浏览 4,882

ASM使用AIX raw disk的问题

这篇讲的是在AIX环境下使用ASM时一个容易被忽略的致命陷阱。不少管理员为了追求性能，会选择绕过逻辑卷管理器，直接将裸盘设备分配给ASM使用。然而，这种配置在特定条件下会引发严重故障。问题根因在于，当存储侧发生变更（例如更换了HBA卡或存储阵列进行了微码升级），导致设备的物理卷标识符（PVID）发生变化后，ASM磁盘组会突然无法识别这些“换了身份证”的磁盘，从而可能造成磁盘组数据丢失。Oracle文档明确指出，ASM在AIX上是通过设备PVID来生成内部磁盘名称的，PVID变动直接破坏了ASM的标识机制。因此，对于生产环境，强烈建议遵循官方最佳实践：要么使用逻辑卷（LV）作为ASM的存储单元，要么在必须使用裸盘时，确保底层设备的PVID在任何情况下都保持绝对稳定。搞清楚这个机制，才能避免线上环境出现无法挽回的数据灾难。

IT 累计浏览 2,765

oracle asm lib中使用multipath的陷井

这篇讲的是一个在Oracle数据库存储配置中容易被忽视的典型问题。作者在例行检查中发现，一个本应通过PowerPath实现多路径高可用的ASM库，实际上并未走多路径通道，这意味着数据链路存在单点故障风险。深入排查后，问题的根源在于系统层面的multipath配置与Oracle ASM的识别机制出现了不匹配。具体来说，即便PowerPath或多路径驱动已正确安装，但如果ASM在启动时未能正确关联到多路径设备名（例如，未能识别/dev/mapper/mpathx这样的设备），它可能会直接使用底层的单个路径盘（如/dev/sdc），从而绕过冗余设计。这通常涉及udev规则、multipath.conf配置文件以及ASM的ASM_DISKSTRING初始化参数是否协同正确。文章的价值在于点明了一个运维中的关键检查点：配置完成后，务必验证ASM磁盘组中的磁盘路径是否确为多路径设备。作者通过这个实际案例提醒我们，存储层面的高可用设计，需要与数据库存储软件的识别逻辑紧密配合，否则冗余配置可能形同虚设。

IT 累计浏览 3,313

ASM的争论

这是一篇事件复盘/观点类的技术讨论记录。文章还原了作者所在团队围绕ASM（可能指应用安全管理或特定技术模块）展开的一场内部技术辩论。争论的焦点并非宏大的方向之争，而是集中在几位技术骨干对ASM具体实现细节与应用边界的不同理解上，例如其在性能与安全之间的权衡、模块的适用场景等。观点本质上大同小异，但源于各自的经验和视角，在表述和侧重上产生了微妙的差异，进而引发了激烈讨论。这类内部争论的价值，恰恰在于它揭示了技术方案从理论到实践时必然面临的复杂性——即使是对同一技术，不同工程师基于不同的约束条件（如项目性能要求、维护成本、团队技能栈）也会形成各有所长的解读。文章没有给出一个非黑即白的结论，而是展现了技术决策过程中真实存在的灰度。它提醒我们，在评估一项技术时，理解争论背后的语境和约束条件，往往比争论结果本身更重要。对于读者而言，这或许是一个重新审视自身团队中类似技术讨论的契机。