IT技术博客大学习 共学习 共进步
全部 移动开发 后端 数据库 AI 算法 安全 DevOps 前端 设计 开发者

标签:ASM

共 10 篇相关文章

IT 累计浏览 61

oracleasm createdisk破坏的acfs文件系统恢复

该案例涉及Oracle 12.2.0.1环境中,因误执行oracleasm createdisk命令导致ASM磁盘头被重置,进而使ASM磁盘组无法挂载,依赖ACFS的MySQL数据库服务中断。恢复过程首先使用kfed工具读取磁盘头信息,发现asmlib标记ORCLDISKDATA3,确认磁盘头破坏但未重建新磁盘组。通过分析alert日志,确认磁盘组配置为AU size 4M,并利用winhex验证了磁盘头备份和AU备份仍完好。直接还原AU备份后,CRS启动失败,进一步分析发现CRS磁盘的分区偏移量错误,源于磁盘分区问题。修复分区表后,重启CRS,所有服务自动恢复,数据零丢失。案例展示了在ASM环境中诊断磁盘头破坏、利用备份恢复以及处理分区错误的完整流程,强调了谨慎操作和备份验证的重要性。

IT 累计浏览 62

asm dd 10M导致system文件部分坏块修复

本文记录了Oracle数据库ASM磁盘头损坏的修复案例。客户因误用dd命令覆盖磁盘前10M数据,破坏了ASM元数据,导致DATA磁盘组无法挂载并报ORA-15042错误。通过19c版本的备份AU还原,磁盘组成功挂载,但ASM持续报ORA-15196块头校验错误,指示磁盘14存在损坏块。客户尝试添加磁盘触发Rebalance操作,但错误阻止了Rebalance执行,避免了磁盘组卸载。随后启动数据库时,system文件出现多个完全为零的坏块,涉及I_OBJ2索引和DEPENDENCY$表,报ORA-01578错误,导致启动失败。该案例展示了ASM存储故障的连锁反应,从磁盘头损坏到数据库文件损坏,突出了操作谨慎性和备份的重要性,并体现了Oracle 19c在错误处理上的改进。

IT 累计浏览 2,395

ASM HEADER 备份与恢复

这篇文章关注的是ASM(自动存储管理)中一个容易被忽视却可能导致严重故障的环节:ASM HEADER的备份与恢复。作者从实际遇到的几次生产环境故障切入——ASM HEADER损坏导致DATA GROUP无法正常MOUNT,进而使数据库停服,带来了巨大的排查和恢复成本。问题根源往往在于缺乏有效的HEADER备份预案。 文章的核心内容在于提供了两种经过验证的备份与恢复方案。作者通过实验详细演示了如何使用操作系统底层的`dd`工具,以及Oracle专为ASM设计的`kfed`工具,来分别完成ASM HEADER的备份与恢复操作。这两种方法各有特点,`dd`更直接通用,而`kfed`则更为专用和安全。 对于使用ASM作为存储架构的DBA和运维人员来说,这是一次重要的经验提醒。ASM HEADER如同数据分区的“身份证”,其损坏虽然不常见,但一旦发生就是灾难性的。文章敦促读者立即检查自己环境的ASM HEADER是否已妥善备份,避免“事后后悔”。掌握文中介绍的这两项技能,相当于为关键数据库存储增添了一份关键的保险。

IT 累计浏览 2,399

ASM的优点总结–关于日志文件调整

这篇讲的是ASM(Automatic Storage Management)在数据库日志文件调整中的实用优点。当数据库出现日志切换频繁、事务等待LGWR写入或归档延迟等问题时,调整日志组成为维护性能的关键。作者从这些日常挑战出发,展示了ASM如何通过规范日志成员命名和日志组编号,让管理变得简单直观。 文章结合具体场景,比如通过SQL查询v$logfile和v$log视图来监控日志状态(如出现STALE或CURRENT状态),并演示了使用alter database add logfile命令添加新日志组的操作。这些细节体现了ASM在自动化存储管理中的便利性,使得管理员能快速响应日志问题,避免系统阻塞。 总的来说,ASM不仅简化了日志文件的维护流程,还通过标准化命名和集中管理,提升了数据库的稳定性和可维护性。对于DBA来说,这是一种高效应对存储挑战的方法。

IT 累计浏览 2,897

用ASM和iSCSI实现的另类HA方案

这篇讲的是如何用常见组件拼出一套低成本HA方案。作者从一个现实痛点出发:普通PC没有共享存储,又不想用Dataguard(因其存在数据丢失风险且难以实现透明切换),该怎么办? 他提出的方案核心是用iSCSI将本地磁盘共享出去,再借助Oracle ASM的failgroup功能做数据镜像,确保数据在两台机器上各有一份。同时配合Heartbeat进行故障探测,一旦主节点宕机,就在备机上拉起数据库和ASM服务。对于11g R2及以上版本,ASM的Preferred mirror read特性还能保证主库优先读本地盘,避免性能损失。 文章坦诚分析了方案的局限:Heartbeat存在误判或无法切换的可能,但这几乎是所有HA软件的通病,包括IBM HACMP。作者更强调,完善的监控和应急措施比追求完美的切换机制更实际——比如他们通过定时模拟应用来检测数据库是否hang住。 最后,作者也提醒,在11g R2之前,由于Voting Disk和OCR必须放在裸设备上,搭建RAC集群时可能会因投票盘丢失导致集群误判。而11g R2将几乎所有组件都移入ASM后,这个方案才变得真正可行。这算是一个经过验证、适合特定场景的务实选择。

IT 累计浏览 3,236

ASM的争论

这篇文章记录了部门内部一次关于ASM的技术激烈争论。讨论的焦点虽然表面上是技术方案的选择,但核心在于几位技术达人对同一底层原理(如内存管理、对象回收策略或性能权衡)的理解深度其实是相通的,只是在概念命名、实现细节的表达或类比举例上出现了偏差,导致讨论一度白热化。 它揭示了一个有趣的现象:技术团队在进行方案评审或架构讨论时,很多时候争论的并非本质分歧,而是“语义鸿沟”。每个人的知识背景和思考路径不同,对同一技术点的表述框架自然会有差异。这篇复盘恰恰捕捉到了这种因“表达”而非“实质”引发的认知摩擦。 对读者而言,这或许是一个提醒:下次技术讨论陷入胶着时,不妨先暂停方案层面的辩论,退一步厘清彼此对核心概念的定义是否对齐。建立共同的沟通语境,往往比急于说服对方更能高效地达成技术共识。

IT 累计浏览 3,424

ASM中如何配置多个控制文件

这篇讲的是,在使用了ASM自动存储管理的Oracle数据库环境中,如何避免因默认只创建一个控制文件而带来的潜在风险。对于使用ASM存储的数据库,如果初始仅创建了一个ASM磁盘组,控制文件会默认只有一个副本,这违背了多副本冗余保障数据库安全的最佳实践。 作者从这一常见配置问题出发,指出了其中的安全隐患。文章的核心在于提供一套具体的配置方法,指导读者如何在ASM磁盘组中,将控制文件配置为多个独立的物理副本。这涉及到对ASM存储特性的理解和相应的管理操作。 通过遵循文中所述的操作步骤,管理员能够轻松地在ASM环境下为控制文件建立多重保护。这确保了即使某个控制文件所在的磁盘组或文件发生损坏,数据库依然能够依靠其他副本保持稳定运行,有效提升了系统的可用性与容灾能力。

IT 累计浏览 4,882

ASM使用AIX raw disk的问题

这篇讲的是在AIX环境下使用ASM时一个容易被忽略的致命陷阱。不少管理员为了追求性能,会选择绕过逻辑卷管理器,直接将裸盘设备分配给ASM使用。然而,这种配置在特定条件下会引发严重故障。 问题根因在于,当存储侧发生变更(例如更换了HBA卡或存储阵列进行了微码升级),导致设备的物理卷标识符(PVID)发生变化后,ASM磁盘组会突然无法识别这些“换了身份证”的磁盘,从而可能造成磁盘组数据丢失。Oracle文档明确指出,ASM在AIX上是通过设备PVID来生成内部磁盘名称的,PVID变动直接破坏了ASM的标识机制。 因此,对于生产环境,强烈建议遵循官方最佳实践:要么使用逻辑卷(LV)作为ASM的存储单元,要么在必须使用裸盘时,确保底层设备的PVID在任何情况下都保持绝对稳定。搞清楚这个机制,才能避免线上环境出现无法挽回的数据灾难。

IT 累计浏览 2,765

oracle asm lib中使用multipath的陷井

这篇讲的是一个在Oracle数据库存储配置中容易被忽视的典型问题。作者在例行检查中发现,一个本应通过PowerPath实现多路径高可用的ASM库,实际上并未走多路径通道,这意味着数据链路存在单点故障风险。 深入排查后,问题的根源在于系统层面的multipath配置与Oracle ASM的识别机制出现了不匹配。具体来说,即便PowerPath或多路径驱动已正确安装,但如果ASM在启动时未能正确关联到多路径设备名(例如,未能识别/dev/mapper/mpathx这样的设备),它可能会直接使用底层的单个路径盘(如/dev/sdc),从而绕过冗余设计。这通常涉及udev规则、multipath.conf配置文件以及ASM的ASM_DISKSTRING初始化参数是否协同正确。 文章的价值在于点明了一个运维中的关键检查点:配置完成后,务必验证ASM磁盘组中的磁盘路径是否确为多路径设备。作者通过这个实际案例提醒我们,存储层面的高可用设计,需要与数据库存储软件的识别逻辑紧密配合,否则冗余配置可能形同虚设。

IT 累计浏览 3,313

ASM的争论

这是一篇事件复盘/观点类的技术讨论记录。文章还原了作者所在团队围绕ASM(可能指应用安全管理或特定技术模块)展开的一场内部技术辩论。争论的焦点并非宏大的方向之争,而是集中在几位技术骨干对ASM具体实现细节与应用边界的不同理解上,例如其在性能与安全之间的权衡、模块的适用场景等。观点本质上大同小异,但源于各自的经验和视角,在表述和侧重上产生了微妙的差异,进而引发了激烈讨论。 这类内部争论的价值,恰恰在于它揭示了技术方案从理论到实践时必然面临的复杂性——即使是对同一技术,不同工程师基于不同的约束条件(如项目性能要求、维护成本、团队技能栈)也会形成各有所长的解读。文章没有给出一个非黑即白的结论,而是展现了技术决策过程中真实存在的灰度。它提醒我们,在评估一项技术时,理解争论背后的语境和约束条件,往往比争论结果本身更重要。对于读者而言,这或许是一个重新审视自身团队中类似技术讨论的契机。