IT技术博客大学习 共学习 共进步
全部 移动开发 后端 数据库 AI 算法 安全 DevOps 前端 设计 开发者

标签:Cluster Management

共 2 篇相关文章

IT 累计浏览 5,902

解析Google集群资源管理系统Omega

这篇文章梳理了 Google 内部三代集群资源调度系统的演进,清晰地勾勒出从单体到分布式、从集中控制到共享状态的设计变迁。 文章首先回顾了早期“中央式调度器”的局限,即所有调度逻辑和资源管理都耦合在一个进程中,导致扩展性和新策略集成困难。为解决这一问题,以 Mesos 和 YARN 为代表的“双层调度器”被提出,它将调度策略下放到各个应用框架,中央调度器只负责资源推送。但这又带来了两个核心痛点:应用框架无法获知全局资源视图,从而无法做出更优决策;以及因为使用全局锁(悲观锁),并发调度效率受限。 为突破这两个瓶颈,Google 推出了 Omega 系统。它的核心创新是“共享状态调度器”:将全局资源状态作为共享数据,并采用数据库领域的“多版本并发控制”(乐观锁)来处理并发访问。这使得应用框架能主动查看全局状态并竞争资源,极大提升了调度灵活性和并发度。文章还具体对比了 Mesos 的“全有或全无”与 YARN 的“增量分配”两种资源授予模式在不同场景下的利弊。 最后,作者点明了一个对业界极具参考价值的观点:由于 Omega 与 Mesos/YARN 的主要差异集中在资源管理模块,因此可以通过改造开源系统的“Resource Master”部分来快速构建类似 Omega 的调度器,这对人力有限的公司来说是一条务实的技术路径。

IT 累计浏览 2,978

oracle RAC DRM基本概念

这篇讲的是 Oracle RAC 环境下,保证多实例高效协作与数据一致性的关键机制——DRM(Distributed Resource Management)。 作者从 RAC 架构的核心特点切入:每个数据库实例都维护着自己独立的数据缓存池。当某个实例修改了一个数据块时,如何确保其他实例能看到最新数据,同时又不因频繁的同步而拖垮性能?这便是 DRM 需要解决的“既要又要”难题。 DRM 的核心思路是智能协调资源。它负责在实例间动态迁移和同步数据块的“主”副本所有权,确保被频繁访问的数据块能靠近请求它的实例,减少跨实例的缓存传输延迟。这个协调过程是自动且持续的,在后台为数据的一致性与访问性能寻找最佳平衡点。 理解 DRM,就理解了 RAC 如何让多个数据库实例像一个整体一样协同工作。它不是简单的锁机制,而是一套复杂的资源调度与缓存融合策略,是 Oracle 集群技术实现高可用和可扩展性能的基石之一。