IT技术博客大学习 共学习 共进步
全部 移动开发 后端 数据库 AI 算法 安全 DevOps 前端 设计 开发者

标签:YARN

共 3 篇相关文章

IT 累计浏览 3,506

YARN ResourceManager调度器的分析

这篇深度剖析了YARN ResourceManager中三种核心调度器:FifoScheduler、CapacityScheduler与FairScheduler的设计逻辑与差异。文章从ResourceManager作为资源调度中心的架构出发,详细拆解了调度器的事件处理机制与异步分配模型——即调度器如何通过响应节点心跳、应用提交等六类事件,在内存中维护队列、应用与Container的关系,并最终完成资源匹配。 文章的核心价值在于清晰的对比分析。FifoScheduler结构最简单,适合小规模场景;CapacityScheduler通过树状队列与容量限制,旨在最大化集群整体吞吐与利用率;而FairScheduler则侧重于多用户间的资源公平共享,支持动态队列创建与资源抢占。除了基础模型,作者还深入解读了本地优化与延迟调度机制:调度器会优先匹配与数据本地性一致的Container,若不匹配则“延迟”等待机会,以此平衡网络开销与调度效率。 文末提供了与调度器紧密相关的集群参数配置解读,帮助读者将理论理解落地。对于需要根据实际业务需求(如多租户隔离、公平性或高吞吐)选型与调优YARN调度器的工程师而言,这是一篇逻辑清晰、细节扎实的参考。

IT 累计浏览 2,789

集群资源调度系统简介与galaxy资源调度系统简介

这篇讲的是集群资源调度系统,它为什么重要,以及内部的一个具体实践。 随着公司集群规模扩大,资源利用率低和部署运维复杂成了迫切需要解决的问题。文章从IaaS的角度切入,指出资源调度系统的核心价值在于实现资源共享、弹性管理与自动化运维。作者从谷歌Omega论文出发,梳理了三代调度架构的演进:从结构简单但扩展性差的中央式调度器,到支持大规模集群和多框架混部的双层调度器(以Mesos为代表),再到通过全局共享状态和乐观锁提升并发性能的第三代架构。文中以Mesos的“Resource Offer”机制为例,清晰展示了资源如何分配给具体应用。 文章后半部分将视角转向内部实践。为了支撑“万”级别流计算任务并解决现有引擎在大集群、多租户下的瓶颈,galaxy平台设计了一套轻量级的双层调度系统,目标是实现多集群间的资源共享与任务隔离。这篇不仅梳理了技术脉络,也展示了如何从通用架构中汲取灵感,解决实际业务中的资源调度挑战。

IT 累计浏览 4,740

Hadoop超级安装手册

这篇指南源于团队在实践中观察到新手安装Hadoop时频繁遇到的障碍,因此整理出这份覆盖从零到集群的“傻瓜版”手册。 文章首先明确了Hadoop运行的前置条件,即确保SSH/SSHD服务正常与JDK安装到位。随后进入核心安装流程:从下载解压源码开始,逐步详解如何配置环境变量(如JAVA_HOME),并重点剖析了`core-site.xml`、`hdfs-site.xml`和`mapred-site.xml`三个关键配置文件的参数设置,例如文件系统地址与副本数。 对于单节点部署,指南涵盖了SSH免密配置、格式化NameNode、启动与验证的全过程,并提供了具体的Web UI检查地址。进阶部分则扩展至多节点集群搭建,详细说明了跨主机SSH密钥分发、Masters/Slaves文件配置以及最终如何将配置同步至所有节点。 整篇内容条理清晰,将复杂的安装过程拆解为可逐步执行的命令与配置,特别适合需要快速搭建起Hadoop环境进行实践的初学者。