标签：cgroup

共 3 篇相关文章

IT 累计浏览 3,928

ulimit -t 引起的kill血案

这篇讲的是一个由系统资源限制 `ulimit -t` 引发的生产事故。作者从一次线上服务进程被莫名“kill”的异常现象出发，逐步抽丝剥茧。他们发现，罪魁祸首是在启动脚本中被悄悄设置的 `ulimit -t`（限制进程的CPU时间）。一旦进程累积的CPU时间超过该阈值，系统就会毫不留情地将其终止。文章详细复盘了整个排查过程：如何从监控指标中的“被信号终止”线索，追溯到用户进程的资源限制配置，最终定位到这个看似无害却容易被忽略的参数。关键在于，许多开发者并不清楚 `-t` 的具体语义，且它在多数现代发行版中默认值极高，一旦被显式设置一个较小的值（比如300秒），对于计算密集型任务就可能成为致命陷阱。作者的结论很明确：在容器化和云原生环境中，CPU资源应通过 cgroup 或 Kubernetes 的资源配额来精细管理，而不是依赖这种传统的、作用域模糊的 shell 级限制。这篇文章提醒我们，在优化服务时，那些隐藏在启动脚本深处的 legacy 配置，可能正埋着下一次“血案”的种子。

IT 累计浏览 3,968

Linux的IO调度器-CFQ

作者从控制IO带宽的实际需求出发，发现关于Linux IO调度器CFQ的中文资料相当稀缺，于是决定亲自撰写一个系列文章，填补这一空白。这篇系列开篇将首先厘清CFQ的基本概念——它作为Linux内核的一种IO调度策略，主要通过为每个进程分配时间片和队列来公平地调度磁盘读写请求，尤其适合多任务桌面环境。作者预告，后续文章将深入解析CFQ的各项可调参数及其对性能的影响，剖析其内部架构设计，并探讨如何与cgroup子系统结合以实现更精细的IO资源控制。整个系列旨在为需要进行IO性能调优的工程师提供一份清晰实用的中文指南。

IT 累计浏览 3,149

fio配合cgroup测试存储设备IOPS分配

这篇讲的是在多服务共享的高性能存储服务器上，如何用测试工具为每个服务“划分”出公平的IOPS资源配额。作者从当下一个普遍现象出发：随着PCIe等高速存储设备普及，单台服务器的IOPS能力动辄十几万，远超单个应用所需。这虽然提升了资源利用率，却也带来了新问题——当多个服务共存时，如何避免某个“贪心”的应用占满存储带宽，从而保障其他服务的性能稳定？为了解决这个服务质量（QoS）问题，文章给出了一套实测方案。核心是利用fio模拟应用的存储负载，并结合Linux内核的cgroup机制进行资源控制。作者具体演示了如何配置cgroup规则来限制特定进程组的IOPS上限，并用fio在这些受限的cgroup中运行测试，验证流量是否被有效隔离。通过这种“主动施压+精确限制”的组合测试，我们可以在服务上线前，就直观地量化和规划出每个业务能获得的存储资源份额，为构建稳定、可预期的多服务环境打下基础。