标签：kernel tuning

共 5 篇相关文章

IT 累计浏览 2,461

大量小包的CPU密集型系统调优案例一则

这是一篇典型的方案/架构类文章，作者从一个处理大量小数据包的生产系统调优实践出发，详细分享了将单网卡流量从100M提升至230M（预估可达480M）且CPU负载保持均衡的完整优化路径。核心方案围绕着“硬件选型与内核调优”展开。作者首先强调了必须使用支持MSI-X和多队列的网卡，这是性能提升的硬件基础。在软件层面，他将操作系统从RHEL 5升级至RHEL 6.1，以利用其内核对Google RPS/RFS补丁的支持，从而将软中断负载均衡到多个CPU核心。此外，文章还详细说明了如何手动关闭irqbalance服务，并通过设置smp_affinity将网卡队列中断精确绑定到指定CPU，以实现更精细的负载控制。对于发送方向，作者也提到了利用内核2.6.38引入的XPS特性进行优化。整个调优过程有很强的数据支撑，作者展示了调优后单网卡承载15万/秒数据包、系统负载为0且各CPU核心均保有余量的生产环境截图，并解释了因网卡队列数与CPU数不匹配时，为何不能简单将中断广播到所有CPU，而需要采用物理/固定模式进行一对一绑定。文章为类似网游、CDN等“小包量大”的场景提供了一套可落地的系统性能挖掘手册。

IT 累计浏览 4,064

Intel 10-GbE 网卡性能优化[翻译]

这篇翻译文档详细拆解了如何将一块 10GbE 网卡的性能从默认的“可用”状态压榨到“极限”。作者指出，Linux 的默认网络栈配置（如缓冲区大小、TCP 内存分配）是为了可靠性而非峰值吞吐量设计的，这对万兆网卡尤其不利。文章的核心思路是分层优化，并基于 Intel 官方驱动文档提供了实操步骤。优先级最高的操作是在交换机和服务器两端启用巨型帧（MTU 9000），这能大幅提升大流量传输效率。其次是调整内核的 `sysctl` 参数，例如关闭 SACK 和时间戳、将 TCP 收发缓冲区统一设为 10MB，并提高网络设备积压队列上限。更进阶的操作是通过 `setpci` 命令调整网卡 PCI-X 总线的 MMRBC 寄存器，将内存读块大小提升到 4KB，以增强对突发流量的处理能力。文章最有说服力的部分在于其测试数据：经过上述优化，使用 `iperf` 测试的吞吐量从优化前的约 4.70 Gbits/sec 飙升至 9.90 Gbits/sec，几乎跑满了万兆带宽。作者强调，优化过程需配合压力测试（如 iperf、netperf）来验证效果，结果可能因硬件和网络环境而异。对于需要榨干网卡性能的 HDFS、高性能计算等场景，这套调优方法提供了清晰的参考路径。

IT 累计浏览 3,620

Linux kernel 性能压力下的优化实践(V0.1)

这篇讲的是Linux内核在高压场景下，如何通过一系列调优来提升性能。作者从一次线上服务的CPU使用率波动事件切入，发现常规的监控工具难以准确定位瓶颈。随后，文章详细拆解了针对进程调度（CFS）、内存回收（kswapd）以及网络协议栈（TCP）的几项关键调整，例如通过修改sysctl参数来减少锁竞争、调整内核预读窗口优化磁盘I/O，并给出了优化前后的部分数据对比。有趣的是，作者在文末坦率地附上了发布后收到的微博质疑链接。这场讨论的核心在于，部分优化参数的修改是否具有普适性，以及在生产环境中直接应用的潜在风险。文章与其说是一份“标准答案”，不如说是一次公开的实践复盘，它展现了理论调优与现实生产环境复杂性的碰撞。对于读者而言，这篇文章的价值不仅在于提供了几条具体的排查思路和可试的调优选项，更在于它示范了如何面对技术方案的争议——将结论交由社区审视，在讨论中修正认知，这本身也是技术迭代的一部分。

IT 累计浏览 2,460

FreeBSD系统优化部分内核参数调优中文注释

这篇讲的是FreeBSD系统内核参数调优中的一个具体细节：通过调整TCP缓冲区空间来提升网络性能。文章聚焦于net.inet.tcp.recvspace这一参数，解释了它的作用是设置系统接受TCP数据的最大缓冲区大小，并给出了从默认值调整到65536字节（64KB）的配置示例。作者没有停留在简单的参数罗列，而是从系统优化的背景出发，点明了调整该参数的实际意义：在高并发或大流量网络场景下，更大的接收缓冲区能有效减少数据丢包和延迟，从而提升整体网络吞吐能力。这种调整特别适合那些需要处理大量并发连接或进行大数据传输的FreeBSD服务器环境。文章用清晰的中文注释让原本枯燥的内核参数变得易于理解，对于需要动手优化系统性能的运维人员或开发者来说，提供了直接可参考的配置思路。它展示了从默认配置到性能调优之间，一个关键参数的细微改动所带来的实际影响。

IT 累计浏览 2,870

Linux系统优化部分内核参数调优中文注释

这份调优清单聚焦于高并发应用服务器的网络性能瓶颈，系统地给出了数十个关键内核参数的优化方案。作者的核心思路是围绕TCP连接的快速回收、缓冲区扩容以及并发处理能力进行针对性调整。例如，将`tcp_tw_reuse`和`tcp_tw_recycle`设为1，是为了更高效地重用处于TIME_WAIT状态的连接；显著增大`netdev_max_backlog`和`tcp_max_syn_backlog`，则直接提升了内核处理突发网络流量的能力。文章不仅列出了优化后的推荐值，还标注了默认值和参数含义，这使得调整的意图一目了然。比如，将`tcp_keepalive_time`从默认的7200秒缩短至1800秒，能更快地探测并释放无效连接。而将套接字缓冲区`rmem_max`和`wmem_max`提升至16MB级别，则是为了支撑大数据量的吞吐。最后，作者还提供了关于连接跟踪表项和防止“邻居表溢出”的注释方案，覆盖了从连接建立到内核资源回收的多个层面。对于需要承载大量并发连接的Web或API服务来说，这份经过验证的中文注释版参数清单，提供了一个非常实用的调优起点。