标签：性能调优

共 25 篇相关文章

IT 累计浏览 2,165

关于 Android 系统流畅性的一些思考

这篇讲的是 Android 流畅性问题的多维度分析。作者认为，用户常遇到的“卡顿”并非单纯是系统优化不足，而是硬件、系统、应用三者复杂交互的结果，需要跳出“甩锅系统”的简单思维。文章从硬件层面展开，详细对比了 CPU 性能、GPU 强弱、内存大小、存储规格（UFS/eMMC）乃至屏幕分辨率和电池容量对流畅体验的直接影响。例如，内存不足会导致系统频繁杀后台与数据交换，造成操作迟滞；而盲目使用 2K 屏也可能在性能不足时拖累流畅度。系统层面，作者深入剖析了国内厂商对应用管控、内存策略和进程调度的“魔改”逻辑，指出这主要是为了应对国内应用生态的混乱。同时，文章也提到了渲染线程、TripleBuffer 等底层机制如何共同作用，决定了一帧画面能否在 16 毫秒内完成渲染。整体而言，作者试图为读者建立一个更全面的分析框架：下次遇到手机卡顿时，除了抱怨系统，或许可以想想是某个后台应用在作祟，或是硬件本身已力不从心。这种多角度的审视，有助于更理性地定位问题根源。

IT 累计浏览 2,399

实例解析MySQL性能瓶颈排查定位

这是一篇典型的故障排查实战文章。作者从线上MySQL实例负载告警入手，完整记录了从操作系统层面到数据库内部的定位过程。通过`w`、`sar`、`top`、`iotop`等命令，一步步锁定了高负载源于某个MySQL实例严重的磁盘I/O等待。深入该实例后，发现瓶颈来自一条低效的SQL查询：它通过正序排序后取最大值，导致每次执行都需要全表扫描500多万行数据。作者将其优化为直接倒序排序取首条记录，将执行时间从上百秒降至毫秒级，性能提升显著。文章最后也总结了此类问题的常见成因，如大单次读写、缺少索引或突发流量等。对于需要处理数据库性能问题的开发者来说，这份从现象到根因的清晰排查路径很有参考价值。

IT 累计浏览 3,867

复杂关联SQL的优化

这篇讲的是如何将一个耗时 750ms 的复杂关联 SQL 优化到毫秒级的过程。作者从一个真实案例出发，通过分析执行计划，精准定位了性能瓶颈：一条只返回一行数据的查询，却因为驱动表选择不当和索引缺失，导致在两张表上发生了全表扫描。优化过程分为两步走。首先，针对 `left join` 的 d 表添加了缺失的 `yh_id` 索引，使其扫描行数从 5 万多行骤降至 272 行。但整体耗时并未改善，因为优化器仍坚持选择 a 表作为驱动表。作者进一步深入分析，发现根本原因在于关联字段 `yh_id` 在 b 表上没有索引，导致优化器认为以 a 表驱动的代价更低。于是，第二步是为 b 表和过滤性极强的 c 表分别添加了 `yh_id` 和 `yh_dm` 索引。索引齐全后，优化器终于“回心转意”，转而选择数据量更小、过滤条件更强的 c 表作为驱动表，执行计划彻底改变，查询时间从 0.75 秒直接降为 0.00 秒。这个案例清晰地展示了，优化复杂 SQL 不能只看单表索引，更要理清表间关联逻辑与数据分布，通过分析执行计划来引导优化器做出正确选择。

IT 累计浏览 2,318

从未降级的搜索-主搜索分层优化

这篇讲的是淘宝主搜索如何通过索引分层技术，将集群架构从二维升级到三维，从而解决长期存在的性能与扩展性瓶颈。作者从主搜索沿用多年的二维架构出发，指出其存在机器消耗多、低质量商品拖累效率、索引结构单一且难以支持多样化排序等核心问题。文章提出的分层优化方案，核心思路是将商品按质量（Good/Bad）和特定排序需求（如人气）拆分成不同集群，并设计相应的检索策略。例如，对人气排序查询优先走仅包含头部商品的Excellent集群，而对一般查询则优先查Good集群，不足时再补充Bad集群。这种三维架构带来了显著收益：不仅将集群规模缩减了36%，整体检索性能提升了120%，最终还带动了6%的搜索GMV增长。文章用清晰的架构图和具体数据，展示了如何通过精巧的索引设计，在控制成本的同时满足多样化的排序需求，为主搜索的业务拓展提供了坚实的技术基础。

IT 累计浏览 11,082

浅谈TCP优化

这篇讲的是TCP性能优化背后的原理与可操作的调优方法。作者以《High Performance Browser Networking》一书为依托，将看似晦涩的流量控制、慢启动和拥塞避免机制，用通俗的比喻讲得清晰明白。例如，用“吃几碗饭”比喻接收窗口（rwnd）的限制，用拳击试探比喻拥塞窗口（cwnd）的增长。文章深入浅出地解释了网络吞吐量受限的核心逻辑：传输性能由rwnd和cwnd中较小的值决定。针对百兆网络却跑不满速的常见问题，作者给出了具体解决方案——根据带宽延迟乘积（BDP）来计算合理的rwnd大小，并介绍了Linux内核中的自动调优机制与关键参数。对于网页加载等短连接场景，文章通过生动的类比（博尔特百米起跑）和数据对比，揭示了cwnd初始值设置对效率的巨大影响，并引用了Google的研究结论，建议将其调整为10个MSS大小。从原理到实践，文章提供了一套可落地的优化思路。

IT 累计浏览 4,542

Shell的那些事儿

这篇讲的是 Shell 语言如何从大学里一个简单的工具，成长为作者工作中不可或缺的效率利器。作者从学生时代用 Shell 命令裁减文件系统、处理 BAT 脚本讲起，到工作后利用 `grep -Irl` 快速查找文本文件，或用 `find |xargs wc -l` 统计代码行数，生动展现了 Shell 在解决实际问题时“组合命令”的核心魅力。文章并未停留在基础用法，而是深入探讨了 Shell 的“工程化”一面。作者分享了在性能团队学到的实用技巧，比如用 `-x` 选项调试脚本执行过程、设置参数默认值以及实现进程并发控制。同时，也坦诚讨论了 Shell 语法的灵活性甚至“不严谨”之处，比如 `if` 语句的多种写法和对换行符的敏感，并澄清了如何正确处理分号与命令返回值 `$?` 的使用。作者的最终观点很明确：相对于 C/C++/Java 等编译型语言，Shell 作为一种“工具性语言”，以其无需编译、即写即测的特性，提供了无与伦比的开发效率。无论是压力测试还是复杂逻辑控制，它都是快速将想法落地的首选。文末那句“不熟悉 Shell 都不好意思说会性能调优”，既是对 Shell 地位的肯定，也点明了在追求效率的现代开发中，掌握这门语言的重要性。

IT 累计浏览 3,968

Linux的IO调度器-CFQ

作者从控制IO带宽的实际需求出发，发现关于Linux IO调度器CFQ的中文资料相当稀缺，于是决定亲自撰写一个系列文章，填补这一空白。这篇系列开篇将首先厘清CFQ的基本概念——它作为Linux内核的一种IO调度策略，主要通过为每个进程分配时间片和队列来公平地调度磁盘读写请求，尤其适合多任务桌面环境。作者预告，后续文章将深入解析CFQ的各项可调参数及其对性能的影响，剖析其内部架构设计，并探讨如何与cgroup子系统结合以实现更精细的IO资源控制。整个系列旨在为需要进行IO性能调优的工程师提供一份清晰实用的中文指南。

IT 累计浏览 5,393

MySQL使用为什么要分库分表

这篇讲的是当MySQL数据量增长到一定程度时，开发者几乎不可避免要面对的性能瓶颈，以及分库分表这一经典方案如何解决它。文章从一个很实际的痛点切入：当单表数据量巨大时，即便SQL本身写得再好，查询、更新和索引的效率都会急剧下降。作者没有停留在概念上，而是直指核心——这本质上是一个集中式存储无法横向扩展的难题。随之引出的分库分表，就不再是一个抽象概念，而是将数据分散到多个物理单元上的具体工程实践。文章很可能探讨了分库（垂直/水平拆分）与分表（水平/垂直拆分）的不同策略，并对比了它们各自适用的场景。比如，是按业务领域垂直分库，还是按某个ID哈希水平分表？选择不同，对应用层代码的改造、数据迁移和后续维护的影响也截然不同。文中或许还提及了分库分表后必然要面对的新挑战，如分布式事务、跨库查询和全局ID生成等问题，并给出了相应的应对思路。总的来说，它清晰地勾勒了从“单库单表扛不住”到“选择合适拆分策略落地”的完整逻辑链，对于正在经历数据量增长阵痛、需要进行架构设计的开发者来说，提供了一份清晰的决策参考和实施路线图。

IT 累计浏览 1,797

关于 innodb_stats_on_metadata 的设置问题

这篇讲的是 MySQL InnoDB 存储引擎中一个容易被忽略却影响重大的参数——`innodb_stats_on_metadata`。作者从实际运维场景出发，详细说明了开启该参数后，每次执行 `SHOW TABLE STATUS` 或访问 `INFORMATION_SCHEMA` 中的统计表时，InnoDB 都会重新计算索引统计信息。这一行为在频繁查询元数据的监控或管理场景下，可能导致大量的额外 I/O 和 CPU 开销，进而影响数据库性能。文章对比了该参数在 ON（默认）和 OFF 两种状态下的行为差异，并给出了明确的调优建议：对于绝大多数 OLTP 应用，建议将其设置为 OFF，以避免不必要的性能损耗。文中还结合了具体的测试数据，展示了关闭该参数后，在特定负载下系统响应时间的显著改善。最后，文章指出，即便关闭了自动更新，我们仍可通过手动执行 `ANALYZE TABLE` 来按需更新统计信息，从而在性能与统计准确性之间取得平衡。

IT 累计浏览 3,232

Solr调优参考

这篇Solr调优指南清晰地划分了两大应用场景：通用优化与特定环境下的精准调优。作者将实践经验归纳为三个层次，其中前两部分构成了核心——常规处理提供了普适性的性能提升框架，而针对性处理则强调了在特定业务模式与数据特征下进行参数微调的必要性。文章的价值在于它并非一份泛泛的参数清单。它直接点明，脱离具体应用特性的调优是低效的，真正的性能提升必须建立在“具体调节参数”并“对比性能”的闭环验证之上。第三部分虽未展开，但从结构上看，旨在引导读者从通用方法过渡到定制化策略。对于正在处理搜索性能瓶颈、或是计划重构Solr集群的工程师来说，这篇文章提供了一个从面到点的优化思路。它提醒我们，最佳实践永远是动态的，必须与自身的负载场景紧密结合，才能将调优的效果真正落地。

IT 累计浏览 3,835

redis内存容量的预估和优化

这篇讲的是Redis内存管理中一个很实际的问题：如何在数据写入前就预估并控制内存占用。作者从Redis全内存存储的特性出发，聚焦于最常用的string和zipmap（即压缩列表）两种数据结构，深入分析了它们在jemalloc内存分配器下的实际内存开销计算方法。文章没有泛泛而谈理论，而是提供了具体的计算公式和考量因素。例如，对于string类型，除了数据本身，还详细拆解了jemalloc的内存分配策略（如16字节的chunk和size class）如何影响最终占用；对于zipmap，则解析了其内部结构的字节级开销，让读者能像拼图一样算出真实内存。在此基础上，作者分享了针对性的优化技巧，比如控制键值长度、利用ziplist编码阈值等，都是能直接落地操作的建议。对于正在面对Redis内存压力或想精细化运维的工程师来说，这篇文章提供了一套从预估到优化的完整思路，帮助你在资源规划时做到心中有数，避免线上突发内存不足的窘境。

IT 累计浏览 3,196

如何查询运行在某个表上的所有SQL

这篇讲的是如何在Oracle数据库中，快速定位某张特定表最近被哪些SQL语句引用过。作者指出，要分析的“所有SQL”特指当前仍缓存在共享池视图v$sql中、尚未被自动清除的记录——这通常覆盖了近期频繁执行的热点SQL。核心方法是通过查询v$sql的执行计划相关视图（如v$sql_plan），筛选出目标对象（如表名）出现在操作列表中的SQL语句。文章会引导你如何构造查询条件，从庞大的SQL缓存中，精确提取出与你的业务表直接相关的执行记录。掌握了这个技巧，你能直接回答“谁在动这张表”这个关键问题。它在性能分析、影响评估和问题排查时特别有用，比如当某张核心表响应变慢时，你可以迅速找出所有可能加重其负担的SQL，为进一步的优化提供明确方向。

IT 累计浏览 5,120

Java 6 JVM参数选项大全（中文版）

这篇系统梳理了Java 6 JVM所有非稳态参数选项的实用指南。作者基于SUN官方文档进行翻译，并补充了大量背景资料与原理阐释，旨在帮助开发者深入理解每个参数的含义与适用场景。文章清晰区分了参数的使用语法（如-XX:+启用、-XX:-关闭），并详细列举了行为选项与性能选项。对于每个选项，不仅说明了默认值与平台限制，更通过关联知识点揭示了其底层逻辑。例如，在解释新生代收集担保（-XX:+HandlePromotionFailure）时，文章剖析了Minor GC的运作机制与担保策略的利弊；在介绍自旋锁优化（-XX:+UseSpinning）时，则联系了CAS与OS互斥锁的原理。这份文档覆盖了垃圾收集器选择（如CMS、Parallel GC）、内存管理、类加载校验、线程优化及特定平台（如Solaris）设置等多个关键调优维度。对于正在进行JVM性能优化或需要精确控制运行时行为的工程师而言，它将是一份内容扎实的中文参考手册。

IT 累计浏览 3,670

ulimit问题及其影响

这篇讲的是 `ulimit` 这个经典系统参数的设计初衷和现实影响。作者从早期计算机系统资源（如内存、CPU）极度有限的历史背景出发，解释了 `ulimit` 为何存在——它的核心目标是在资源稀缺时代，确保进程间能公平地共享资源，防止某个进程耗尽所有资源而拖垮整个系统。文章展示了一台典型 Linux 机器的默认 `ulimit` 配置。其中几个关键值值得注意：单个进程能打开的最大文件数 `open files (-n)` 仅为 1024，这对于现代高并发网络服务来说往往是一个瓶颈；而最大用户进程数 `max user processes (-u)` 通常设置得较高（如 204800）。这种差异反映了系统设计者对不同资源消耗模式的权衡。理解 `ulimit` 与现代资源管理机制（如 cgroups）的对比是关键。`ulimit` 是单进程维度的“软限制”和“硬限制”，更侧重于防止滥用；而 cgroups 则提供了对一组进程的精细化、系统级资源（CPU、内存、IO）管控，是容器化技术的基础。在需要为单个服务设置防火墙时（如限制单个 Java 应用的线程数或文件句柄），调整 `ulimit` 仍然直接有效。但在构建复杂服务架构或容器环境时，则必须依赖 cgroups 进行更全局的资源分配与隔离。因此，选择哪一种工具，完全取决于你要解决的是进程级的公平性问题，还是系统级的资源编排问题。

IT 累计浏览 3,747

HBase性能调优

这篇讲的是 HBase 性能调优中一个非常实际的问题：官方文档虽然全面，但按主题叙述的结构让人在排查性能瓶颈时难以快速定位到具体的配置项。作者由此出发，以“配置项”为索引，对官方文档中零散散布的调优参数进行了系统性的重新梳理和整合。文章不仅将分散的配置项集中呈现，方便读者按图索骥，还融入了作者在实际生产环境中的理解与补充。例如，它可能会详细解释 `hbase.hregion.memstore.flush.size` 或 `hbase.regionserver.handler.count` 这类关键参数背后的生效机制、默认值以及调整它们可能带来的连锁反应。这种以配置项驱动的重新组织，让原本线性的阅读变成了一个可快速查询的参考手册。对于 HBase 运维人员或开发工程师来说，这种结构在面对性能问题时尤为实用。你无需通篇翻阅文档，而是能直接根据疑似瓶颈的模块，找到所有相关的旋钮并进行针对性调整。作者在末尾也坦言了自己的整理可能存在的不足，这种开放讨论的态度也让这份整理更具参考价值。

IT 累计浏览 3,496

RAC环境下Memory System Deconfigured

这篇讲的是一个经典的“节点越多，跑得越慢”的反例。作者从一个真实的Oracle 9i RAC环境出发，记录了一次令人困惑的性能衰退：当一台故障主机维修完毕重新加入集群后，整个系统的性能不升反降，前端业务甚至比单节点运行时还要缓慢。文章的核心直指这种违背直觉的现象。它描述了具体环境（IBM小型机，Oracle 9.2.0.8）和性能恶化的确切表现——收费系统响应迟滞。虽然给出的信息片段没有直接点明最终的“病根”，但标题“Memory System Deconfigured”已经强烈暗示，问题与集群恢复后内存子系统的配置或状态有关。这很可能涉及RAC架构中一个关键但容易被忽视的环节：集群节点间的共享内存管理或SGA配置在故障切换与恢复过程中出现了不一致或未被正确重置。对于维护高可用数据库系统的工程师来说，这篇文章的价值在于它提供了一个完整的排查案例框架。它提醒我们，硬件或网络故障的恢复并不意味着一切自动回归正常，集群内部资源的重新协商与分配可能引入新的、更隐蔽的瓶颈。作者对故障前后对比的详细记录，为诊断类似“集群反而累赘”的问题提供了宝贵的参考路径。

IT 累计浏览 2,485

调查服务器响应时间的利器 tcprstat

在服务器性能优化中，准确测量请求响应时间是定位问题和提升效率的关键。作者从实际开发场景出发，指出了两种常见方法的局限性：传统代码日志计算时间忽略了数据在网卡与应用程序之间的传输耗时，导致结果不准确；而使用wireshark或tcpdump抓包虽能手动统计，但过程繁琐且难以持续，不适合频繁分析。针对这些痛点，文章聚焦于介绍一款名为tcprstat的工具，它被设计为最小化操作成本的解决方案。tcprstat通过直接监控TCP层响应时间，能够覆盖从网络入口到应用处理的全链路，避免了时间漏测的问题。作者强调，该工具以轻量化的方式自动化数据采集，显著降低了人工干预的需求，从而让性能调查变得更高效。通过对比传统手段，tcprstat在准确性和易用性上展现出明显优势，为开发者提供了一个实用利器。对于需要深入剖析服务器响应瓶颈的团队，这篇文章清晰地展示了如何利用这一工具简化工作流程，实现更可靠的时间测量。

IT 累计浏览 3,411

好软件推荐 gnuplot 来做可视化数据

作者在学习RHCA调优课程时，发掘了一个数据可视化工具gnuplot，忍不住要推荐给大家。这篇分享的亮点在于，作者没有停留在软件的基础介绍上，而是直接切入它在性能调优这一具体场景中的价值——他发现“所有调优都能数字化”，而gnuplot与另一个命令行工具bc配合，能非常高效地将抽象的性能数据转化为直观的图表，为分析提供有力支撑。文章附带了一张作者自己生成的可视化图表，虽然作者谦虚地说“做得不好”，但恰恰这真实的示例，让我们看到了从原始数据到可视化结论的完整过程。gnuplot作为一个经典的命令行绘图工具，特别适合与脚本和系统监控数据集成，对于需要快速分析日志、性能指标的技术人员来说，是一个轻量又强大的选择。如果你经常需要处理调优数据或希望给枯燥的数字加上直观的视觉呈现，这篇分享提供了一个非常实际的工具思路。

IT 累计浏览 3,237

Linux Hugepages

这篇文章从Linux 2.6内核引入Hugepages的背景讲起，解释了这项技术的核心目标：在系统物理内存持续增长的背景下，通过使用更大的内存页（如2MB或1GB）来替代传统的4KB小页，从而优化大内存应用场景的性能。文章详细拆解了Hugepages的工作原理与收益。传统的小内存页在管理海量内存时，会导致页表过于庞大，不仅占用大量内存，还会频繁引发TLB（地址转换后备缓冲器）缺失，成为性能瓶颈。而Hugepages通过显著增大单个页面的尺寸，大幅缩减了页表条目数量，减轻了TLB压力，从而有效提升了数据库、虚拟机、大型科学计算等内存密集型应用的访问效率。作者也区分了Hugepages的不同使用方式，包括预分配的静态Hugepages与动态透明的HugePages（THP），并指出各自的适用场景。前者性能更可控但需要规划，后者管理更灵活但可能引入碎片。文章最终落脚于一个清晰的结论：在部署大内存、高吞吐的服务时，合理配置Hugepages是一项能带来显著性能提升的关键系统级优化。

IT 累计浏览 2,866

被 Apache 的 MaxClients 困住了

这篇讲的是作者在一台服务器上用 Apache + mod_fastcgi 部署 Redmine 后，遭遇的严重性能问题：页面加载动辄十几秒，而同服务器其他站点却运行正常。排查过程很经典。作者首先排除了网速因素，然后将目光锁定在 Apache 自身。问题的关键在于一个名为 `MaxClients` 的配置参数。这个参数决定了 Apache 能同时处理的最大请求数（进程数）。当通过 mod_fastcgi 运行像 Redmine 这样的慢速应用时，单个请求可能会占用一个进程较长时间，导致进程池迅速耗尽。最终，根因就是默认的 `MaxClients` 值过低，无法应对并发请求，形成了性能瓶颈。解决方案直截了当：根据服务器内存情况，合理调大这个参数的值，从而允许 Apache 同时处理更多请求，问题随即缓解。这个案例提醒我们，在部署不同特性的应用时，需要审视默认配置的适用性。特别是当引入可能拖长响应时间的模块或应用后，像 `MaxClients` 这类控制并发资源的关键参数，就必须重新评估和调整。