标签：Performance Tuning

共 24 篇相关文章

IT 累计浏览 2,363

10 条加速 Ubuntu Linux 的杀手级技巧

这篇讲的是如何让变慢的Ubuntu系统重新快起来。文章没有空谈理论，而是直接给出了10个实操性强的“杀手级技巧”，针对的是Ubuntu用久了难免出现的卡顿问题。作者从系统变慢的常见原因切入，然后逐一拆解解决方案。这些技巧覆盖了从开机启动（缩短Grub等待、管理自启动应用）、软件安装（用preload预加载、用apt-fast加速下载），到运行时优化（控制过热、调整LibreOffice内存）等多个层面。比如，通过一个简单的`sleep`命令就能延迟非必需程序的启动，或者通过调整软件源来加速更新，这些都是立竿见影的小改动。文章特别贴心地指出，这些方法不仅适用于Ubuntu，也适用于Linux Mint等基于Ubuntu的发行版。对于老旧硬件或追求流畅体验的用户，其中关于切换到Xfce或LXDE等轻量级桌面环境的建议，提供了进一步的优化思路。整篇文章就像一份针对系统“新陈代谢”的调理方案，通过一点一滴的设置累积，最终能换回一个更迅捷的工作环境。

IT 累计浏览 1,747

NodeJS的代码调试和性能调优

这篇讲的是NodeJS调试方法的演进与核心实践。作者从NodeJS版本合并的背景切入，指出许多开发者仍停留在`console.log`或`asserts`模块的基础调试阶段，这些方式需要将调试逻辑硬编码进业务代码。为此，文章详细介绍了NodeJS内建的命令行调试器作为更专业的解决方案。核心方法是通过`node debug`命令启动文件，进入一个提供丰富调试指令的环境。文章清晰地区分了“debug模式”（用于单步执行、设置断点）和“repl模式”（用于实时检查变量状态），并列举了`cont`、`next`、`step`等关键命令。这种调试方式通过TCP与内建模块通信，摆脱了在代码中“埋点”的束缚，让调试过程更干净、高效。文章最后也点出了调试器的工作原理，并提及IDE集成的图形化调试工具是其更友好的封装。其价值在于，它将调试从一种“破坏性”的辅助操作，转变为一种与代码分离的、系统化的质量保障流程。

IT 累计浏览 2,303

MySQL processlist中最哪些状态要引起关注

排查MySQL性能问题时，盯着processlist看哪些SQL在跑只是第一步。更重要的是，通过连接的状态判断其是否正在经历瓶颈。这篇讲的就是那些需要特别警惕的processlist状态，以及背后对应的优化方向。文章列举了从“copy to tmp table”、“Sending data”到“Waiting for lock_type lock”等12个关键状态。比如，看到“copy to tmp table”频繁出现，意味着你的ALTER TABLE操作可能在业务高峰锁表，建议使用pt-osc工具或移到凌晨执行。“Sending data”则常因查询扫描数据量过大，核心解法是创建合适的索引并添加LIMIT。而一旦出现各种“Waiting for... lock”，特别是全局读锁或元数据锁，就说明有DDL操作在阻塞整个实例，必须调整维护窗口。作者将每个状态与具体的数据库行为（如磁盘IO差、临时表溢出、锁等待）和明确的优化动作（如调参数、加索引、换引擎）直接关联起来。下次当你发现数据库响应慢，除了看慢查询日志，不妨也看看processlist里的这些“状态信号灯”，往往能更快定位到问题根源。

IT 累计浏览 2,361

MySQL索引原理与慢查询优化

这篇讲的是如何从原理层面理解MySQL索引，并将其应用于实际的慢查询优化。作者从“查询效率”这个基本需求出发，首先用字典类比引出索引概念，然后深入讲解了数据库为平衡磁盘IO成本所选择的数据结构——B+树。文章详细剖析了B+树的节点结构、查找过程以及高度可控的优势，解释了为什么索引字段要尽量小，以及复合索引的“最左匹配”原则是如何从B+树结构推导出来的。在原理部分之后，文章给出了几条非常实用的建索引原则，比如索引列不能参与计算、尽量扩展而非新建索引等。最后，它提供了一套慢查询优化的基本步骤，并强调了`explain`命令中`rows`指标的核心作用。整篇文章将底层的数据结构原理与上层的SQL优化实践紧密串联，帮助读者不仅知道“怎么做”，更理解“为什么”。

IT 累计浏览 3,462

良好的书写规范提高PHP代码执行效率

这篇讲的是 PHP 开发中那些容易被忽略的编码习惯如何显著影响代码执行效率。作者从最基础的字符串引用开始，对比了单引号与双引号的性能差异——前者因不解析变量而更快。接着深入到函数调用、循环结构与变量操作等细节，比如用 `isset()` 替代 `strlen()` 检查字符串长度、`++$i` 比 `$i++` 更快（因指令数更少），以及循环内避免声明大变量等具体建议。文章的核心在于揭示了“书写规范”背后隐藏的性能代价。例如，它指出递增对象属性比递增局部变量慢3倍，而未定义的局部变量递增速度则慢了近10倍。这些量化对比让优化方向变得非常清晰。此外，内容也超越了代码层面，提及了服务器配置（如开启 mod_deflate）、使用 memcached 缓存以及精简面向对象设计等架构性建议。总的来说，它系统地梳理了从微观语法到宏观结构的一系列性能优化点，强调了许多看似微小的“规范”选择，实则是提升PHP应用响应速度和资源利用效率的关键。

IT 累计浏览 2,122

Oracle数据库升级迁移、SPA及统计信息

作者从一次真实的升级迁移讲起：某省级电信运营商将核心CRM系统的Oracle数据库，从IBM小型机上的10g RAC迁移至x86+VMware平台的11g RAC，成本降至十分之一。这引出了一个关键的后续问题：新系统上线后，应采用何种统计信息收集策略？文章对比了两种方案：迁移旧库统计信息或在新库自动收集。作者团队最终选择了后者，原因是11gR2的自动收集机制已相对完善，且能为后续运维降低风险。但如何确保这一策略在上线时就安全可用？答案在于利用SPA（SQL性能分析器）。团队使用了生产库三个时段及一个月AWR中的全部SQL，在新库上跑SPA测试。在测试前，先用`dbms_stats.gather_database_stats(options=>'gather auto')`执行一次增量收集。然而，直接这样做会导致新库的直方图信息严重缺失，因为自动收集依赖`col_usage$`表，而新库此表为空。解决方法是在SPA测试过程中，通过执行足够多的SQL来“喂饱”`col_usage$`，让系统“记住”哪些列需要被关注。最终，基于SPA的测试结果，用数十个SQL Profile固化了风险计划，保障了系统平稳上线。这篇分享的价值在于，它清晰地展示了在大型跨版本迁移中，如何通过组合使用SPA和自动统计信息收集策略，来系统性规避性能风险，而不仅仅是凭经验手工调优。

IT 累计浏览 6,121

nginx、php-fpm默认配置与性能–TCP socket还是unix domain socket

这篇讲的是如何解决高并发下PHP服务器因频繁创建TCP短连接导致的端口耗尽问题。作者从观察到的真实案例切入——服务器因大量TIME_WAIT状态堆积，耗尽了可用端口，导致新建连接失败。常见的“缩短2MSL时间”的方案治标不治本，因此他引导读者思考更优的解法。文章核心对比了Nginx与PHP-FPM之间的两种通信方式：默认的TCP socket和Unix Domain Socket（UDS）。作者结合一个WebGame的架构实例指出，当Nginx与PHP-FPM部署在同一台服务器时，使用TCP socket（尤其是短连接模式）会因经过完整的网络协议栈而产生不必要的系统开销，并引发上述的端口问题。相比之下，Unix Domain Socket绕过了TCP/IP层，直接在内核中通过文件套接字通信，大幅降低了连接建立与销毁的开销，从根本上避免了端口竞争。文章最终给出的结论很明确：对于同机部署的Nginx与PHP-FPM，切换到Unix Domain Socket通常是更优的选择，它能提升效率并彻底解决因短连接导致的资源瓶颈。这对运维和后端开发人员优化本地服务通信有直接的参考价值。

IT 累计浏览 4,305

如何验证SQL PROFILE的性能？

这篇讲的是在Oracle数据库生产环境中，如何安全且有效地验证SQL PROFILE的实际性能收益。文章开篇点明了背景：10g以后的SQL Tuning Advisor会给出多种调优建议，其中启用SQL PROFILE是常见选项。但在生产环境直接应用存在风险，因为优化建议未必适合真实负载，一旦出错可能加剧性能问题。尤其当缺乏测试环境，而SQL PROFILE又可能是“救命稻草”时，就需要一种可靠的局部测试方法。作者随即演示了具体操作：在12c环境中创建测试表与索引，通过全表扫描执行SQL并记录基线成本。随后运行SQL Tuning Advisor生成任务，并展示了工具内置的“验证”步骤——它对比了原始执行计划与推荐SQL PROFILE计划的关键指标。测试结果极具说服力：使用SQL PROFILE后，缓冲区获取（Buffer Gets）从1470锐减至3，提升达99.79%，同时CPU时间与耗时也几乎归零，证明索引扫描方案远优于全表扫描。这篇文章的实用价值在于，它提供了一个无需全面部署即可在session级别评估SQL PROFILE效果的清晰范式，帮助DBA在追求性能与保障稳定性之间找到平衡点。

IT 累计浏览 3,709

Java正则引发的思考

这篇讲的是一个由正则表达式引发的线上故障排查与深度分析。作者从预发环境CPU不定时飙升至100%的问题出发，通过jstack分析，发现业务线程全部卡在正则匹配的代码上。排查发现，问题根源在于一段看似无害的用户输入，经过代码规范化后，形成类似“`.*.*.*.*.*.*.*Deliver`”的正则模式，与特定长字符串匹配时导致了“假死”。文章深入剖析了Java正则引擎在“贪婪模式（greedy）”下的工作机制。作者用一个简化的正则“`.*.*.*.*D`”和36个字符的字符串为例，图解了引擎在遇到多个通配符“`.*`”时，会如何进行大量回溯尝试，最终指出其匹配步数会呈现指数级增长（公式为 `S(m, n) = n + Σ S(m-1, n-i)` for `i=1 to n-1`）。为了验证这一理论推导，作者还巧妙地运用ASM字节码注入技术，在JDK正则匹配的核心方法上埋点，实测了匹配步数，结果与理论计算完全吻合。这篇文章的价值在于，它清晰地揭示了Java正则引擎在处理特定贪婪模式通配符时可能存在的性能陷阱。对于开发者而言，这是一个重要的警示：在处理外部输入构造正则时，必须避免此类多重通配符的模式，否则可能引发难以预料和排查的严重性能问题。

IT 累计浏览 3,442

稳定性思考-强弱依赖2

这篇文章从一个实际问题切入：在微服务架构中，如何为弱依赖（如Cache）设置合理的“并发请求数阈值”？作者的分析思路很清晰，核心目标是实现高QPS下的资源消耗最小化，即“高QPS，少线程”。作者通过一个Cache访问案例，结合公式 QPS=1000/RT * threadNum，做了生动的故障推演。正常时1个线程就能支撑400QPS；一旦Cache故障、RT飙升至3000ms，理论上就需要1200个线程，这会导致调用方线程池耗尽、频繁FullGC，陷入恶性循环。为此，文章提出的核心方案是：限制访问弱依赖的线程数。例如，将阈值设为10。这样在上述故障中，调用方只会阻塞10个线程，整体服务保持正常，实现优雅降级。结合超时设置，能形成更有效的流控策略。那么阈值设多少？文章给出了计算方法：根据可接受的RT（如100ms）和目标QPS（400）反推，得到 threadNum = 400 * 100 / 1000 = 40。作者也分享了经验数据：平均50ms的APP，阈值一般不超过60。文章最后点明，响应时间变长往往源于排队，而系统的最高QPS由瓶颈资源决定，盲目增加线程未必有用。

IT 累计浏览 3,428

代码执行的效率

这篇文章围绕代码执行的效率展开，核心观点是性能调优的关键在于找到并优化程序中的“热点”——即那些被调用最频繁、执行时间占比最高的代码路径。作者从《性能调优攻略》的已有论述出发，进一步用三个来自实际网络的案例，具象化地展示了这一原则的应用。文章没有空谈理论，而是聚焦于具体可感的优化场景。它向读者阐明，哪怕是热点代码上一次微小的效率提升，累积起来也能带来整体性能的质的飞跃。通过剖析这些真实世界的例子，作者旨在揭示一个可操作的优化思路：不要平均用力，而要将宝贵的精力精准投放在对性能影响最大的代码部分。这篇内容对开发者很有启发，它将一个抽象的性能优化原则，转化为可观察、可学习的实践路径，引导读者去审视自己代码中的“热点”所在。

IT 累计浏览 1,881

环境切换 – 残酷的性能杀手（上）

这篇讲的是服务器性能优化中两个常被忽视却至关重要的“隐形杀手”：上下文切换和Cache Line同步。作者从实践经验出发，指出许多人在优化服务器时，习惯性地将火力集中在减少内存拷贝、降低IO次数这些经典方向上。这当然没错，但就像盖房子，人们往往专注于主体结构是否坚固，却忽略了地基的微小沉降和材料的热胀冷缩——这些“不明显”的因素，在极端负载下反而可能成为压垮性能的最后一根稻草。文章将这个深度话题分成了上下两篇。作为上篇，它着重揭示了问题本身：为什么我们总是盯着内存和IO，却对CPU在不同任务间频繁跳转（上下文切换）以及多个核心争抢同一内存块（Cache Line同步）带来的巨大开销视而不见？作者认为，一个追求极致的高性能服务器，必须具备更细腻的洞察力，将优化视野扩展到这些芯片层面的资源争夺战中。这为后续探讨具体优化策略做好了铺垫。

IT 累计浏览 2,606

HBase在淘宝主搜索的Dump中的性能调优

这篇讲的是HBase在淘宝主搜索Dump系统中的性能调优实践。作者从Dump系统“短时、高量、低延时”的核心需求出发，分享了在将HBase应用于全量与增量数据存储时积累的优化经验。文章没有停留在架构介绍，而是深入到了具体瓶颈和应对措施，比如如何通过一系列调优手段来满足苛刻的延时要求，从而有效缓解了数据库压力并增强了业务扩展性。对于关注大数据存储引擎性能优化的工程师来说，文中涉及的具体实践和思路具有直接的参考价值。

IT 累计浏览 1,460

关于Freelists和Freelist Groups的研究

这篇文章深入探讨了Oracle数据库中一个看似底层却影响深远的性能调优点：Freelists与Freelist Groups。作者从高并发事务场景下的性能瓶颈切入，指出默认或不当的空闲列表配置可能成为数据库写入操作的“隐形收费站”。文章的核心价值在于厘清了这两个关键参数的分工与协作：Freelists负责单实例内管理数据块的空闲空间，而Freelist Groups则是在RAC（实时应用集群）环境下，为避免多实例争用而引入的分布式管理机制。通过具体的测试数据对比，文章清晰地展示了在不当配置（例如所有会话集中争用同一组空闲列表）与优化配置（启用Freelist Groups，让不同实例使用不同的空闲列表组）下，事务的并发处理能力和整体吞吐量存在的显著差异。结论很明确：对于OLTP系统或RAC架构，合理规划Freelist Groups的数量与结构，是释放并发性能、避免热块竞争的关键一步。文章没有停留在理论层面，而是给出了基于场景的配置建议，对于遇到类似性能问题的数据库管理员和架构师而言，提供了直接的调优思路和实践依据。

IT 累计浏览 2,882

disktop per设备per应用层面的IO读写统计

这篇讲的是在IO调优中，如何突破现有工具的监控粒度限制。我们常用 iostat 查看全局设备负载，用 iotop 查看进程级IO，但现实中常常需要更精细的视角：**具体到每个应用，分别对每块磁盘（设备）做了多少读写。** 文章从一个典型需求出发：比如为MySQL做性能优化时，通常会把数据目录和日志目录分开挂载到不同的磁盘或分区上。这时，仅仅知道MySQL整体的IO量是不够的，必须能清晰分辨出是数据盘的随机读写在承压，还是日志盘的顺序写入成为瓶颈。作者针对这类“per设备per应用”的统计空白，介绍了一种实用的观测方法或工具（结合文章标题推断），其核心正是打通了应用和设备这两个维度的关联。这意味着，管理员可以直接回答“哪些应用在哪块磁盘上产生的IO负载最大”这类关键问题，从而让性能分析和资源调配有的放矢。对于运维和开发人员而言，这补全了从全局到应用、再到具体设备的IO观测链条，使得调优工作能建立在更精准的数据基础上。

IT 累计浏览 3,602

极不和谐的 fork 多线程程序

这篇讲的是一个开发者如何被一个“诡异”的死锁问题坑到，最后发现罪魁祸首是在多线程程序里使用了 fork。文章从程序突然卡死、日志却毫无头绪的场景切入，抽丝剥茧地解释了问题的根源：fork 只会复制调用它的那个线程，而其他线程持有的互斥锁状态却无法被继承，这会导致子进程里永远等不到锁，直接死锁。作者没有止步于解释“为什么不行”，更进一步探讨了“那该怎么办”。文章对比了几种常见的替代思路，比如利用 posix_spawn 或 exec 加上 pthread_atfork 来安全地创建子进程，并给出了清晰的决策路径：如果你需要新的进程执行全新任务，别 fork，用 posix_spawn；如果你必须 fork，那请确保在 fork 之后、exec 之前，立刻把其他线程创建出来。全文最大的价值在于，它不仅点明了一个经典但易踩的陷阱，更提供了清晰的避坑指南和架构层面的思考，对那些需要在多线程环境下处理进程创建的开发者来说，是一次非常及时的提醒。

IT 累计浏览 1,662

10203 connect_by性能问题

这篇讲的是一条看似平常的SQL语句带来的性能陷阱。作者遇到一条SQL语句，在大多数情况下执行很快，可一旦绑定某个特定参数值，执行时间就从几秒飙升到好几分钟。问题的核心指向了Oracle中的`connect by`层级查询操作。根源在于数据分布极不均匀，导致查询计划在特定参数下发生灾难性变化。对于绑定那个“坏”值的查询，数据库可能选中了效率极低的执行路径，例如错误的连接顺序或不恰当的索引使用，使得原本的高效查询瞬间变成了资源消耗黑洞。这个案例揭示了执行计划稳定性对数据库性能的深刻影响。它提醒我们，不能仅凭历史执行时间来判断一条SQL的稳定性，那些“偶发”的慢查询背后，往往隐藏着数据分布不均或统计信息过时等深层问题。下次遇到类似的“时好时坏”性能问题时，你或许会多想一层：是不是背后藏着一张不均匀的数据地图？

IT 累计浏览 5,520

[调优] Squid 不同版本的性能对比

这篇讲的是Squid代理服务器在不同版本间的性能对比测试。作者从实际调优需求出发，对目前所有标准版本进行了系统的横向对比，重点剖析了Squid 2.7与Squid 3.1这两代常用版本在性能表现上的具体差异。文章的测试方法颇具参考价值：在每一次不同配置或版本的测试前，都会严格清空cache_dir中的所有缓存对象，确保了测试起点的一致性与结果的可靠性。这种严谨的实操细节，对于想要复现或设计类似性能测试的工程师来说尤为有用。核心结论指向了版本选择对实际应用场景的影响。虽然更具体的性能数据需参阅正文，但文章明确了版本迭代带来的变化。例如，对于需要处理高并发连接的场景，新版本可能在资源管理或协议支持上有所优化；而对于追求稳定性和特定功能兼容性的环境，旧版本或许仍有其立足之地。这为技术选型提供了直接的依据，而不仅仅是理论上的版本号变化。

IT 累计浏览 2,582

没有比解决瓶颈更高效的事情了

这篇讲的是作者在虹桥机场排队等车时，观察到的一个让人恼火的效率陷阱。一边是大量出租车空等数小时，另一边是数百位乘客排着长队苦等上车，系统明明有大量闲置运力，却被一个环节死死卡住，导致整体吞吐效率低下。更令人深思的是，即使机场扩建了几倍，这个瓶颈的逻辑却没有被改变。作者从这个日常痛点出发，提炼出了一个核心观点：在复杂系统中，真正的低效往往不是资源不足，而是资源流动路径上的某个“瓶颈”点在制造堵塞。解决这个瓶颈，哪怕只有一点点松动，带来的整体效率提升，也远比在非瓶颈环节投入大量资源优化要高效得多。这个观察超越了机场管理，指向了所有涉及流程与资源调度的场景——从软件架构设计、生产流水线到团队工作流。它提醒我们，识别并攻克那个唯一的卡脖子环节，是撬动整体效能提升的最有力支点。

IT 累计浏览 2,402

FreeBSD系统优化部分内核参数调优中文注释

这篇讲的是FreeBSD系统内核参数调优中的一个具体细节：通过调整TCP缓冲区空间来提升网络性能。文章聚焦于net.inet.tcp.recvspace这一参数，解释了它的作用是设置系统接受TCP数据的最大缓冲区大小，并给出了从默认值调整到65536字节（64KB）的配置示例。作者没有停留在简单的参数罗列，而是从系统优化的背景出发，点明了调整该参数的实际意义：在高并发或大流量网络场景下，更大的接收缓冲区能有效减少数据丢包和延迟，从而提升整体网络吞吐能力。这种调整特别适合那些需要处理大量并发连接或进行大数据传输的FreeBSD服务器环境。文章用清晰的中文注释让原本枯燥的内核参数变得易于理解，对于需要动手优化系统性能的运维人员或开发者来说，提供了直接可参考的配置思路。它展示了从默认配置到性能调优之间，一个关键参数的细微改动所带来的实际影响。