最新文章

采集自各技术站点的近期文章。

IT 后端/ 2015-01-04 22:59:03 / 累计浏览 5,678

php调试利器之phpdbg

这篇文章详细介绍了PHP的轻量级调试工具phpdbg。作者指出，phpdbg作为一个SAPI模块，最大的优势在于无需修改代码、几乎不影响性能，就能对PHP程序进行断点调试、单步跟踪和代码分析，非常适合线上或性能敏感场景下的排查。文章核心讲解了phpdbg的主要功能与使用方法。功能上，它不仅支持按文件行号、函数方法设置断点，还能精确到opcode层级进行断点设置，这对深入理解PHP执行流非常有帮助。安装部分给出了清晰的编译指令示例，并强调了从PHP 5.6版本开始的集成变化。基本使用则通过具体代码示例，展示了如何启动工具、加载脚本、设置/查看/删除断点，以及单步执行等常用调试操作，过程与GDB等工具思路相似，但更贴合PHP特性。总体而言，这是一篇实用性很强的工具指南。对于PHP开发者来说，掌握phpdbg能提供一个轻便且强大的本地调试方案，尤其适合那些不便于使用Xdebug等重型工具，或需要最小化环境干扰的调试场景。

本机暂存

IT DevOps/ 2015-01-04 22:58:08 / 累计浏览 13,013

Linux 性能监控、测试、优化工具

系统性能专家 Brendan Gregg 在 LinuxCon NA 2014 大会上更新了他的经典演讲。这篇文章梳理了他演讲中关于 Linux 性能工具的核心图谱，最大的变化是新增了测试与优化两大部分，形成了一个完整的工具体系。作者将复杂的性能问题拆解为三个清晰的场景：日常监控、基准测试与主动调优。针对每个场景，都提供了对应的工具图谱。例如，监控部分聚焦于观察系统运行状态，使用 perf、bpftrace 等工具追踪内核与用户层活动；测试部分则关注量化系统能力，展示了 fio、sysbench 等用于磁盘、网络和数据库的基准工具；优化部分提供了性能调优的视角，介绍了 perf stat、turbostat 等用于分析瓶颈并指导调整的工具。整篇文章没有泛泛而谈，而是通过三张详尽的工具关系图，直观地展示了如何在不同阶段选择合适的工具。它帮助读者快速建立起 Linux 性能分析的全局观，知道在什么问题下该去哪里找对应的“武器”。

本机暂存

IT 前端/ 2015-01-04 22:57:01 / 累计浏览 6,519

css3-animation制作逐帧动画

这篇讲的是作者从对CSS3 `animation`属性的好奇出发，深入解析了这个强大的动画组件。文章不仅拆解了`animation`的八个子属性（如名称、时长、缓动函数等），还结合CanIUse图表清晰对比了其在不同浏览器的支持情况——IE完全不支持，而Firefox 32+和Opera已无需私有前缀，Chrome、Safari等则需添加-webkit-等前缀。核心亮点在于，作者讲解了如何利用`animation`配合`@keyframes`关键帧来实现类似GIF的逐帧动画效果，而非单纯依赖图片序列。文中通过“奔跑的小人物”这个直观的Demo，展示了具体实现思路。这对于想用纯CSS制作复杂动效、同时需要兼顾多浏览器兼容性的前端开发者来说，提供了清晰的实现路径和实用参考。

本机暂存

IT 后端/ 2015-01-04 22:54:28 / 累计浏览 12,295

Linus：为何对象引用计数必须是原子的

Linus在这篇长文里，用一个具体的编程细节，撕开了“并行计算很简单”这个流行错觉的口子。他聚焦于一个看似基础的问题：为什么在多线程环境下，对象的引用计数必须是原子操作。文章的核心论证在于区分两种完全不同的锁机制：一种是保护“对象数据”的锁，另一种是保护“查找对象”这一过程的锁。Linus指出，引用计数的原子性之所以关键，是因为在复杂的对象图（graph）中遍历时，为了避免死锁（特别是经典的ABBA死锁），你必须在持有对象A的锁时，安全地转向对象B。此时，原子性地增加对象B的引用计数，就成了确保对象B在解锁后不会“消失”的唯一安全绳。如果你认为引用计数不需要原子化，这恰恰暴露了你对锁机制复杂性的无知。通过这个精巧的例证，Linus抨击了那些只看到简单数组并行排序、却无视真实世界中对象动态分配与释放复杂性的乐观论调。他用这个例子揭示，许多被宣传为“容易并行化”的案例，其实都巧妙回避了并发编程中最棘手的部分。这篇文章最终指向一个硬核结论：并发设计本质上是困难的，而许多关于并行未来的讨论，建立在对这种困难严重低估的基础上。

本机暂存

IT 数据库/ 2015-01-04 22:50:48 / 累计浏览 2,458

修改oracle当前会话的语言环境，解决oracle显示中文乱码的问题

这篇讲的是如何快速解决Oracle数据库在操作时出现中文提示显示为一串问号的常见问题。作者从实际操作中的困扰出发，明确指出这种乱码的根源在于当前会话的语言环境设置不匹配。文章提供了具体、可操作的解决方案：首先通过 `SELECT userenv('language') FROM dual;` 命令来查看当前的语言环境配置，确认问题。接着，给出了两种修改方法：一是通过 `ALTER SESSION SET NLS_LANGUAGE='SIMPLIFIED CHINESE';` 命令临时修改当前会话，使其立即生效；二是通过修改环境变量等方式进行永久性设置，从根源上避免问题再次出现。整个排查思路清晰，步骤直接，对于遇到类似字符集显示问题的数据库管理员或开发人员来说，是一份实用且能快速解决问题的参考。简单几条命令就能让提示信息恢复可读性，提升了工作效率。

本机暂存

IT 数据库/ 2015-01-04 22:49:39 / 累计浏览 2,987

oracle跟踪事件（dump）总结

这篇讲的是Oracle数据库中用于故障诊断的跟踪事件（dump）机制。文章系统梳理了跟踪文件的三种类型——后台报警日志、后台进程跟踪文件和用户跟踪文件，并详细说明了如何通过初始化参数或会话命令来触发dump操作。核心内容聚焦于各种跟踪事件的具体用法。例如，通过`buffers`事件可导出SGA缓冲区信息，`blockdump`事件能定位特定数据块，`errorstack`事件则用于捕获难以获取的错误栈。文章还列举了诸如`10046`（SQL语句跟踪）、`10231`（全表扫描时跳过损坏块）等实用的内部事件号，并解释了其参数级别含义。最后，文章提供了查看当前跟踪文件的简单示例。整体上，它像一份面向DBA和开发者的速查手册，将分散的Oracle诊断工具整理成可操作的条目，便于在性能调优或故障排查时快速定位并转储关键内存结构或日志信息。

本机暂存

IT 数据库/ 2015-01-04 22:47:30 / 累计浏览 15,217

如何查找消耗资源较大的SQL

这篇讲的是数据库性能优化中一个非常基础但关键的问题：如何找出那些最“吃”资源的SQL语句。作者没有从理论入手，而是直接从Oracle的V$SQLAREA视图出发，给出了一个可直接使用的查询语句。这条SQL的设计很务实，它不仅找出了总磁盘读取（disk_reads）最多的查询，还计算了每次执行的平均磁盘读取次数（rds_exec_ratio）。通过这个比率，你能快速识别出是那些执行频繁但效率低的语句，还是那些单次执行就消耗巨大的语句。同时，语句关联了执行用户（username）和具体的SQL文本（Statement），让定位和后续优化有了明确目标。对于需要快速诊断数据库性能问题的DBA或开发人员来说，掌握这几个从V$SQLAREA中提取关键信息的查询，就相当于有了一个高效的“探照灯”，能立刻照出系统中最耗资源的瓶颈所在，让优化工作不再是大海捞针。

本机暂存

IT 开发者/ 2015-01-04 14:23:33 / 累计浏览 2,642

一个程序员眼中的价值

这篇文章记录了一位资深程序员从2007年到2014年的职业反思。作者从自己雅虎实习、百度工作、参与PHP开发等经历出发，探讨了他所理解的“价值”。他分享了几个关键阶段：刚毕业时，从优先考虑学习到认识到基本生活保障的重要性；工作几年后，因赞誉而自满，后来才看清自己的技术短板；在开源社区中，接受受助者的感谢礼物让他体会到创造的价值。最突出的是在微博和PHP社区的贡献，例如将无线LAMP性能提升2.6倍、参与推动PHP7的性能飞跃，这些实际成果为他赢得了尊重。作者的结论很实在：程序员的真正价值，在于你为公司和他人创造了多大的实际贡献。如果能做出有价值的贡献，相应的肯定会随之而来，或早或晚。相反，如果只盯着自己得到了什么，忽略了付出的价值，路会走得很辛苦。

本机暂存

IT 后端/ 2015-01-04 14:20:03 / 累计浏览 1,160

nginx反向代理做克隆采集小偷垃圾站，还能翻墙

这篇讲的是如何利用Nginx反向代理快速搭建一个网站内容镜像或代理站。作者从一个具体的配置文件入手，展示了核心步骤：通过`proxy_pass`将本地域名请求指向目标站点IP，并配合`proxy_set_header`伪装访问头，使对方服务器记录的是代理IP。文章特别强调了两个实用技巧：一是通过`subs_filter`规则（需安装第三方`nginx_substitutions_filter`模块）在返回页面前动态替换文本内容，可用于清理广告或修改版权信息；二是通过设置`Accept-Encoding`为空来禁用压缩，确保替换模块能正常工作。作者还手把手演示了如何在已有NginX基础上，通过重新编译添加该模块的完整流程，从下载源码、查看原编译参数、执行`make`到平滑替换二进制文件，步骤清晰。整个方案相当于用NginX作为“中间人”，低成本实现了内容抓取、过滤与转发，对于需要快速搭建本地化内容镜像或进行页面预处理的开发者来说，是一套直接可用的技术脚本。

本机暂存

IT 算法/ 2015-01-04 14:17:59 / 累计浏览 2,325

从未降级的搜索-主搜索分层优化

这篇讲的是淘宝主搜索如何通过索引分层技术，将集群架构从二维升级到三维，从而解决长期存在的性能与扩展性瓶颈。作者从主搜索沿用多年的二维架构出发，指出其存在机器消耗多、低质量商品拖累效率、索引结构单一且难以支持多样化排序等核心问题。文章提出的分层优化方案，核心思路是将商品按质量（Good/Bad）和特定排序需求（如人气）拆分成不同集群，并设计相应的检索策略。例如，对人气排序查询优先走仅包含头部商品的Excellent集群，而对一般查询则优先查Good集群，不足时再补充Bad集群。这种三维架构带来了显著收益：不仅将集群规模缩减了36%，整体检索性能提升了120%，最终还带动了6%的搜索GMV增长。文章用清晰的架构图和具体数据，展示了如何通过精巧的索引设计，在控制成本的同时满足多样化的排序需求，为主搜索的业务拓展提供了坚实的技术基础。

本机暂存

IT 算法/ 2014-12-30 12:48:15 / 累计浏览 2,932

数据分析中位数的应用

这篇讲的是如何让枯燥的折线图更直观地传达信息。作者发现，普通折线图常常无法突出数据中的关键点，于是通过对比两张图（A图是常规折线，B图则将最高的几个数据点用特殊图标标出），直观地展示了“一目了然”的视觉效果差异。核心问题随之而来：如何从一堆数据里，自动找出那个用于区分“特殊点”与“普通点”的分界线呢？文章对比了两种常见方法——平均数和中位数。作者指出，平均数虽然反映整体水平，但极易被一两个极端的高值或低值“带偏”，无法稳定代表“大多数”情况。相比之下，中位数是把数据排序后取中间的那个数（或两个数的平均），它不受极端值影响，更能代表数据的“中间”或“典型”水平，因此成为构建这个分界线的更优选择。为了便于实践，作者还提供了一个计算中位数的PHP函数代码示例。整篇文章从一个可视化的痛点切入，落到具体的统计概念辨析和算法实现，思路清晰，具有不错的实操参考价值。

本机暂存

IT DevOps/ 2014-12-30 12:47:01 / 累计浏览 12,887

关于linux内存free的一些事情

这篇讲的是Linux下最常用也最容易被误解的free命令。文章从一个最常见的命令入手，拆解了其输出中每一列的含义，特别是新手容易混淆的“buffers”和“cache”——前者是写缓存，后者是读缓存。作者指出，判断系统内存是否充足，关键看“-/+ buffers/cache”这一行，而非仅看“free”列。因为可供应用程序使用的内存总量实际上是“free + buffers + cached”的总和。文章还解释了一个经典困惑：为何系统已开始使用Swap，却可能并未“内存不足”？这是因为在内存紧张时，系统会尝试释放旧的缓存，但有时释放不及时，便过渡到了交换区。此外，文章也演示了如何使用`sysctl`手动释放缓存，并坦诚这通常是“治标不治本”的操作，缓存会在系统运行中再次积累。这对于运维人员日常排查“内存告警”误报、理解系统真实资源状况有直接的指导意义。

本机暂存

IT 后端/ 2014-12-30 12:37:33 / 累计浏览 5,144

Django框架ORM操作详解

这篇详解聚焦于Django ORM的操作实践，从基础的CRUD到查询集的深度使用都有覆盖。作者以一个博客系统模型为例，清晰地展示了如何通过Python对象与数据库交互：用`save()`写入数据，用`filter()`与`exclude()`构建查询，以及如何通过点号语法优雅地链接多个过滤条件。文章特别强调了QuerySet的两个核心特性。一是“延迟执行”，即便堆叠了多个过滤条件，只有在真正需要结果（如遍历或打印）时，Django才会生成并执行最终的SQL语句。二是查询结果集的独立性，每次筛选都会返回一个全新的QuerySet，方便复用与组合，这是构建复杂查询的基石。此外，内容还深入到了字段查找的语法细节和跨关系查询（如通过`ForeignKey`和`ManyToManyField`）的具体方法。整体上，它不仅仅是一个API列表，更揭示了ORM背后高效、Pythonic的设计思路，帮助开发者写出既简洁又性能良好的数据访问代码。

本机暂存

IT 后端/ 2014-12-30 12:35:28 / 累计浏览 12,399

好的API设计

这篇文章从一次实际的中间件重构经历出发，探讨了“什么样的API才算是好API”。作者指出，API一旦发布便难以更改，因此在设计之初就需格外审慎。文章清晰地界定了API不仅限于函数或接口，还包括调用方式、约定与依赖等。其核心部分总结了优秀API应具备的六大特点：易于学习、无文档也易用、不易误用（降低使用者心智负担）、使使用者的代码更易维护、能完备且正交地满足需求，以及易于扩展。针对如何实现，文章提炼出八条精炼的设计原则：功能单一、体量尽可能小、减少外部依赖、设计不被实现细节所影响、谨慎暴露接口、采用自描述的命名、配套完善的文档，并始终考虑性能。文末附有多个跨语言的参考资料来源，为这些原则提供了扎实的理论依据。整篇文章没有空谈理论，而是从“发布即定型”的现实约束出发，将API设计拟人化，强调其“秉性”的稳定。它为开发者提供了一份清晰可操作的自查清单，提醒我们在敲下第一行实现代码前，先思考如何设计一个“好相处”的接口。

本机暂存

IT 后端/ 2014-12-30 12:32:49 / 累计浏览 4,053

多线程下的fork及写时复制导致的性能问题

这篇讲的是贴吧在将服务从PHP-FPM迁移到HHVM（多线程模型）后，遭遇CPU使用率异常飙升的故障排查过程。问题的根源在于，程序中某个基础库调用exec执行shell命令时，会先fork进程。由于HHVM是多线程架构，其他线程在fork期间的内存写入，会频繁触发Linux内核的“写时复制”机制，导致大量不必要的内存拷贝，从而耗尽CPU资源。作者详细剖析了写时复制的工作原理，指出在单进程模型（如PHP-FPM）下，fork后立刻exec的场景几乎不会触发复制，效率很高。但在多线程环境中，共享的地址空间让这一优化失效，成为了性能杀手。为了解决这个问题，HHVM采用了一个巧妙的方案：提前创建一个代理进程池。当需要执行外部命令时，主线程通过管道将任务分派给处于单线程环境的代理进程，由后者去完成fork/exec操作。这样就将可能引发写时复制的操作，安全地隔离在了独立进程中，从根本上规避了性能陷阱。文章从实战故障出发，清晰揭示了多线程与操作系统机制交互时容易被忽视的深水区问题。

本机暂存

IT 后端/ 2014-12-30 12:29:21 / 累计浏览 12,660

HashMap解决hash冲突的方法

这篇讲的是 HashMap 如何巧妙处理哈希冲突。作者直接从 put 方法的源码切入，展示了当不同 key 通过哈希算法映射到同一个数组索引（即“桶”）时，HashMap 采用的“链表法”解决方案。核心思路很清晰：当发生冲突时，新的键值对并不会替换旧的，而是像插入单链表一样，通过 `addEntry` 方法被添加到该桶的链表头部。文章特别指出，这个新插入的 Entry 对象会指向原先位于该桶的 Entry，从而形成一条单向链表。这就解释了为什么在冲突严重时，get 操作会从直接定位退化为需要遍历链表，最坏情况下复杂度会达到 O(n)。文章还点出了一个关键的设计权衡——负载因子。默认的 0.75 是空间与查询效率之间的折中：过大会节省内存但查询变慢，过小则查询更快但更耗内存。总的来说，这篇分析没有停留在概念层面，而是通过源码把链表如何形成、负载因子如何影响性能这些细节讲透了，适合想弄懂 Java 集合框架底层原理的开发者阅读。

本机暂存

IT 数据库/ 2014-12-30 12:28:16 / 累计浏览 3,416

SSDB源码分析 – 主从和多主同步原理解析

作者深入SSDB的内核，解析其主从与多主同步的设计哲学。核心思路是将主节点的所有写操作（Binlogs）在从节点重放，这与MySQL类似，但SSDB通过自动化解决了基础数据拷贝的痛点。整个同步流程分为两个核心阶段：首先是**COPY状态**，此时从节点会像遍历链表一样自动复制主节点的全量数据。在此期间产生的新写入，会根据其在数据链表中的位置决定是立即同步还是留待后续处理。当游标移动到末尾，流程无缝进入**SYNC状态**，实现毫秒级的实时增量同步。文章巧妙之处在于对细节的剖析：例如，通过为Binlog编号实现断点续传，并解释了`slaveof.type`配置为`mirror`是防止多主死循环的关键。它还澄清了一个常见误解——`slaveof.id`标识的是目标数据库而非物理机器，这使得数据迁移后同步关系能自动保持。对于理解分布式存储的同步机制，或是面临具体配置问题的开发者来说，这篇从实现细节出发的分析提供了清晰的路线图。

本机暂存

IT 前端/ 2014-12-30 12:27:21 / 累计浏览 1,876

消除JavaScript闭包的一般方法

这篇讲的是JavaScript闭包作为“被动解决方案”时的替代思路。作者指出，虽然闭包常被用于封装私有状态，但有时它源于语言本身的限制，导致代码结构难以扩展。文章对比了两种处理“变量只初始化一次”这类需求的方法：一种是常见的闭包写法（立即执行函数创建私有变量），另一种则是作者推荐的“消除闭包”写法——通过构造函数和`this`引用来组织状态与方法。核心差异在于可扩展性：当需要为同一状态添加新操作时，闭包写法往往需要重写或嵌套更复杂的结构，而基于构造函数的方式只需简单添加新方法，更接近线性扩展。作者强调，虽然闭包在特定场景下依然有用，但面对需要后续维护或扩展的需求时，考虑“消除闭包”的模式能减少不必要的重构，让代码更清晰、更易迭代。对于日常开发中那些因语言特性而“不得不”使用闭包的场景，这提供了一种更面向未来的写法选择。

本机暂存

IT 算法/ 2014-12-30 12:22:52 / 累计浏览 14,280

无锁消息队列

这篇讲的是如何在共享内存中设计高效的无锁消息队列。作者从实际项目需求出发——为了将耗时的数据落地任务从主逻辑进程中剥离，以提升整体处理能力——提出了用无锁队列替代频繁系统调用的方案。文章的核心是从简单到复杂，逐步推演无锁队列的设计。首先探讨了最基础的单生产者与单消费者场景，仅需维护 front 和 rear 指针，利用循环队列即可高效工作。接着，为解决多消费者并发出队的问题，引入了 CAS（Compare & Set）原子操作来安全地更新指针。最后，在多生产者多消费者的最复杂场景下，通过增加一个 write_index 变量，结合两次 CAS 操作来协调生产者之间的写入竞争，确保了数据一致性。文章结合具体图示和伪代码，清晰地阐述了不同并发模型下的实现关键与细微差别，例如利用 CAS 实现“乐观锁”，以及在生产者操作失败时通过 sched_yield() 让出 CPU 的优化技巧。作者在项目中实际应用了其中一种设计，最终观察到 CPU 使用率下降了约10%，验证了该方案的有效性。

本机暂存

IT 安全/ 2014-12-30 12:20:27 / 累计浏览 10,277

SSL证书的分类（按功能）

这篇文章系统地梳理了SSL证书的六大分类，从最基础的DV域名型证书到企业级的OV、EV增强型证书，再到功能扩展的通配符、多域名及强制加密证书。它清晰地对比了各类证书在验证严格程度、包含信息、颁发周期和价格成本上的核心差异。例如，DV证书仅验证域名所有权，一两小时内即可签发，适合个人或中小网站快速启用加密；而OV和EV证书则需严格的企业身份审查，其中EV证书还会在浏览器地址栏直接显示公司名称，为金融机构等高要求场景提供最高级别的信任标识。对于拥有多个子域名或不同顶级域名的企业，通配符证书和多域名证书则分别提供了“一张证书保护所有子站”和“统一管理多个域名”的高效解决方案。文章不仅解释了技术定义，更通过适用对象的罗列，让读者能根据自身网站的性质、规模和安全需求，快速定位到最合适的证书类型，具有很强的实操参考价值。

本机暂存