最新文章

采集自各技术站点的近期文章。

IT 数据库/ 2011-07-18 23:31:26 / 累计浏览 2,611

MySQL daemon plugin example

这篇讲的是作者如何通过一个具体的示例来展示MySQL daemon插件的开发过程。作者从实际需求出发，旨在帮助读者理解插件架构的核心原理，解决数据库功能扩展中的常见挑战，比如添加

本机暂存

IT 数据库/ 2011-07-18 23:30:42 / 累计浏览 2,527

这篇讲的是作者如何为一个长期需要维护的MySQL系统简化添加服务器状态变量的过程。以往要新增一个监控指标，需要深入MySQL源码找到合适位置，手动编写状态变量的定义、初始化、刷新逻辑等多个步骤，然后重新编译整个服务——这个过程繁琐、容易出错，且每次修改都可能影响稳定性。作者从一个具体需求出发，发现MySQL的插件（plugin）架构本身就能动态注册状态变量。文章详细拆解了核心实现：通过实现`Plugin_status_variable_provider`接口，插件可以在启动时向服务器“上报”自己定义的状态变量。文中对比了两种方式，手动编码需要改动多达7处源码文件，而插件方式只需在插件的初始化函数中集中声明变量、编写获取逻辑即可。实际效果上，插件方案将添加状态变量的操作从一项需要谨慎处理的“工程”简化为了一个独立的模块开发。新指标可以随插件动态加载，无需重启数据库，开发和调试效率显著提升。对于需要频繁监控特定指标的运维和开发人员来说，这个思路提供了一个更优雅、更可维护的解决方案。

本机暂存

IT 前端/ 2011-07-18 23:29:27 / 累计浏览 4,563

纠结的翻页设计

这篇讲的是在产品设计中常常让人纠结的“翻页”问题。作者从一个最基本的问题“什么时候需要翻页”出发，深入对比了采用翻页与不采用翻页（如无限滚动）两种模式的关键差异。文章没有停留在理论，而是结合了具体场景来分析：面对海量数据集，翻页能清晰展示位置并方便跳转，但增加了操作步骤；而无限滚动沉浸感强，适合探索和发现，却可能让用户迷失位置，并给前端性能带来挑战。作者特别提到了在移动端小屏和PC端大屏上，用户对这两种模式的感知和操作习惯有显著不同。此外，文章还探讨了实时更新的数据流（如社交媒体时间线）与相对静态的归档数据（如搜索结果）对翻页设计的不同诉求。结论并非二选一，而是引导读者根据数据规模、交互目标和性能约束来做出权衡。最后，文章提供了一些实践中的折中方案，比如分页与加载更多的结合，为具体设计提供了可落地的思路。

本机暂存

IT 后端/ 2011-07-18 23:28:37 / 累计浏览 9,112

解决 nginx 反向代理网页首尾出现神秘字符的问题

这篇讲的是一个隐蔽的nginx反向代理“副作用”：一台内网的MediaWiki服务器通过nginx代理对外提供服务时，所有返回404状态码的页面，HTML内容的头部和尾部都出现了额外字符——头部是几位随机的16进制数（如“355b”），尾部总是多出一个“0”。这个问题很奇怪，因为正常页面完全正常，且直接通过Apache访问原始服务器时也不会发生。作者定位到问题的根源：nginx在向后端请求失败（如404）时，会默认启用一种“错误页面截断”机制来简化响应，但这意外地破坏了内容的完整性。解决方法其实并不复杂：在nginx配置中显式关闭`proxy_intercept_errors`，或者为404等错误状态码配置专门的、干净的错误页面，从而阻止nginx对后端返回的原始内容进行任何“处理”。这对于使用反向代理且注重页面内容完整性的开发者来说，是一个值得注意的配置细节。

本机暂存

IT 算法/ 2011-07-18 23:27:49 / 累计浏览 1,963

调研问卷中多选题的分析方法探讨（3）

这篇系列文章的第三部分聚焦于问卷调查中多选题分析方法的深度剖析。作者从多选题数据本身的复杂性出发，系统性地探讨了几种关键的分析思路。文章详细对比了常见的分析方法，例如“多重应答分析”如何直接呈现每个选项的被选频率，以及“交叉分析”结合其他变量（如年龄、性别）时，如何揭示不同群体的选择偏好差异。文中还提到了“对应分析”这类可视化方法，它能直观展示多选题选项与其他分类变量之间的潜在关联。作者并未止步于方法介绍，而是结合实际案例，阐释了不同方法的适用场景与局限。例如，在探索选项间关联时，对应分析比简单的频次对比能提供更深入的洞察；而在需要精确检验差异显著性时，又需借助特定的统计检验。文章强调，选择何种方法，取决于分析目的——是单纯描述分布，还是挖掘深层关系。对于需要从问卷数据中提炼有效信息的研究者而言，这篇文章清晰地梳理了工具箱中的不同工具，帮助大家在面对多选题时，能根据具体目标选择最恰当的分析路径，避免方法误用或分析浅尝辄止。

本机暂存

IT 安全/ 2011-07-18 23:25:38 / 累计浏览 2,634

谈谈 Google+

这篇文章记录了作者早期使用 Google+ 的真实体验。背景是 Google+ 刚正式发布，作者在因故错过首批尝试后，赶在重新开放时成为了早期用户。作者的核心发现集中在社交关系的建立效率上。在短短数天内，他就在平台上与近100位朋友建立了联系，并被超过1000次“圈入”。这个数字让他感到意外，因为与他其它社交平台的数据形成了鲜明对比——他在 Twitter 上关注的人不到30位，豆瓣好友也不足50人，他通常只添加相熟的人。这种高效的社交连接，尤其值得注意的是发生在该服务迅速被“GFW认证”的访问限制背景下。作者没有进行深入的理论分析，而是通过这个具体的、略带讽刺意味的数据事实，让读者直观感受到 Google+ 在产品初期所具有的强大吸引力和传播力，也反映了当时用户对于高质量新社交平台的迫切需求。

本机暂存

IT 后端/ 2011-07-18 23:21:24 / 累计浏览 2,785

从同步到异步，从匿名到实名

这篇讲的是作者从完成一本正则表达式技术书稿后的反思出发，结合自己从1997年至今超过二十年的上网亲历，提出对网络发展的两个核心趋势观察。文章并非技术分析，而是一篇带有个人史色彩的散记。作者指出，早期的互联网更像“同步”工具（如IRC、早期论坛），要求参与者同时在线；而如今则彻底转向“异步”（如微信、微博、播客），信息可以自由异时传递。第二个趋势则从“匿名”走向“实名”——早期网络社区的匿名文化，与如今需要绑定手机号、鼓励实名认证的主流平台形成鲜明对比。作者认为，这两个转变深刻地重塑了网络的气质、交流方式乃至社会结构。这篇文章的价值在于，它用具体而微的个人体验串联起技术变迁的大历史，为我们理解当下数字生活提供了一个清晰而感性的坐标系。

本机暂存

IT 设计/ 2011-07-18 23:18:58 / 累计浏览 3,327

韩国三大门户的基础设计

这篇讲的是韩国三大主流门户——Naver、Daum（现为Kakao的前身之一）和Nate的基础设计剖析。作者并非罗列所有功能，而是聚焦于它们各自的设计哲学与界面逻辑如何反映不同的用户需求与市场定位。核心对比在于三者对“信息效率”与“探索体验”的权衡。Naver以极度紧凑的搜索框和模块化信息网格为核心，强调一站式解决问题的效率，其设计服务于将用户留在自有生态内的强大意图。Daum则在早期呈现出更偏向内容消费的布局，信息流的密度和排列更强调叙事与发现，带有社区门户的痕迹。而Nate，特别是其标志性的“Cyworld”社交板块集成，则展示了如何将强关系链深度融入门户界面，设计完全围绕社交互动展开。这种设计差异背后，是各自起家的业务根基（搜索、内容、社交）在用户界面上的直接投射。文章通过具体的页面结构、导航逻辑和内容模块排布，揭示了“基础设计”并非单纯审美选择，而是公司战略、核心业务与目标用户画像共同塑造的结果。对从业者而言，这提醒我们界面架构是产品基因的延伸，理解根源才能做出更有意图的设计决策。

本机暂存

IT 设计/ 2011-07-18 13:41:48 / 累计浏览 3,962

设计模式速查手册-创建型

这篇讲的是创建型设计模式的一份“速查手册”，它的独特之处在于用 Is & Is Not 的对比框架来厘清每个模式的核心。作者没有从 UML 类图或复杂定义入手，而是直击要点：这个模式是什么，尤其强调它“不是什么”。比如，它区分了简单工厂、工厂方法与抽象工厂的适用边界，也点明了单例模式并非全局变量的代名词。这种清晰的对比能帮开发者在面对具体需求时，快速排除不合适的选项，找到最匹配的模式。文章把抽象的概念转化成了决策工具，让查阅过程变得更高效。

本机暂存

IT 前端/ 2011-07-18 13:40:39 / 累计浏览 2,250

关于JavaScript中Function Declaration与Function Expression的进一步说明

这篇不是重复基础概念，而是从几个常见误区和实际使用中的细微差别入手，深入辨析了 JavaScript 里函数声明与函数表达式的本质区别。作者详细拆解了两者在作用域、变量提升、严格模式下的行为差异，并特别指出了函数表达式（尤其是匿名函数）可能带来的内存回收考量。文章的核心价值在于它指出了那些容易在项目代码中形成“坑”的场景。比如，在条件判断中动态定义函数时，由于提升规则不同，函数声明与函数表达式的行为会截然不同；再比如，在立即执行函数、递归调用或作为对象方法的回调时，选择哪种形式会直接影响代码的可靠性和可维护性。作者还对比了各自更适合的场景：函数声明因其可读性和提升特性，适合在模块顶层定义；而函数表达式则在模块模式、动态生成函数或需要避免污染全局作用域时更为灵活。最后，文章强调了理解这些差异并非学究式的纠结，而是编写更健壮、更易于调试的 JavaScript 代码的基础。它能帮助开发者在面对复杂逻辑时，下意识地做出更合适的选择，避免因混淆两者而导致的隐蔽错误。

本机暂存

IT 后端/ 2011-07-18 13:38:04 / 累计浏览 3,223

浅谈PHP5中垃圾回收算法(Garbage Collection)的演化

这篇讲的是PHP5垃圾回收机制如何从基础的引用计数，进化到能有效处理循环引用的成熟算法。文章清晰地勾勒了这条技术演进路径。作者首先指出了PHP早期完全依赖“引用计数”进行内存回收的局限性——它无法解决对象之间循环引用导致的内存泄漏问题。这是PHP在长期运行中可能出现内存无限增长的关键症结。接着，文章的核心转向了PHP5.3版本引入的“循环回收算法”。这个新算法并非取代引用计数，而是作为一个巧妙的补充。它通过在特定时机遍历并检查复杂的数据结构，能够发现那些引用计数不为零但实际已无用的循环引用结构，并将其释放。文章没有停留在理论层面，而是结合了PHP的变量容器（zval）和根缓冲区（root buffer）的实现细节，让读者能理解新算法是如何与现有机制协同工作的。这种演化体现了PHP语言在稳定性和性能优化上的务实思考。了解这段历史，能帮助开发者更深刻地理解PHP的内存管理行为，并在编写涉及复杂数据结构的代码时，对潜在的内存问题有更清醒的认识。

本机暂存

IT 算法/ 2011-07-18 13:37:42 / 累计浏览 2,682

程序设计中的计算复用(Computational Reuse)

这篇讲的是计算复用——一个通过“记住结果”来避免重复劳动的编程思想。作者从斐波那契数列这个经典例子切入，直观对比了三种计算方式：朴素递归的指数级时间复杂度，记忆化（Memoization）的显著提速，以及动态规划（Dynamic Programming）的自底向上最优解。文章的核心并非仅仅讲解算法，而是以它为透镜，阐释“计算复用”这一更通用的模式。它清晰地指出，在计算资源有限的现实世界中，单纯追求代码的优雅或直观是不够的，我们必须有意识地在“用空间换时间”和“设计更优的计算路径”之间做出权衡。这种思想不仅适用于算法竞赛，更是优化任何有大量重复计算场景（如前端渲染、数据库查询）的关键。最后，文章将计算复用与“抽象”和“设计模式”进行了有启发的类比。它告诉我们，优秀的程序员不仅是在写代码，更是在设计一个高效、可复用的“计算过程”。这种从具体代码上升到通用思想的视角，能帮助我们在面对复杂系统时，更主动地去寻找和设计其中的复用机会。

本机暂存

IT 后端/ 2011-07-18 13:36:53 / 累计浏览 11,198

Nginx模块开发入门

这篇讲的是如何从头开始为Nginx编写自定义模块。作者从Nginx模块化架构的背景出发，拆解了模块开发中最核心的几个要素：模块配置结构体、指令定义以及处理函数（handler）的编写逻辑。文章没有停留在理论层面，而是通过一个具体的计数器模块示例，演示了从定义指令、处理配置到实现业务逻辑的全流程，并展示了如何将模块编译进Nginx。其中比较巧妙的地方在于，作者解释了如何利用Nginx的链表结构来管理模块配置，并强调了在handler中注意内存池使用和请求体读取的关键细节，这能帮助新手避开常见的坑。文章还对比了content filter和log handler等不同类型模块的适用场景，让读者知道在什么情况下该选用哪种开发模式。整体来看，这篇文章把模块开发的骨架清晰地勾勒了出来，对于想动手实践的开发者来说，跟着走一遍流程，就能对Nginx的模块化设计有更直观的理解。

本机暂存

IT 前端/ 2011-07-18 13:35:39 / 累计浏览 3,423

使用SeaJS实现模块化JavaScript开发

如何优雅地管理JavaScript的依赖关系？这篇文章讲的是，很多前端开发者都曾被“依赖地狱”困扰——文件之间关系混乱，一个页面加载的JS文件顺序常常让人头疼。作者从这个普遍痛点出发，介绍了SeaJS这个工具。 SeaJS是一个严格遵循CommonJS规范的模块化加载框架。它的核心思想很简单：把每个JS文件看作一个“模块”，通过清晰的模块定义和依赖声明，让SeaJS自动处理它们之间的加载关系。与jQuery等专注于功能扩展的框架不同，SeaJS只专注于解决模块化和加载问题，因此能与它们完美共存。具体来说，使用SeaJS后，你可以用define来定义一个模块，用require来声明需要依赖的其他模块。SeaJS会像一位耐心的管家，自动帮你理清所有的依赖链条，按需、按序加载模块。你再也不用手动维护一长串的script标签了。最终的效果是，前端工程师可以从繁重的文件管理和依赖处理中解放出来，将精力真正聚焦于代码逻辑本身。代码变得模块化、结构清晰，无论是编写还是后续维护都变得更加轻松。

本机暂存

IT 前端/ 2011-07-18 13:34:43 / 累计浏览 2,473

在SeaJS中实现html模板文件的加载（Temod介绍）

这篇讲的是在SeaJS这类模块加载器中，如何优雅地加载HTML模板文件。作者从实际开发中的一个痛点出发：当页面组件化后，模板分散在各个HTML文件里，用SeaJS加载它们却并非易事，往往需要借助异步请求再手动插入DOM，流程繁琐。文章重点介绍了Temod这个小而巧的工具。它的核心思路是通过约定文件路径和扩展名（如.html），让模板文件能像JS模块一样被SeaJS直接require和管理。这样一来，开发者就能用熟悉的模块化方式来组织模板，避免了额外的请求封装和状态处理代码。这种方案的巧妙之处在于，它没有对SeaJS本身做侵入式修改，而是利用了其现有的加载机制，以约定代替配置，极大简化了多模板场景下的开发和维护。最终，它把海水分成一滴滴易于管理的小水滴，让前端的模块化管理更加彻底。

本机暂存

IT 数据库/ 2011-07-18 12:45:29 / 累计浏览 5,772

MySQL索引背后的数据结构及算法原理

这篇文章深入探讨了MySQL索引底层的数据结构选择，特别是为什么B+树成为了主流。作者从磁盘IO的物理特性出发，解释了为何需要平衡树结构，并逐步推演出B+树的精巧设计：通过多层索引减少磁盘读取次数，叶子节点形成有序链表以高效支持范围查询。文章对比了B+树、B树、哈希索引等不同结构的关键差异，清晰指出哈希索引仅适合等值查询，而B+树在范围查询和排序上具有压倒性优势。在阐述原理的同时，文章也关联了实践，比如分析了为什么InnoDB引擎选择B+树作为聚簇索引的结构，以及如何通过页分裂来维持树的平衡。这些内容帮助读者理解，一个高效的索引不仅是“被创建”出来的，更是底层数据结构与算法权衡的结果，这对于后续的索引优化和慢查询诊断提供了扎实的理论基础。

本机暂存

IT 前端/ 2011-07-18 12:31:22 / 累计浏览 2,458

用In.js颗粒化管理、加载你的Javascript模块

这篇讲的是前端开发者面对日益增长的性能优化需求，如何用 In.js 来颗粒化管理 Javascript 模块的加载。文章从当前前端开发的痛点切入——页面加载速度直接影响用户体验，而传统的同步加载 JS 方式会阻塞页面渲染。作者指出，为了解决这个问题，异步加载与无阻塞加载技术成了研究热点，而 In.js 提供的颗粒化管理正是一个值得关注的实践方向。文章具体展示了如何利用 In.js 将大型 JS 文件拆解成更小的模块单元，实现按需、异步加载。核心思路在于避免一次性加载所有资源，而是只在真正需要时才加载对应的模块，从而显著减少初始页面加载时间。这种颗粒化的思路不仅能提升加载性能，也使得模块依赖管理变得更加清晰。作者可能还对比了 In.js 与其他方案（如 CommonJS 或 AMD）在加载粒度和灵活性上的区别。对于希望精细控制前端资源加载流程、优化复杂单页应用性能的团队，这种方法提供了可落地的技术路径。最终，文章落脚于实际开发中的效率与性能平衡，给出了模块化管理在真实项目中的效果参考。

本机暂存

IT 后端/ 2011-07-18 12:27:35 / 累计浏览 3,537

Restlet框架解读-2

这篇讲的是Restlet这个Java REST框架的内部构造。作者没有停留在基础的API使用上，而是直接带领读者“走进机房”，从代码结构入手进行剖析。具体来说，文章聚焦于Restlet框架的核心组件是如何组织与交互的。它拆解了框架的关键模块，展示了诸如Engine、Application、Router这些核心对象的职责划分，以及它们之间如何协作来完成一次从请求到响应的完整生命周期。这种“解剖麻雀”式的分析，让读者能直观理解一个成熟的REST框架在设计上如何做到层次分明与松耦合。对于想从“会用”进阶到“理解”的开发者而言，这种源码级的梳理尤其有价值。它揭示了框架设计者在解决通用性、可扩展性这些经典问题时的思考与取舍，能帮助我们在自己的项目设计中获得直接的启发。

本机暂存

IT 后端/ 2011-07-18 12:27:15 / 累计浏览 4,133

Restlet框架解读-1

这篇讲的是Restlet框架如何将REST架构风格落地为具体的Java实现。作者跳过了REST的基础概念，直接从框架的核心设计切入，解释了Restlet如何用统一的抽象模型（如Restlet、Application、Component）来映射HTTP协议中的请求、响应以及资源处理流程。文章重点剖析了框架中“表示”与“资源”分离的巧妙设计，以及如何通过ServerResource和ClientResource这两个核心类，让开发者可以用极简的代码完成复杂RESTful服务的构建与调用。对于希望深入理解REST实现原理的开发者而言，文中对Restlet管道机制和状态管理过程的拆解提供了清晰的思路，展现了框架如何将理论概念转化为可操作的代码结构。

本机暂存

IT 数据库/ 2011-07-18 12:24:02 / 累计浏览 2,421

关于tokyocabinet的memory db 的filesize与使用内存的关系

这篇讲的是作者在实际使用Tokyo Tyrant/Tokyo Cabinet的内存数据库（Memory DB）时，深入探究了一个容易被忽略但至关重要的参数：`filesize`。他并没有停留在表面的配置介绍，而是从一个实际问题出发——在特定使用模式下，观察到了非预期的内存占用增长现象。作者通过具体的测试和观察，详细拆解了`filesize`参数在内存DB中的真实角色。它并非直接控制内存使用，而是决定了内存映射文件的大小，这个文件作为数据在磁盘上的持久化备份。关键在于，当这个文件被创建后，系统可能会通过内存映射机制预留相应的虚拟地址空间，从而在监控工具中显示为较高的内存占用。文章清晰地区分了“物理内存消耗”与“虚拟内存占用”这两个概念，并给出了不同`filesize`设置下的观察数据。文章的结论很有实用价值：对于纯内存使用且不关心数据持久化的场景，可以将`filesize`设为一个很小的值以避免不必要的内存映射开销；而如果需要兼顾持久化，则需理解其对内存监控的影响，并根据数据量合理设置。这为在生产环境中调优Tokyo Cabinet内存数据库提供了非常具体的配置依据。

本机暂存