idea's blog -- IT技术博客大学习 -- 共学习共进步！

首页 / idea's blog

IT 2021-06-13 22:41:22 / 累计浏览 2,820

分布式系统升级所遇到的问题

分布式系统升级的一大痛点是无法像单机软件那样“原子化”完成。升级期间新旧版本长期共存，如果新版本引入了数据格式变更，旧版本无法识别新格式，就会导致服务报错。特别是“向前兼容”（旧版本兼容新数据）几乎无法实现。作者提出了一个经典的“中间版本”策略来化解这个困局。核心思路是设计一个特殊的中间过渡版本：它既能识别未来的新数据格式，又不会产生新格式数据。升级分两阶段进行：先将所有节点升级至中间版本，此时没有新格式数据产生，因此无兼容问题；等全部就绪后，再将中间版本升级至最终版本，新旧格式共存也能被新版本识别。这样，通过引入一个精心设计的“桥梁”版本，就将复杂的向后兼容问题，转化为两个相对简单的、可逐步滚动执行的阶段，从而在完全不停服的前提下，实现了版本的平滑过渡。这个方案为解决分布式系统中的类似版本演进问题提供了一个清晰的范式。

本机暂存

IT 2021-06-13 22:34:06 / 累计浏览 2,580

可靠通信的三条基本定理

这篇讲的是可靠通信背后必须遵循的三条基本定理，以及如何用它们指导系统设计。作者认为，广义的可靠通信必须满足不丢包、不重复、完整性这三个要求，而对应的解决方案分别是确认与重传、排队（串行化）、单点标记或自校验。文章澄清了一个常见误区：去重问题的根源在于操作需要排队，即使采用全局位图方案，对位图的操作本身也需排队，而像CAS这样的实现，其内部本质也是排队。这些定理并非空谈，文章通过实例展示了其强大的解释力。例如，TCP的可靠性正是因为它遵循了这三条定理：序号机制实现了排队，超时重传机制兜底处理丢包，checksum则保证了数据完整性。再比如，在线商店的库存超卖问题，本质上是一个需要排队的去重问题；而订单与支付两大独立系统之间的数据一致，则依赖于定理一（确认与重传）来保证不丢包。作者的核心观点是，实际问题千变万化，但可靠的系统设计必须回归到这三条基础定理上。它们提供了最根本的讨论框架和判断标准：符合定理的设计方案才是可靠的，否则就存在隐患。理解这些基础模型，是构建正确、健壮系统的理论前提。

本机暂存

IT 2021-05-26 22:46:03 / 累计浏览 1,860

Raft 为什么不能直接 commit 前任的日志?

这篇讲的是 Raft 共识协议中一个容易被忽略但至关重要的设计细节：为什么 Leader 不能直接提交前任任期的日志，而必须通过提交本任期的新日志来“隐式”提交。作者从 Raft 的几项基本原则出发，进行逻辑推演。他指出，一旦日志被 commit，对状态机的影响就不可撤销；而未 commit 的日志则可能被同一 index 不同 term 的新日志替换。核心目标是让所有节点最终提交相同的日志。问题在多个 Leader 交替时浮现。例如，前两任 Leader 针对同一 index 产生的日志均未形成多数派，第三任 Leader 可能继承其中任一个，这就会导致另一条日志被替换。文章强调，只有 commit 自己任期的日志才能确保它“永不丢失”。这是因为现任 Leader 永远不会撤销自己任期的日志，且新当选的 Leader 一定包含上一个任期多数派中的最新日志。因此，确认本任期日志已复制到多数节点，就能保证它被所有后续 Leader 继承。这个推理解释了 Raft 论文中反例背后的深层原理，揭示了“隐式提交”机制是如何在日志可能被覆盖的复杂场景下，依然坚定地维护日志一致性的。

本机暂存

IT 2016-05-12 12:52:32 / 累计浏览 2,840

一个 GUI 系统的组成部分

这篇文章从作者开发 iOS 上的 XML+CSS UI 布局框架 CocoaUI 的切身实践出发，探讨了构建一个现代 GUI 系统所需的基石。作者首先犀利地指出了 iOS 与 Android 在界面体验上的差距，认为其根源很大程度在于底层的软件技术，尤其是字体渲染。他推崇苹果在高分辨率屏幕上锐利的渲染技术，并直言某些虚化技术带来的粗糙感。随后，文章系统性地梳理了自建一个 GUI 系统至少需要的六大核心模块：从最基础的 Core Text（字体渲染）和 Core Graphics（2D 图形引擎），到赋予界面生命力的 Core Animation（动画）和 Event Handling（事件处理），再到支撑智能设备的 Core Audio/Video（多媒体）与 WebKit（浏览器引擎）。作者认为，字体技术的长期积累是重中之重。最后，作者以自己的 CocoaUI 框架为例，介绍了如何利用类 Web 的 HTML+CSS 技术进行界面布局，将界面描述与逻辑编程分离，避免了用 XML 进行“编程”的误区。整篇文章是作者对 GUI 技术栈的深入思考与经验总结。

本机暂存

IT 2016-05-12 12:50:58 / 累计浏览 2,780

有追求优秀之心的程序员

这篇文章从一条引发热议的微博出发，探讨了当下程序员群体中基础能力参差不齐的现象。作者指出，行业门槛降低使得许多仅能“完成任务”的个体进入，但这并不应成为放弃专业追求的理由。文章的核心观点是，区分“普通”与“优秀”程序员的关键，在于是否具备“追求优秀之心”。作者以面试者连冒泡排序都不会写为例，强调基础逻辑思维的重要性。优秀的程序员不仅能实现功能，更擅长进行业务抽象，通过合理的技术选型确保系统在苛刻条件下依然准确可靠。最后，文章鼓励那些理解程序内在、能进行逻辑抽象的程序员，应当认识到自己的稀缺性与价值，相信自己“出身高贵”，理应获得更好的回报。整篇文章在技术讨论中，传递了关于职业尊严与自我期许的思考。

本机暂存

IT 2016-05-05 13:04:35 / 累计浏览 920

Mac远程ssh出现LC_CTYPE错误的解决

这篇讲的是用 Mac 终端 SSH 到 Linux 服务器时，总弹出 `-bash: warning: setlocale: LC_CTYPE: cannot change locale (UTF-8)` 的烦人提示。很多人第一反应是去服务器端改 locale 配置，但发现改了也没用。文章点破了关键：问题的根源其实在 Mac 本地。因为 SSH 连接时，Mac 会自作主张地把本地的 `LANG` 和 `LC_*` 环境变量“发送”给远程服务器，覆盖了服务器自己的设置。所以，无论服务器怎么配置，只要 Mac 发了个它不支持的 locale，这边就会报错。解决方案非常直接：在 Mac 的 `/etc/ssh_config` 配置文件里，找到 `SendEnv LANG LC_*` 这一行，把它注释掉。这样 SSH 连接时就不会再把本地的 locale 变量传过去了，警告自然消失。对于经常跨 Mac 和 Linux 环境工作的开发者来说，这个小技巧能立刻还你一个清静的终端。

本机暂存

IT 2016-04-05 13:47:42 / 累计浏览 2,660

Nginx配置$request_uri与$uri变量的区别

这篇讲的是在Nginx配置中两个极易混淆的变量：$request_uri 与 $uri 的核心区别。文章从一个实际现象出发：浏览器请求同一个地址，这两个变量的值却可能不同。关键差异在于它们代表的“时间点”。$request_uri 记录的是客户端发起请求时最原始的路径与查询字符串，比如 /my/act?a=1，是“未处理”的状态。而 $uri 则是Nginx处理请求后，最终定位到服务器上资源的路径，比如经过rewrite规则变成 /dir/file.php，它不包含查询参数。文章特别指出，$request_uri 这个名字本身容易造成误解，因为按标准定义，URI并不包含查询字符串，但它却包含了。理解这个区别至关重要：当你需要记录或匹配客户端最初的原始请求时，应使用 $request_uri；而当你需要基于经过内部重写后的实际资源位置进行逻辑判断或记录日志时，则应使用 $uri。搞混两者可能导致rewrite规则失效或日志记录不准确。

本机暂存

IT 2016-03-23 13:47:39 / 累计浏览 4,580

在Mac上删除Google的流氓软件

这篇讲的是Mac用户可能从未留意过的一个隐蔽问题——谷歌的自动更新代理（GoogleSoftwareUpdateAgent）会在后台静默运行，即便你的电脑上没有安装任何谷歌软件。作者从Mac的Console系统日志入手，展示了该进程如何定期执行更新检查，并通过一行Terminal命令教会读者如何自查是否已被“感染”。问题的核心在于，谷歌的这个组件会随某些应用静默安装，并常驻系统后台。对于注重隐私和系统洁净度的用户而言，这种不请自来的常驻服务无疑是一种困扰。文章不仅揭示了现象，更给出了直接、有效的终端卸载命令，帮助用户彻底移除这个“不速之客”。通过这个具体案例，文章提醒我们：一些主流软件的附属组件可能会在用户不知情下获得系统权限并持续运行。定期审视系统后台进程，是维护电脑健康的一个好习惯。

本机暂存

IT 2016-03-01 23:45:37 / 累计浏览 3,380

PHP 用 curl 读取 HTTP chunked 数据

这篇讲的是在PHP中使用curl处理流式HTTP chunked数据时，遇到的一个实际坑点与解决方法。当需要实时处理服务器推送的每个数据块（比如对接icomet这类服务）时，开发者自然想到使用`CURLOPT_WRITEFUNCTION`回调。但实际会发现，一个逻辑上的chunk数据，回调函数可能会被多次触发，每次只收到大约16k的片段，破坏了数据的完整性。文章指出了问题的根源：curl底层传输机制导致回调被分割，而非按应用层chunk边界返回。作者给出的解决方案巧妙且实用：在回调函数内维护一个静态缓冲区，将每次收到的片段拼接起来，并以特定分隔符（如`\n`）为界进行分割，确保每次只处理一个完整的应用层数据块。这种方法兼顾了实时性与数据完整性，是处理此类流式接口时一个值得借鉴的细节技巧。

本机暂存

IT 2016-03-01 23:45:03 / 累计浏览 1,800

Objective-C 对二进制数据 NSData 进行 URL 编码

这篇讲的是 Objective-C 开发者在处理二进制数据时常遇到的一个痛点：如何将 NSData 对象进行 URL 编码。作者指出，许多号称 Unicode 友好的语言在内存操作上往往表现笨拙，他以 PHP 为例，赞赏其将字符串与二进制统一处理的灵活性。相比之下，Objective-C 的标准库函数如 `CFURLCreateStringByAddingPercentEscapes()` 只能处理字符串，无法直接作用于 NSData，这被认为是“不把字符串当二进制”的弊端。为此，作者提供了一个自定义的解决方案：编写一个简单的 C 函数，通过逐字节遍历 NSData，判断每个字符是否属于安全字符（字母、数字及部分符号），否则将其转换为对应的 `%XX` 百分比编码格式，最终拼接成完整的编码字符串。这个实现思路清晰直接，巧妙地避开了系统函数的限制，为需要直接处理原始二进制数据进行 URL 传输的场景提供了实用参考。

本机暂存

IT 2016-02-16 20:38:37 / 累计浏览 1,680

CSS 样式规则的匹配算法实现

这篇讲的是移动端开发中的一个具体问题：如何在自定义框架里，让CSS选择器像在浏览器中一样准确地匹配到UI控件。作者从自己开发的iOS CSS布局框架CocoaUI出发，拆解了其中CSS样式规则匹配算法的实现。文章把核心放在了数据结构和匹配逻辑上。它定义了一个包含选择器数组的样式对象，并为其实现match方法。有趣的是，实现时并没有按照我们阅读CSS从左到右的习惯，而是采用了从右到左的顺序进行匹配。这种倒序匹配有一个高效的关键点：先判断“关键元素”（即最右边的选择器）是否与目标节点匹配。如果不匹配，则整个规则立即失效，省去了不必要的遍历。匹配成功后，再依次向左，让目标节点的祖先节点与剩余选择器进行比对。整个过程在遇到节点树顶端或所有选择器都匹配完成时终止，清晰高效。作者在讲解算法的同时，也点明了CSS“级联”特性与树结构的天然关联，并提供了完整的实现代码仓库链接，让读者不仅能理解思路，也能看到工程实践。

本机暂存

IT 2016-02-16 20:34:00 / 累计浏览 2,180

iphp 框架增加 lazyload 特性

这篇讲的是iphp框架如何通过引入lazyload特性来解决一个常见的性能优化问题。作者从基类设计的便利性出发，指出现实中的痛点：为了使用方便，基类通常会一次性加载所有可能用到的属性到Context对象中。但这会导致不必要的数据库查询，造成性能浪费。为了解决这个问题，作者实现了`Context::lazyload()`方法。核心思路非常巧妙：它允许开发者声明一个属性，并绑定一个回调函数。这个属性只有在第一次被实际访问时，才会触发回调函数去执行真正的数据加载（比如查询数据库）。如果整个请求流程中该属性从未被使用，则完全不会产生开销。文章通过一个具体的`AppController`示例清晰地展示了这一机制：`account`属性被延迟加载，只有在子类中需要用户账户信息时，才会去查询，否则不会发生任何数据库请求。通过这种方式，iphp框架将资源的加载控制权交给了实际的使用场景，在保持代码简洁性的同时，显著提升了应用的响应速度和资源利用效率。

本机暂存

IT 2015-11-02 22:53:32 / 累计浏览 5,780

低级程序员和高级程序员的区别

这篇讲的是程序员能力差异背后的关键分水岭。作者从常见的误解切入：许多人以为高级程序员只是“写代码更快、bug更少”，但实际上，真正的分野在于看待问题的方式。文章以网络购票系统为例做了生动对比。一个典型的“低级”实现可能99%的时间都运行良好，但它把订单状态简单交付给一个网络请求。高级程序员会立刻想到：网络是不可靠的，请求的每一步都可能中断。正确的做法不是假设TCP协议“绝对可靠”，而是将每一次交互都视为可能失败，并从逻辑上设计补偿机制——比如引入独立的对账进程，通过“重试”和“状态确认”来保证系统最终一致性。作者指出，高级程序员之所以高级，在于他们深刻认识到bug的必然性，并致力于用严谨的逻辑与系统抽象，构建一个滴水不漏的防御体系。这不仅仅是编码技巧，更是一种面对复杂性的设计哲学。

本机暂存

IT 2015-10-04 23:17:12 / 累计浏览 2,280

SSH 信任限制只能执行 rsync 命令

这篇讲的是如何在不全面开放SSH权限的前提下，实现服务器间安全的rsync文件同步。作者从一个常见的运维场景出发：Server A需要经常向Server B同步文件，但Server B不想配置复杂的rsyncd，同时出于安全考虑，也不能完全开放SSH登录权限。文章提供的解决方案核心在于精细配置Server B上的`~/.ssh/authorized_keys`文件。通过将公钥的`command`字段指定为`rrsync`脚本，并附带目标目录路径，就能实现两个关键限制：一是SSH连接建立后，只能执行`rrsync`（受限的rsync）命令，无法获得shell；二是文件传输被严格限定在指定的目录（例如`/data/work/package/`）内。同时，配合一系列`no-`前缀选项，彻底禁用了端口转发、X11转发等可能产生安全隐患的功能。具体步骤上，文章给出了清晰的操作指引：在Server A生成专用的ssh密钥对，在Server B部署`rrsync`脚本并编辑`authorized_keys`。最后通过一条包含密钥路径的rsync命令，即可完成从本地到远程指定目录的上传。这种方式既满足了自动化同步的业务需求，又将服务器的安全暴露面降到了最低，是一个实用且安全性较高的配置技巧。

本机暂存

IT 2015-05-11 23:25:24 / 累计浏览 4,640

在Linux进行IO的正确姿势

很多C/C++程序员在做网络编程时，习惯使用封装好的库，却可能忽略了底层IO操作的一个常见陷阱。这篇文章指出，许多人对read()/write()函数的错误处理并不到位。作者从一个典型的错误代码示例出发：检查返回值为-1或0就认为完成了处理。但这忽略了关键的errno判断，尤其是EINTR（系统中断）和EAGAIN（非阻塞IO暂无数据）这两种情况。文章进一步展示了，仅仅判断errno还不够，正确的姿势是将IO操作放在一个while循环中，以便在发生可恢复的中断时进行重试，而非直接退出。文中强调，一个完善的IO处理逻辑必须能应对操作系统的瞬时状况，并结合了select/epoll等IO多路复用机制。最后，文章建议读者参考sim框架的开源代码，学习成熟的IO处理模式。

本机暂存

IT 2015-04-26 22:45:47 / 累计浏览 2,700

iOS界面响应式布局方式对比

这篇技术文章探讨了iOS开发中界面响应式布局方案的演变与对比。作者指出，早期iPhone屏幕单一，开发者普遍使用绝对定位，无需考虑动态布局问题。但随着iPad和多分辨率iPhone出现，苹果推出了Auto Layout方案。文章重点对比了Auto Layout及其社区改进（如Masonry）与新兴框架CocoaUI的不同设计哲学。Auto Layout本质是相对布局，但官方实现代码冗长、可读性差；Masonry等库虽用更“人话”的语法简化了代码，但仍未脱离相对布局需要依赖相邻控件关系的固有缺陷。相比之下，CocoaUI借鉴了Web的流式布局思想，主张每个控件自主完成自身布局，无需关心其他控件。文章通过代码示例直观展示，仅需一行代码即可实现Auto Layout中数十行的内边距设置。此外，CocoaUI还支持从HTML/XML文件直接加载界面并预览，进一步提升了开发效率。作者最终推荐开发者尝试CocoaUI，以更简洁直观的方式解决动态布局难题。

本机暂存

IT 2015-03-26 13:32:57 / 累计浏览 2,220

流式布局的原理和代码实现

这篇文章深入解析了流式布局的核心原理与代码实现，适合GUI开发者和前端工程师阅读。作者从最简单的布局模型出发，即控件靠左、靠右或堆叠排列，提出使用两个栈（Stack）数据结构——一个管理靠左控件的位置，另一个管理靠右控件——来高效实现流式布局。伪代码清晰展示了布局管理器的工作流程：当放置新控件时，先检查当前空间是否足够；若不够，则根据浮动方向从对应栈中弹出更高位置的控件来释放空间，确保布局不重叠。文章重点讨论了两个实现关键：一是控件变化时的级联重布局，从子节点一直传递到根节点，这虽然简单但性能开销

本机暂存

IT 2015-01-14 13:31:36 / 累计浏览 2,720

SSDB 源码分析 – 网络框架概述

这篇从SSDB重构后的模块化代码出发，聚焦其高度可复用的网络框架。作者首先指出SSDB网络协议虽简单且业务无关，能广泛应用于各类应用，但许多实现代码在解析报文时不够严谨，常误用`fgets()`等行级IO函数。随后，文章剖析了其多线程服务器框架的核心：通过`serve()`函数作为IO主线程管理连接与IO操作，并用`proc()`函数根据命令属性分发任务——或在主线程处理，或投入线程池。框架的巧妙之处在于，利用IO多路复用作为主循环，并通过名为`SelectableQueue`的结构，将线程间通信抽象为类似网络IO的逻辑，从而清晰高效地处理了主线程与工作者线程间的请求与响应传递。整个框架封装完善，几行代码即可构建并运行一个服务器。

本机暂存

IT 2014-12-30 12:28:16 / 累计浏览 3,400

SSDB源码分析 – 主从和多主同步原理解析

作者深入SSDB的内核，解析其主从与多主同步的设计哲学。核心思路是将主节点的所有写操作（Binlogs）在从节点重放，这与MySQL类似，但SSDB通过自动化解决了基础数据拷贝的痛点。整个同步流程分为两个核心阶段：首先是**COPY状态**，此时从节点会像遍历链表一样自动复制主节点的全量数据。在此期间产生的新写入，会根据其在数据链表中的位置决定是立即同步还是留待后续处理。当游标移动到末尾，流程无缝进入**SYNC状态**，实现毫秒级的实时增量同步。文章巧妙之处在于对细节的剖析：例如，通过为Binlog编号实现断点续传，并解释了`slaveof.type`配置为`mirror`是防止多主死循环的关键。它还澄清了一个常见误解——`slaveof.id`标识的是目标数据库而非物理机器，这使得数据迁移后同步关系能自动保持。对于理解分布式存储的同步机制，或是面临具体配置问题的开发者来说，这篇从实现细节出发的分析提供了清晰的路线图。

本机暂存

IT 2014-12-30 12:27:21 / 累计浏览 1,860

消除JavaScript闭包的一般方法

这篇讲的是JavaScript闭包作为“被动解决方案”时的替代思路。作者指出，虽然闭包常被用于封装私有状态，但有时它源于语言本身的限制，导致代码结构难以扩展。文章对比了两种处理“变量只初始化一次”这类需求的方法：一种是常见的闭包写法（立即执行函数创建私有变量），另一种则是作者推荐的“消除闭包”写法——通过构造函数和`this`引用来组织状态与方法。核心差异在于可扩展性：当需要为同一状态添加新操作时，闭包写法往往需要重写或嵌套更复杂的结构，而基于构造函数的方式只需简单添加新方法，更接近线性扩展。作者强调，虽然闭包在特定场景下依然有用，但面对需要后续维护或扩展的需求时，考虑“消除闭包”的模式能减少不必要的重构，让代码更清晰、更易迭代。对于日常开发中那些因语言特性而“不得不”使用闭包的场景，这提供了一种更面向未来的写法选择。

本机暂存