网络系统

共 180 篇文章

IT 2013-05-01 22:29:00 / 累计浏览 5,925

计算机网络协议包头赏析-UDP

这篇讲的是网络协议中那位“低调的幕后英雄”——UDP。作者从它和TCP的兄弟关系切入，点明两者虽同处传输层，但性格迥异：UDP更像随性的文科生，不追求严格顺序，换取了简单与高效，因此在语音、视频、DNS查询等对延迟敏感但能容忍少量丢包的场景下大显身手。文章的核心是“赏析”其精巧的8字节包头。与TCP冗长的20字节头部相比，UDP头只包含源/目的端口、长度和校验和，这直观体现了它的设计哲学：轻量化、低开销。作者还特别解释了“用户数据报长度”字段的含义，并引用了一个极其实用的结论：在以太网环境下，UDP数据载荷最好控制在1472字节以内，以避免IP分片带来的风险；而在复杂的互联网环境中，这个安全值则建议在548字节左右。这些从底层协议特性推导出的具体数字建议，让这篇赏析不止停留在概念层面，为实际的网络编程提供了清晰的参考尺度。

IT 2013-05-01 18:41:08 / 累计浏览 5,978

DNS解析过程及DNS TTL值

这篇从DNS劫持和解析错误这些常见痛点出发，系统拆解了域名背后的运作机制。文章首先明确了全球仅13台根域名服务器的核心地位，任何域名解析都需从这里获取顶级索引。接着，它用六个步骤清晰复现了从客户机发起请求到本地DNS服务器完成查询的全过程。其中，递归查询与迭代查询的差异被直观呈现：前者是本地DNS一路负责到底，后者则是逐级向下获取地址。文章重点阐述了DNS TTL（生存时间）的概念——这条记录在各级DNS服务器中的缓存时长。针对域名解析IP变更后如何加速更新的问题，作者给出了一个实用的分步操作建议：先将TTL值调至最低（如60秒），等待各地缓存过期后再修改解析记录，最后恢复正常TTL。这种从理论到实践的过渡，让技术原理落到了具体操作层面。文末配合的全球根服务器分布图与解析流程图，也帮助读者建立了直观的理解。

IT 2013-03-11 13:40:08 / 累计浏览 5,210

网络栈内存不足引发进程挂起问题

这篇讲的是高并发场景下，一个隐蔽但影响巨大的“坑”：当服务器需要支撑C1M（百万）级别连接时，TCP服务可能出现超时，甚至高达100ms的延迟。问题的根源往往在于Linux内核的网络栈内存。文章开篇就点明，TCP的发送和接收缓冲区并非“想设多大就多大”，它们受到一系列sysctl参数（如net.ipv4.tcp_mem）的全局控制。这些内存是不可交换的物理内存，用一点少一点，系统默认值通常偏保守。在连接数暴涨时，可供分配的内存很快耗尽。一旦内存不足，进程向socket写入数据时，内核就会将其挂起（阻塞），并调用 `sk_stream_wait_memory` 函数等待内存释放。文章直接展示了如何用SystemTap脚本精准定位这一过程——脚本输出会清晰地显示进程“blocked on full send buffer”和“recovered”的时间点，这就是导致应用层超时的直接证据。最后，文章给出了行动指南：如果观测到了这种内存等待，就需要着手调整协议栈的内存限制参数。它通过一个具体的案例强调，面对复杂的网络问题，定量的工具与分析比猜测更可靠。

IT 2013-03-11 13:20:00 / 累计浏览 11,994

HTTP协议Keep-Alive模式详解

这篇讲的是HTTP协议中的一个关键性能优化机制——Keep-Alive模式。作者从HTTP“请求-应答”的本质出发，对比了默认断开的普通连接和持久化的Keep-Alive连接。在普通模式下，每一次请求都要单独建立和关闭TCP连接，开销很大。而启用Keep-Alive后，连接会被重用，避免了重复握手的损耗。文章指出，HTTP 1.0默认关闭此特性，需要手动开启；而从1.1开始，这已是默认行为，服务器是否支持决定了实际效果。文章的重点分析了Keep-Alive如何判断消息传输完成。由于连接不会自动断开，不能依赖EOF信号。作者详细解释了两种标准方法：一是通过`Content-Length`头部明确告知数据长度；二是使用`Transfer-Encoding: chunked`进行分块编码传输，尤其适用于动态生成的内容。文中甚至给出了chunk编码的具体格式示例。此外，文章还梳理了RFC标准中消息长度的优先级判定规则，并附录了常见的HTTP头字段解释。可以看出，Keep-Alive并非简单的“保持连接”，而是一套涉及连接复用、数据完整性和协议协商的完整方案，其优势在于节省CPU与内存、支持请求管道化、降低网络拥塞和延迟。理解它，是深入掌握现代HTTP性能调优的基础。

IT 2013-03-07 13:56:01 / 累计浏览 7,373

nicstat 网络流量统计利器

这篇讲的是 nicstat 这个被称作“网络接口的 iostat”的流量监控工具。作者从 Brendan Gregg 的性能分析 PPT 引出它，详细说明了如何将这个原本在 Solaris 下的工具移植并安装到 Linux 环境中。文章核心对比了 nicstat 和常见的 netstat，指出其关键优势在于：能同时报告字节与数据包流量、将数据归一化为每秒速率、统计所有接口、并尝试估算网卡利用率（%Util）与饱和度（Sat）。这些特性让实时监控和诊断更直观。文中展示了具体的安装过程（需针对64位系统修改编译参数）和多个使用示例，例如用 `enicstat -l` 查看网卡状态，用 `-M` 切换为兆比特单位显示，以及用 `-t` 获取 TCP 连接统计。特别值得注意的是，nicstat 通过读取 `/proc/net/dev`、`snmp` 等文件来获取数据，并提供了如重传率（%ReTX）、连接数等 TCP 层面信息，对排查网络问题很实用。文章最后也坦诚说明了在 Linux 下其饱和度统计的局限性，提示读者结合使用率和数据包速率进行综合判断。

IT 2013-03-05 12:45:31 / 累计浏览 6,450

记一次丢包网络故障

这篇讲的是一台Nginx/PHP服务器时不时出现HTTP服务卡住的排查故事。作者的排查思路很清晰：先从应用层入手，通过查看Nginx日志中PHP的响应时间与Strace跟踪，排除了PHP的嫌疑。接着转向Nginx本身，确认其默认已关闭Nagle算法。随后检查了Linux内核的tcp_timestamps等参数，也排除了配置问题。在思路陷入僵局后，作者决定使用tcpdump抓包。面对原始日志的晦涩，他巧妙地借助Wireshark进行可视化分析，从中发现了大量“TCP Dup ACK”和“TCP Out-Of-Order”标志，这直接指向了网络层可能存在的丢包。最终，通过使用`ping -f`命令发起洪水请求，屏幕上不断出现的丢包点直观地证实了网络状况确实不佳。文章将问题根源定位为网络丢包，但并未止步于此，而是将更底层的物理原因（如网线、网卡或带宽）留给了更专业的运维人员。整个排查过程层层递进，展示了从应用层到内核层再到网络层的完整诊断链条。

IT 2013-03-03 22:40:27 / 累计浏览 4,968

什么是NAT

这篇讲的是NAT——网络地址转换，一个为解决IPv4地址不够用而生的核心网络技术。作者从一个“理想很丰满，现实很骨感”的个人学习故事切入，用了一个“小马哥管公司”的生动类比，把地址稀缺和分级管理的逻辑讲得挺明白。文章直接点出了NAT要解决的关键矛盾：公网地址有限，但内网设备（比如家里、公司里的电脑）需要上网通信。解决方案是划出几个特定的私有IP地址段（如192.168.x.x），允许内网重复使用，然后由NAT设备（通常集成在路由器里）来“翻译”地址。当内网设备要访问公网时，路由器会把它数据包的源地址，悄悄换成自己拥有的那个唯一的公网IP地址。更深入一层，文章还解释了NAT如何利用TCP/UDP的端口号，来区分同一内网下不同设备发出的数据流。它通过维护一张“内网IP+端口”到“公网IP+虚拟端口”的映射表，确保返回的数据能准确送回原来的那台设备。这种对协议现有字段的巧妙复用，让NAT在不改变底层IP协议的情况下，打通了内外网的通信桥梁。总的来说，作者用接地气的语言和比喻，把NAT这个略显枯燥的概念拆解清楚了，核心就是它如何通过地址和端口的转换，在地址不足的现实下，让海量内网设备得以顺利接入互联网。

IT 2012-12-24 22:47:37 / 累计浏览 5,288

网络协议简介

这篇讲的是网络协议分层模型和核心协议。作者从经典的OSI七层模型和更实用的TCP/IP四层模型对比出发，梳理了从物理层到应用层的数据流转过程。文章的重点落在对网络层的剖析上。它详细拆解了IPv4和IPv6的数据包报文头结构，比如IPv4的IHL字段如何定义头部长度，IPv6如何通过更简洁的头部和128位地址来优化设计。同时，也点明了ICMP、IPsec等协议在网络层的角色。除了重点讲网络层，文章也覆盖了传输层的TCP/UDP和应用层的HTTP、FTP等常见协议。最后，作者还提到了一个容易被忽略的socks5协议，解释了它在五层和七层模型中不同的定位，以及作为代理协议的实用性。整体上，文章以协议分层为脉络，兼顾了原理细节和实际应用。

IT 2012-12-11 21:57:16 / 累计浏览 17,294

浅析http协议、cookies和session机制、浏览器缓存

这篇讲的是从实际网站数据出发，拆解HTTP协议中几个关键但常被忽略的环节。作者从QQ空间的完整请求与响应头入手，直观展示了HTTP交互的全貌，比如请求行、状态行以及各头域的格式与作用。文章的核心在于实践对比，作者测试了包括CSDN、腾讯、新浪、百度在内的十余家主流网站，深入分析了`Connection`、`Content-Encoding`、`Server`、`Cache-control`等头域的具体表现。例如，为什么腾讯、新浪等部分大型网站会使用`Connection: close`而非默认的长连接？`Server`头域如何暴露了网站使用的服务器信息（如腾讯内部的QZHTTP、淘宝的Tengine），这又带来了哪些安全考量？这些对比都给出了作者的分析。更重要的是，文章并未止步于分析，而是提供了对应的PHP实现代码，比如如何通过`header()`函数设置`Connection`、`Cache-control`、`Last-Modified`，以及如何利用`if-modified-since`实现304缓存判断。整篇文章将理论知识与大站的实际运维策略、具体的编码实践紧密结合，对于想深入理解HTTP机制并应用于开发的读者来说，提供了非常具象的参考。

IT 2012-11-27 13:35:17 / 累计浏览 8,693

从谷歌宕机事件认识互联网工作原理

这篇讲的是谷歌服务曾经历的一次全球性短暂宕机，作者作为一名CloudFlare网络工程师，从亲身参与修复的角度，带读者深入了一次真实的网络故障现场。故事从发现谷歌所有服务（甚至包括其公共DNS 8.8.8.8）无法访问开始。作者通过追踪发现，本应由谷歌自己管理的IP地址，其BGP路由路径却诡异地指向了印度尼西亚的运营商Moratel。这揭示了问题的根源：一家ISP可能因操作失误（“胖手指”），错误地向其上游提供商（电讯盈科）宣告了本属于谷歌的IP地址，而后者信任了这一宣告，导致错误路由像涟漪般扩散至全球互联网。文章核心观点在于阐释互联网如何建立在BGP协议的相互信任机制之上，而这种信任一旦被错误信息打破，即便是谷歌这样的巨头也可能服务中断。作者最终通过业界人脉直接联系Moratel公司才得以修复问题。这给我们的启发是：可靠的网络运维不仅关乎技术，也关乎全球协作网络与及时响应能力——即使你控制不了外部路由，也必须有团队时刻监控和管理你与世界的连接。

IT 2012-11-11 23:47:37 / 累计浏览 8,004

域名相关的一些基本概念总结

这篇技术博客系统梳理了互联网基础设施中的核心概念——DNS及其相关配置。文章从DNS（域名系统）的底层作用讲起，解释了它如何将人类可读的域名翻译为机器所需的IP地址，并特别强调了DNS服务器数量（通常至少两个）对解析稳定性的意义。内容重点对比了A记录、AAAA记录、CNAME记录、MX记录和TXT记录等关键DNS记录类型。例如，A记录直接将域名指向IPv4地址，而CNAME则为域名创建别名，便于管理；MX记录专用于指定邮件服务器，是搭建企业邮箱的关键；TXT记录则常用于SPF反垃圾邮件验证。文章还厘清了子域名、泛解析（覆盖所有未定义的子域名）与域名绑定（将域名关联到特定服务器空间）之间的区别与应用场景。对于需要管理域名的开发者或运维人员而言，理解这些概念的差异和适用条件，能更精准地完成网站部署、邮件服务配置或流量调度，避免常见的配置疏漏。

IT 2012-11-05 22:15:20 / 累计浏览 7,432

一种抵御 DDoS 攻击的 IP 追踪技术

这篇文章来自作者2008年的一个备忘录，他决定将这个关于 DDoS 攻击防御的早期想法电子化。文章探讨了一个在 IP 协议基础上的扩展技术，即“差分确定性数据包标记”，旨在帮助服务器在遭受 DDoS 攻击时识别攻击流量并定位来源。他提出的方案核心在于，让网络边缘的接入路由器对经过的数据包 IP 头进行标记。利用一个关键假设——正常流量源 IP 与路由器接口 IP 通常仅在末尾若干位不同，路由器可以仅标记这些不同的位，而不是冗长的完整路径信息。算法中甚至用上了 IP 头里闲置的 IDENTIFICATION 字段来承载这些标记。这一改进带来了几个实际好处：大部分正常数据包仅需一个包就能完成回溯，极大减轻了路由器计算负担，同时也避免了正常 IP 分片受到标记操作的影响。当然，作者自己也坦言，这个想法创新有限，且需要在运营商全网部署，工程实现难度极高，因此当年并未发表。但它清晰地展示了一个从实际网络假设出发、优化现有协议以解决特定安全问题的技术思考过程。

IT 2012-11-05 22:11:38 / 累计浏览 5,596

accept_ra 的一个例子

这篇讲的是作者在配置Jumbo Frame时遇到的一个IPv6特有坑点。两台主机和交换机都已将MTU改为9000，但IPv6通信始终失败，不断收到“包太大”的ICMPv6报错。作者排查发现，IPv6路由器的RA包中会周期性广播一个MTU值（这里为1500），这个值会直接覆盖主机本地计算出的PMTU，导致大包无法发出。问题的根源在于IPv6与IPv4的关键差异：IPv6路由器不分片，发送方主机必须基于整条路径的最小MTU（即PMTU）来调整包大小。而交换机虽然能转发巨帧，但其路由接口的MTU固定为1500，这个值通过RA被主机接收，不断重置了有效的PMTU。作者最终的解决方案是：在相关网络接口上禁用`accept_ra`选项，阻止主机接收和处理RA包中的MTU信息，转而通过DHCPv6来获取IP地址。这个案例清晰地展示了IPv6无状态地址自动配置机制与自定义网络配置之间可能出现的冲突。

IT 2012-11-05 22:11:03 / 累计浏览 6,936

TSQ 的原理

这篇技术文章深入剖析了Linux内核网络栈中一个精巧的机制：TCP Small Queue (TSQ)。作者从一个常见疑问出发——既然已经有了`tcp_wmem`限制TCP层队列，为何还需要TSQ？以此引出关键：数据包从TCP层到网卡要经过多个队列，TSQ旨在更全面地控制排队延迟。文章的核心在于对两个内核函数的源码级解读。其一是`tcp_wfree`，作为网络套接字缓冲区的析构函数，它巧妙地在缓冲区即将被丢弃时“截胡”，检查特定标志位后将套接字重新加入TSQ队列调度。其二是`tcp_tasklet_func`，它处理队列中的套接字，并根据其是否被用户进程持有来决定立即发送或推迟至`release_sock()`。 TSQ的巧妙之处在于，它没有直接维护一个可计算长度的独立队列，而是“寄生”于内核网络路径的关键节点（如缓冲区释放和套接字关闭）来间接判断队列空间是否充裕，以此实现动态的发送限速。这种设计展现了对TCP内部运作机制的深刻洞察。

IT 2012-10-26 13:19:52 / 累计浏览 6,205

TCP/IP 相关总结

这篇讲的是TCP/IP协议栈的经典模型对比。作者从TCP/IP四层模型出发，清晰地列出了每一层的代表性协议，比如应用层的HTTP和DNS，传输层的TCP和UDP。文章随后引入了OSI七层模型，并将两者进行并排比较，直观地揭示了关键差异：TCP/IP的应用层实际上整合了OSI应用层、表示层和会话层的功能，这是一个非常核心的简化与实用主义设计。此外，文章开篇就扎实地回顾了TCP三次握手建立连接的完整过程，从SYN包发送到SYN+ACK回应，再到最后的ACK确认，讲得很清楚。虽然文章还提及了IP地址分类，但其核心价值在于对这两套网络分层模型的拆解与对照，帮助读者理解网络通信框架从理论模型（OSI）到实际协议栈（TCP/IP）的演变与取舍。搞明白这些区别，对于理解网络通信的本质很有帮助。

IT 2012-10-22 23:32:23 / 累计浏览 5,772

qperf测量网络带宽和延迟

这篇文章聚焦于如何使用qperf工具准确测量网络性能参数。作者指出，虽然我们了解网络设备的理论规格，但在实际部署中，网卡驱动、交换机跳数、丢包率以及协议栈配置等因素都会显著影响实际的带宽和延迟表现，而这些参数直接关系到request-response类协议的最大QPS和系统承载能力。文中详细介绍了qperf工具在实际场景中的应用价值——它能够穿透理论值的迷雾，帮助开发者或运维人员获取真实的网络基准数据。这种实测对于诊断性能瓶颈、优化服务器配置以及验证网络变更效果都至关重要。通过将理论预期与实测结果进行对比，文章揭示了网络环境的复杂性，并强调了基于真实测量数据进行决策的重要性。对于需要精确掌控网络性能的技术团队来说，这提供了一种实用且直接的评估方法。

IT 2012-10-14 23:27:26 / 累计浏览 5,064

家用千兆网络与媒体共享建设【真实情况记录】

这篇讲的是家庭用户如何从零搭建一套高速稳定的千兆内网与流媒体共享系统。作者从自家“老旧百兆网络无法满足4K原盘播放与多设备并发”这一真实痛点出发，详细记录了从规划到落地的全过程。核心方案围绕着全屋有线千兆回程与一台作为媒体中心的NAS展开。文章具体比较了不同材质网线（如六类线）与交换机的选择考量，并分享了在软路由、iSCSI共享等环节上踩过的坑与最终的优化配置。最终达成的效果是，实现了局域网内所有设备（包括电视、投影、手机、平板）都可以流畅直接访问NAS上的高清片库，内网传输速度也彻底跑满了千兆带宽。对于正计划升级家庭网络或组建媒体库的读者来说，这份包含了具体型号、配置思路与避坑点的实战记录，提供了非常扎实的参考。

IT 2012-10-14 22:35:53 / 累计浏览 4,926

Mail的一些基本概念总结

这篇讲的是邮件收发背后的基础协议。作者从一封电子邮件从发送到被阅读的全过程出发，梳理了SMTP、POP3和IMAP这三个核心概念。它没有停留在名词解释，而是对比了它们各自扮演的角色：SMTP（简单邮件传输协议）只负责“发”，把邮件从客户端推送到服务器，或者在服务器之间中转。而当我们打开邮箱客户端收取邮件时，用的则是POP3或IMAP。这里的关键差异在于，POP3通常将邮件下载到本地设备后就从服务器删除，适合单设备管理；而IMAP则让客户端与服务器保持同步，在多个设备上都能看到一致的邮件状态和文件夹结构，更适合如今多终端办公的场景。文章把这些协议拆解开，用它们的工作流程图景，解释了我们每天都在用的邮件功能是如何实现的。理解这些，能帮你搞清为什么有时候邮件发不出去，或者换个设备就找不到历史邮件了。

IT 2012-09-30 15:54:39 / 累计浏览 7,777

计算机网络协议包头赏析-TCP

这篇赏析从TCP报文段的格式图入手，逐一拆解了其包头结构的每个细节。作者没有停留在表面介绍，而是深入每个字段的设计意图，比如通过序号和确认号如何协同实现可靠传输，SYN、ACK、FIN等标志位在连接生命周期中扮演的角色，以及窗口大小字段对流量控制的精妙调节。文章特别聚焦于TCP头部中那些容易被忽略却至关重要的部分，如校验和字段如何保障数据完整性，紧急指针在特定场景下的应用。通过图解和实例，它展示了这些字段如何共同支撑起TCP的“面向连接”和“可靠”两大核心特性，

IT 2012-09-06 23:49:38 / 累计浏览 5,913

计算机网络协议包头赏析-IP

这篇讲的是IP数据报的格式细节。作者延续上一篇对以太网帧的讨论，从数据链路层递进到网络层，具体解析IP协议头部的每一个字段。文章从IP版本号、头部长度、总长度这些基础字段说起，重点阐释了标识、标志和片偏移这三个与分片机制相关的字段如何协同工作，也解释了生存时间（TTL）、协议号、首部校验和等字段的设计逻辑与作用。文中特别强调了IP头部中可变长度选项字段的处理方式，以及它如何影响数据报的解析。作者不是简单罗列字段，而是从协议设计的角度，分析这些字段如何在实际数据传输中承载控制信息、确保寻址、分片与重组，以及维持网络的健壮性。这种从基础协议格式出发的细致剖析，对于理解整个互联网的通信模型是很有价值的。