Erlang非业余研究 -- IT技术博客大学习 -- 共学习共进步！

首页 / Erlang非业余研究

IT 2011-10-14 13:46:07 / 累计浏览 37,820

gen_tcp发送进程被挂起起因分析及对策

当你的Erlang应用通过gen_tcp发送数据时，突然发现发送进程毫无征兆地“卡住”了，既不崩溃也不返回，这确实令人抓狂。这篇技术复盘就从一个在Gmail中收到的、描述得极为清晰的真实案例切入，深入探讨了导致gen_tcp发送进程被挂起的“隐形杀手”。作者层层剥茧，指出问题的根源往往并非Erlang VM本身，而是深藏于底层TCP/IP协议栈的行为之中。核心矛头直指TCP的流量控制机制——当网络接收端的缓冲区被填满，而发送端的应用层又未对`{active, once}`或`{active, N}`模式下积压的数据进行有效管理时，内核的发送缓冲区便会停滞，进而导致上层gen_tcp调用被阻塞。文章不仅分析了病因，更提供了具体的“药方”：如何通过监控`{buffer, Size}`等套接字选项、合理设置发送频率，以及在应用层实现背压（backpressure）处理，来确保发送进程保持活跃与弹性。这篇分析将一个看似无头绪的挂起问题，拆解成了可理解、可监控、可解决的具体技术点，帮助开发者在面对类似“幽灵”故障时，能快速定位到网络与进程交互的关键环节，而不再手足无措。

本机暂存

IT 2011-10-14 13:45:32 / 累计浏览 2,200

未公开的gen_tcp:unrecv以及接收缓冲区行为分析

这篇讲的是Erlang的gen_tcp模块里藏着不少秘密——其中一个未公开的函数`gen_tcp:unrecv`，能让你像“后悔药”一样把数据重新塞回TCP的接收缓冲区。文章不仅演示了这个函数的妙用，还深入到VM层，剖析了Erlang的TCP接收缓冲区到底是如何工作的。核心实现上，`unrecv`巧妙地利用了端口驱动层的缓冲区管理机制，允许开发者在协议解析或错误处理时拥有更高的灵活性。比如，当你误读了一个包并想“退回”已读取的数据时，这个函数就提供了优雅的补救手段。作者通过具体代码示例，展示了它在自定义协议解析、流量控制等场景中的实际效果。不过，文章也提醒我们，这类内部接口可能随Erlang/OTP版本更新而变动。真正的价值在于它揭示的缓冲区行为原理——理解这些底层细节，能让你在遇到性能瓶颈或诡异连接问题时，拥有更扎实的排查思路，而不是停留在API表面。

本机暂存

IT 2011-10-14 13:43:00 / 累计浏览 2,000

Erlang进程简单的主动负载管制实现

这篇讲的是如何解决Erlang虚拟机中一个常见但容易被忽视的性能问题：调度器的时间片机制虽然保证了公平性，但对IO密集型进程并不友好。当进程进行大量IO操作时，其消耗的“时间片”实际上并不准确，这会导致CPU计算密集型进程在对比中吃亏。文章作者从这个实际痛点出发，设计并实现了一种简单的主动负载管制机制。核心思路是让进程在执行耗时操作前，主动“让出”部分时间片，而不是被动等待调度器强制切换。这样，系统就能更公平地分配CPU资源，避免因IO操作而导致的不公平现象。实现上，文章展示了如何利用Erlang的内置工具进行轻量级监控，并在进程内部嵌入负载检查与自我调节的逻辑。这种方案不需要复杂的外部框架，保持了Erlang轻量级进程原有的优势。

本机暂存

IT 2011-10-14 13:42:35 / 累计浏览 2,080

Erlang Shell实用小技巧

这篇讲的是Erlang开发者都熟悉却可能没完全掌握的交互式工具——Shell。作者从日常开发中容易被忽视的细节入手，指出文档里往往一笔带过的内置命令，其实在调试、监控和快速原型验证中非常实用。文章没有泛泛而谈，而是具体列举并解释了多个 Shell 下的“隐藏技能”。比如，如何利用内置函数实时查看某个进程的状态或修改其行为，怎样便捷地浏览和操作ETS表，以及如何管理断点或进行临时代码热更。这些技巧都围绕着一个核心：让开发者在不重启服务、不编写完整模块的情况下，高效地窥探系统内部状态并实施干预。掌握这些小技巧，意味着在排查线上问题或进行交互式开发时，能获得更高的灵活性和响应速度。对于熟悉Erlang运行时系统的读者来说，这是一次对得心应手的工具箱的重新梳理，能有效提升日常开发的流畅度。

本机暂存

IT 2011-10-12 00:21:34 / 累计浏览 5,620

Erlang match_spec引擎介绍和应用

这篇讲的是Erlang开发中一个实用但常被忽略的工具——match_spec引擎。作者从Erlang进程字典和ETS表查询的痛点出发，引出match_spec作为一种在虚拟机层面高效匹配数据结构的DSL。文章详细拆解了其核心语法，比如如何用`{element, N, Tuple}`这类嵌套结构来精准定位复杂元组中的特定元素，并对比了它与直接模式匹配在性能和灵活性上的差异。最值得注意的是，文章通过具体案例展示了match_spec在调试（如`dbg:tracer`）和性能监控（如`recon`工具）中的“胶水”作用。它不仅能用于查询，还能作为过滤器在消息队列或ETS表扫描时减少不必要的数据拷贝。这种将声明式描述编译为虚拟机高效操作的思路，为处理大规模并发状态下的可观测性问题提供了新角度。

本机暂存

IT 2011-10-04 18:06:22 / 累计浏览 2,800

未公开的gen_tcp:unrecv以及接收缓冲区行为分析

这篇分析聚焦于Erlang中一个未公开的gen_tcp:unrecv函数，它允许向TCP接收缓冲区直接填充指定数据。作者从gen_tcp模块的源码入手，深入探讨了这个函数的核心实现思路和缓冲区行为机制。文章指出，gen_tcp:unrecv看似简单，却巧妙地绕过了标准接收流程，让开发者能够灵活控制数据注入时机，比如在需要预加载测试数据或调整接收顺序时非常实用。通过剖析其内部实现，如缓冲区指针操作和数据管理策略，作者揭示了它在避免缓冲区溢出和确保数据一致性方面的优势。同时，文章对比了常规TCP接收方法与使用gen_tcp:unrecv的场景差异，强调后者在网络编程中能提升代码简洁性和性能。结合实际案例，作者展示了如何在Erlang并发模型中应用这一技巧来优化数据流处理，为读者提供了对底层缓冲区管理的更直观理解。

本机暂存

IT 2011-10-04 18:00:25 / 累计浏览 2,520

seq_trace集群消息链跟踪利器

这篇文章讲的是如何利用 Erlang 的 seq_trace 模块作为利器，来跟踪集群环境中的消息链，解决分布式调试中的核心难题。在集群架构下，进程间的消息传递错综复杂，一旦出现性能瓶颈或逻辑错误，开发者往往像在迷宫里找出口，难以快速定位问题根源。作者从实际开发经验切入，介绍了 seq_trace 如何以极低开销实现消息链的全链路跟踪，让隐形的消息流动变得可视化。核心方案围绕 seq_trace 的轻量级跟踪机制展开，比如通过 seq_trace:trace/2 函数一键启用跟踪，并利用标签系统在跨节点通信中保持上下文一致性。文章具体展示了如何在分布式节点间设置跟踪点，无需侵入业务代码，就能自动捕获消息的发送、接收和转发过程。一个巧妙的设计是，seq_trace 与 Erlang 的透明进程通信无缝集成，开发者可以像使用日志一样轻松获取跟踪信息，同时性能影响极小。通过实际

本机暂存

IT 2011-10-04 17:56:48 / 累计浏览 4,300

hibernate使用注意事项

这篇讲的是hibernate这个内存管理机制的正确打开方式。作者从系统资源管理的角度出发，解释了hibernate如何在进程空闲或内存紧张时，通过重新整理堆和栈内存来有效降低消耗，同时让进程“安然入睡”并保留完整状态。不过，文章的重点在于“注意事项”——它点明了看似简单的机制若使用不当，可能引发一系列连锁问题。虽然没有深入具体故障案例，但作者旨在提醒开发者，掌握hibernate的适用边界和正确调用时机，是确保系统稳定、避免潜在风险的关键。对于从事移动端或需要精细化内存管理的开发者而言，这些原则性的提醒能帮助他们在实际场景中做出更稳妥的决策。

本机暂存

IT 2011-09-07 23:05:13 / 累计浏览 4,240

gen_tcp调用进程收到{empty_out_q, Port}消息奇怪行为分析

在Erlang/OTP开发中，有开发者发现gen_tcp进程在特定场景下会意外收到`{empty_out_q, Port}`消息，导致消息处理流程异常。作者从问题复现出发，逐步定位到该消息由端口子系统在输出队列清空时发出，但普通用户进程并不需要处理这类系统级消息。文章详细剖析了端口通信机制和消息传递路径，指出这是Erlang虚拟机的正常行为而非bug。核心原因在于端口与进程的链接关系，使得端口事件会以消息形式送达关联进程。解决方案是开发者需在自己的消息处理逻辑中显式忽略该消息，或调整端口的使用方式。通过这个案例，读者可以更深入地理解Erlang端口与进程间的通信机制，避免类似问题在实际开发中造成困扰。

本机暂存

IT 2011-07-31 12:51:03 / 累计浏览 6,700

TCP链接主动关闭不发fin包奇怪行为分析

这篇讲的是从实际开发中遇到的一个有趣网络问题出发，分析了TCP连接主动关闭时不发送FIN包的奇怪现象。问题起源于多隆同学在构建网络框架时发现，当调用close系统调用正常关闭一条TCP连接时，对端却收到了ECONNRESET错误，而不是预期的FIN包。通过抓包分析，确认我方发出的是RST报文，这违背了TCP优雅关闭的常规流程。文章以Erlang环境为例，演示了从建立连接、发送请求到主动关闭的全过程，清晰复现了问题。作者深入探讨了TCP协议栈的行为，指出这种异常往往发生在连接关闭时缓冲区中仍有未处理数据，或连接状态异常的情况下，系统可能直接发送RST包来强制终止，而非遵循标准的FIN握手。这种机制虽然能快速释放资源，但可能导致对端应用层收到非预期的错误，影响程序健壮性。通过这个实际案例，文章揭示了网络编程中容易忽略的细节，提醒开发者在设计框架或处理连接生命周期时，需特别注意TCP状态管理和错误处理逻辑，以避免类似的隐蔽陷阱。

本机暂存

IT 2011-07-31 12:48:46 / 累计浏览 3,460

gen_tcp容易误用的一点解释

这篇讲的是 Erlang 的 gen_tcp 模块在实际使用中一个非常容易被忽视的“坑”。作者从一位同学在实际操作中遇到的困惑出发，具体描述了问题的表现：看似按照常规流程进行的 TCP 连接与通信，却产生了不符合预期的行为。问题的根因在于对 gen_tcp 发送函数 `send/2` 的理解偏差。文章深入解释了，`send/2` 函数的返回值 `{ok, BytesSent}` 中的 `BytesSent` 并不代表数据已成功发送到网络，而只是表示数据已被放入了 TCP 发送缓冲区。真正的发送是异步完成的，这可能导致在连接异常关闭后，程序仍误以为数据已成功送出。针对这一问题，文章给出的解决方案是结合使用 `gen_tcp:controlling_process/2` 和进程监控，并在关键操作后进行必要的状态检查或超时处理，以确保程序逻辑的健壮性。对于使用 Erlang 进行网络编程的开发者而言，理解底层 I/O 的异步特性和错误处理机制，是写出可靠代码的关键一步。

本机暂存

IT 2011-07-30 21:39:51 / 累计浏览 1,700

Erlang supervisor的dynamic行为分析

这篇讲的是 Erlang/OTP 中 supervisor 的 dynamic（动态）行为策略。文章从一个实际的线上问题出发：当用 `simple_one_for_one` 或其他动态策略管理子进程时，面对子进程频繁或异常重启，supervisor 会表现出怎样的行为逻辑？作者深入分析了核心机制，比如它如何通过一个简单的重启计数器（在 `MaxR` 和 `MaxT` 时间窗口内）来判定“崩溃频率过高”，并最终选择自己重启。文章详细对比了不同重启策略（`one_for_one`, `rest_for_one`, `one_for_all`）在连续崩溃场景下的具体差异，并解释了参数调优时的权衡点。更巧妙的是，它揭示了这种基于计数器的“崩溃检测”机制背后的设计哲学——简单、确定且高效，避免了复杂的定时器或状态跟踪。对于正在用 Erlang 构建高可用、容错系统的开发者来说，理解这些动态行为的细微之处，是合理配置监督树、避免“重启风暴”并让系统真正健壮的关键一步。

本机暂存

IT 2011-06-21 13:21:24 / 累计浏览 3,660

ulimit问题及其影响

这篇讲的是 `ulimit` 这个经典系统参数的设计初衷和现实影响。作者从早期计算机系统资源（如内存、CPU）极度有限的历史背景出发，解释了 `ulimit` 为何存在——它的核心目标是在资源稀缺时代，确保进程间能公平地共享资源，防止某个进程耗尽所有资源而拖垮整个系统。文章展示了一台典型 Linux 机器的默认 `ulimit` 配置。其中几个关键值值得注意：单个进程能打开的最大文件数 `open files (-n)` 仅为 1024，这对于现代高并发网络服务来说往往是一个瓶颈；而最大用户进程数 `max user processes (-u)` 通常设置得较高（如 204800）。这种差异反映了系统设计者对不同资源消耗模式的权衡。理解 `ulimit` 与现代资源管理机制（如 cgroups）的对比是关键。`ulimit` 是单进程维度的“软限制”和“硬限制”，更侧重于防止滥用；而 cgroups 则提供了对一组进程的精细化、系统级资源（CPU、内存、IO）管控，是容器化技术的基础。在需要为单个服务设置防火墙时（如限制单个 Java 应用的线程数或文件句柄），调整 `ulimit` 仍然直接有效。但在构建复杂服务架构或容器环境时，则必须依赖 cgroups 进行更全局的资源分配与隔离。因此，选择哪一种工具，完全取决于你要解决的是进程级的公平性问题，还是系统级的资源编排问题。

本机暂存

IT 2011-06-01 23:38:35 / 累计浏览 3,180

Linux高速缓存使用率调查

这篇讲的是Linux系统中一个关键却常被忽略的性能指标调查：pagecache的利用率。文章直接切入核心矛盾——虽然我们都知道pagecache对磁盘I/O性能至关重要，但在实际生产环境中，它的整体使用率究竟如何？作者的视角没有停留在系统全局的宏观数据，而是进一步具体化到每个物理设备上，考察了缓存在不同设备间的分配与命中情况。调查揭示了一个普遍存在的现象：整体的pagecache使用率可能看起来健康，但具体到单个设备时，其缓存分配、访问热度与命中率可能存在巨大差异。这种不均衡的利用状态，正是许多系统性能调优和故障排查中容易忽略的盲点。文章通过这种具体到设备粒度的分析，为我们理解系统I/O行为和优化资源分配提供了更精细的观测维度。它提醒我们，在关注整体缓存水位的同时，深入审视每个设备的缓存健康状况，往往是定位性能瓶颈的关键一步。

本机暂存

IT 2011-06-01 13:21:31 / 累计浏览 4,400

Linux文件预读对系统的影响

这篇讲的是Linux如何通过文件预读（Readahead）来优化性能。作者指出，Linux系统高性能的关键在于Pagecache——因为内存访问速度远快于磁盘IO，所以系统会尽可能利用内存来缓存数据。文件预读正是基于这一原理的策略：它会预测用户接下来可能读取的数据，提前将这些内容加载到Pagecache中。这样当用户真正请求数据时，就能直接从高速内存中获取，避免等待慢速的磁盘IO，从而显著提升读取性能。文章的核心在于揭示这一机制背后的智能性：预读并非简单地提前加载，而是通过算法对访问模式进行预测。这种设计使得频繁的文件读取操作（如数据库查询、流媒体播放）能够获得流畅的体验。对于系统管理员或开发者来说，理解预读策略有助于更好地调优IO密集型应用的性能。

本机暂存

IT 2011-05-30 14:02:39 / 累计浏览 7,760

leveldb性能分析和表现

这篇深入剖析了LevelDB在海量数据下的性能表现，核心聚焦于其高效背后的LSM（Log-Structured Merge）算法设计。作者从LevelDB支持billion级数据量这一事实切入，揭示了其卓越吞吐能力的根本原因：LSM算法巧妙地将随机写入操作转化为顺序写入，通过后台合并（Compaction）过程持续优化数据结构，从而在数据量剧增时依然保持稳定的读写性能。文章具体分析了这一机制的工作流程与优势。LSM树利用内存中的MemTable缓冲最新写入，当达到阈值后刷入磁盘形成不可变的SSTable文件，并定期进行多层合并。这种设计极大地减少了磁盘寻址开销，是高并发写入场景下的性能利器。同时，作者也提及了LevelDB在压缩（如使用Snappy）和缓存（如Block Cache）等方面的优化，这些共同构成了其高性能的整体方案。对于正在设计存储系统或寻找高性能KV解决方案的开发者而言，理解LevelDB的这些实现细节具有直接的参考价值。它展示了如何通过架构创新来平衡存储成本与访问速度，尤其是在写密集型负载下的权衡艺术。

本机暂存

IT 2011-05-17 08:46:38 / 累计浏览 2,920

disktop per设备per应用层面的IO读写统计

这篇讲的是在IO调优中，如何突破现有工具的监控粒度限制。我们常用 iostat 查看全局设备负载，用 iotop 查看进程级IO，但现实中常常需要更精细的视角：**具体到每个应用，分别对每块磁盘（设备）做了多少读写。** 文章从一个典型需求出发：比如为MySQL做性能优化时，通常会把数据目录和日志目录分开挂载到不同的磁盘或分区上。这时，仅仅知道MySQL整体的IO量是不够的，必须能清晰分辨出是数据盘的随机读写在承压，还是日志盘的顺序写入成为瓶颈。作者针对这类“per设备per应用”的统计空白，介绍了一种实用的观测方法或工具（结合文章标题推断），其核心正是打通了应用和设备这两个维度的关联。这意味着，管理员可以直接回答“哪些应用在哪块磁盘上产生的IO负载最大”这类关键问题，从而让性能分析和资源调配有的放矢。对于运维和开发人员而言，这补全了从全局到应用、再到具体设备的IO观测链条，使得调优工作能建立在更精准的数据基础上。

本机暂存

IT 2011-04-01 13:34:18 / 累计浏览 1,940

oprofile抓不到采样数据问题和解决方法

这篇讲的是在新机器上使用oprofile进行性能分析时，可能会遇到采样数据为空的怪问题。作者从读者反馈出发，亲自在具体环境（RHEL 5.4内核2.6.18、华为RH2285服务器）中复现了该现象。文章完整记录了从使用aspersa查看系统配置、重置oprofile、启动分析到最终发现`/var/lib/oprofile/samples/current/`目录为空、opreport报错“No sample file found”的全过程。它清晰地展示了问题现象：所有命令都执行正常，daemon也已启动，但就是抓不到任何采样。对于正被此问题困扰的开发者，文章给出了针对性的排查思路和验证方法，能帮助大家快速定位自己环境中是配置有误还是遇到了相同的兼容性陷阱。

本机暂存

IT 2011-04-01 13:32:00 / 累计浏览 3,940

Linux下方便的socket读写查看器（socktop）

这篇文章介绍了一个名为 socktop 的实用工具，用于解决一个非常具体的排查痛点：在 Linux 环境下观测 Unix 域套接字（Unix domain socket）的数据流。作者从实际工作中的需求出发——同事需要确认两个程序间是否通过 Unix 域套接字成功收发了消息，但常用的网络抓包工具如 tcpdump 和 Wireshark 对此无能为力。文章随后引出了解决方案：socktop 是一个轻量级的诊断工具，能够实时监听并展示指定套接字上的读写操作与数据，让原本“不可见”的进程间通信变得清晰可查。内容不仅指出了问题所在，还直接给出了工具的使用场景和核心价值，对于需要进行本地 IPC 问题排查的开发者和运维人员来说，提供了一个即学即用的利器。文章的叙述平实而聚焦，从一个真实的问题切入，最终交付了一个具体的、可落地的技术方案。

本机暂存

IT 2011-03-30 14:01:00 / 累计浏览 3,700

突破systemtap脚本对资源使用的限制

这篇讲的是SystemTap脚本中一个常见又棘手的问题：当使用map数据结构存储监控数据时，脚本会因“Array overflow”错误而意外终止。作者从实际生产场景出发，指出这通常是因为脚本默认的map条目上限（MAXMAPENTRIES）不足以应对大规模数据收集。文章核心在于如何突破这个限制。它分析了错误的直接原因——当map中的键值对数量超过内核定义的阈值时，SystemTap会主动报错并停止运行，以防止资源耗尽。解决思路则围绕调整与优化展开：一方面可以手动调大MAXMAPENTRIES参数，但这需要权衡内核内存占用；另一方面，更根本的方法是优化脚本逻辑，例如及时清理不再需要的map条目，或改用其他数据聚合方式。对于需要长时间运行或监控高吞吐量系统的SystemTap用户来说，这篇文章提供的解决方案很实用。它帮助开发者理解错误的底层机制，从而能根据实际需求，在脚本的健壮性与系统资源消耗之间找到合适的平衡点。

本机暂存