IT技术博客大学习 共学习 共进步
全部 移动开发 后端 数据库 AI 算法 安全 DevOps 前端 设计 开发者

标签:进程监控

共 2 篇相关文章

IT 累计浏览 6,451

Linux下如何知道文件被那个进程写

这篇讲的是一个运维中常见的棘手场景:Linux下文件持续增长,但用lsof等工具却找不到对应的写入进程。作者从一位同学的实际困扰出发,指出问题的普遍性,并给出了一个基于内核视角的解决方案。 核心思路是,既然用户态工具难以追踪(可能是进程很快打开又关闭了文件),那就直接在内核的虚拟文件系统层进行监控。文章推荐使用SystemTap工具包中的inodewatch.stp脚本,它通过探测vfs.write事件,能根据文件所在的设备号(major/minor)和inode号,精准定位到正在执行写操作的进程。 作者随后用一个生动的实验进行了演示:用dd命令在后台持续写入一个测试文件,通过stat命令获取其inode和设备信息,然后运行stap脚本。终端立刻输出了正在执行vfs_write的dd进程信息(进程名、PID),瞬间“破案”。整个排查过程清晰直观,展现了SystemTap在内核级故障排查中的强大能力。

IT 累计浏览 5,538

netstat和web主机socket文件分析

这篇讲的是如何通过netstat命令和系统socket文件来分析Web主机的网络状态。作者从一次服务器响应变慢的实际排查经历出发,详细展示了在Linux环境下,如何使用netstat -tunlp快速列出所有监听端口及对应进程,并重点解读了ESTABLISHED、TIME_WAIT等关键状态连接数的含义。文章还进一步带读者进入/var/run/目录,分析了像nginx、mysql这类服务生成的sock文件,解释了Unix domain socket与网络socket的区别及其在进程间高效通信中的应用场景。 通过对比netstat提供的实时网络连接视图与socket文件揭示的进程间通信路径,文章清晰地勾勒出排查Web服务端口冲突、连接泄漏或进程僵死等问题的具体步骤。例如,当发现某个端口被意外占用,或大量TIME_WAIT堆积时,如何定位到具体的进程ID并采取相应措施。这种将标准命令行工具与底层文件系统观察相结合的思路,为系统管理员和后端开发者提供了一套实用且深入的诊断方法论。