DevOps

共 867 篇文章

IT 2016-03-18 14:14:23 / 累计浏览 2,424

Docker基础技术：Linux CGroup

这篇讲的是Docker背后的核心资源隔离技术——Linux CGroup。作者从Namespace只解决“环境隔离”但无法限制“资源使用”这一痛点切入，引出了CGroup的必要性。 CGroup（控制组）是Linux内核的功能，最初由Google工程师在2006年发起，旨在为进程组分配和隔离CPU、内存、磁盘I/O等计算资源。文章清晰地归纳了它的四大核心能力：资源限制、优先级控制、审计统计以及进程挂起/恢复。这些能力让系统管理员能像为虚拟机分配资源一样，精细地管控容器或一组进程。文中通过一个生动的实例展示了CGroup的威力：一个耗尽CPU的“死循环”程序，在被加入一个CPU份额设为20%的CGroup后，其CPU占用立刻降至约20%。这种通过操作 `/sys/fs/cgroup` 下的文件（如 `cpu.cfs_quota_us` 和 `tasks`）来即时调控资源的方式，直观地体现了CGroup作为一种基于文件系统的接口的设计思路。对于想理解Docker如何实现资源限制的读者，这篇文章提供了扎实的原理和可动手实践的细节。

本机暂存

IT 2016-03-18 14:13:05 / 累计浏览 2,264

Docker基础技术：Linux Namespace（下）

这篇讲的是Docker底层Linux Namespace的后半部分，作者从上一篇的铺垫出发，聚焦在User Namespace和Network Namespace这两个关键能力上。对于User Namespace，文章不仅解释了容器内用户身份被重映射（默认为65534）的原理，还深入到了`/proc//uid_map`文件的三字段格式与写入规则，并附上一段完整的C代码示例，展示了如何通过父子进程协作与管道同步，在创建容器时完成从普通用户到容器内root的UID映射，以此提升安全性。在Network Namespace部分，文章通过一张经典的Docker宿主机网络示意图，说明了容器如何获得独立的网络栈，并提及了`docker0`网桥、`veth`虚拟网卡对以及容器默认使用的私有网段。整体内容硬核，将抽象的隔离机制与具体的文件操作、代码实现紧密结合，对于想深入理解容器安全与网络隔离根基的读者来说，是一篇扎实的进阶指南。

本机暂存

IT 2016-03-18 14:12:04 / 累计浏览 3,287

Docker基础技术：Linux Namespace（上）

这篇讲的是Docker“新瓶装旧酒”背后的关键内核技术——Linux Namespace。作者从Docker并非全新技术切入，指出其核心是巧妙运用了已有的Linux内核能力，旨在带读者“山寨”一个简易Docker。文章重点解析了Namespace提供的六种隔离机制，包括UTS（主机名）、IPC（进程间通信）、PID（进程ID）等。作者并未停留在概念罗列，而是通过一组清晰的C语言代码示例，一步步演示了如何使用`clone()`系统调用配合不同的`CLONE_NEW*`参数，来实现具体的隔离效果。例如，子进程在独立的UTS命名空间中修改hostname，不会影响宿主机；在独立的PID空间里，其初始进程会成为PID 1。这种“上代码、看结果”的讲解方式，将抽象的“环境隔离”概念变得直观可感。对于想理解容器技术（不仅仅是Docker）底层原理的开发者而言，文章提供了从理论到动手验证的完整路径，是理解Linux容器化技术基石的实用入门。

本机暂存

IT 2016-03-17 00:07:26 / 累计浏览 1,467

Linux文件系统基础之inode和dentry

这篇讲的是Linux文件系统中两个最核心的元数据结构——inode和dentry，以及它们如何协同工作来构建我们熟悉的文件目录。作者从虚拟文件系统VFS的抽象层入手，解释了为什么需要这些结构来统一管理底层不同的实体文件系统（如ext4）。文章指出，inode是内核中文件对象的唯一标识，它存储了权限、属组、数据块位置等所有静态元数据，但刻意不包含文件名。而文件名与inode的映射关系，则由目录项dentry在内存中动态建立和维护。通过阅读文件路径时内核的解析过程，文章清晰地展示了dentry如何通过内存中的树状结构，高效地缓存和还原出文件系统的目录层次。这种设计将稳定的磁盘结构与灵活的内存缓存分离，是Linux文件系统高性能的关键。理解了inode和dentry，文章最后点明，文件链接的奥秘也迎刃而解：软链接拥有独立的inode和内容，而硬链接仅仅是为同一个inode在目录项中新增了一条名字映射，并通过引用计数管理生命周期。整篇文章从底层原理出发，把看似复杂的文件系统机制拆解得条理分明。

本机暂存

IT 2016-03-17 00:05:02 / 累计浏览 2,487

securecrt linux与windows 互传文件

这篇讲的是如何用SecureCRT自带的sz/rz命令，来替代传统FTP/SFTP工具进行Windows与Linux间的文件互传。作者开篇就点出了常见方案的痛点：FTP/SFTP工具操作繁琐，尤其在目录层级较深时体验不佳。文章的核心是介绍sz（下载）和rz（上传）这对命令。通过具体配置和代码示例，它展示了如何先在SecureCRT中设置默认的传输目录，然后直接使用`sz 文件名`将Linux文件下载到指定本地路径，或使用`rz`弹出窗口选择本地文件上传到Linux当前目录。整个过程不需要启动额外客户端，直接在终端里就能完成。不过，文章也坦诚地指出了局限：sz/rz对于小文件传输非常便捷，但传输大文件时速度会比较慢。因此，这个方案特别适合那些需要频繁、快速交换中小型文件的运维或开发场景，能显著提升工作效率。

本机暂存

IT 2016-03-14 23:21:32 / 累计浏览 2,322

建立私有的 yum 源站

在企业内部运维中，管理统一的软件包源是个常见需求。这篇讲的是如何从零搭建一个私有 yum 源站，非常适合需要集中管控软件分发的团队。作者从最基础的三要素讲起：准备好要发布的 rpm 包、使用 `createrepo` 工具建立索引，最后通过 webserver（或本地/FTP）提供服务。文章直接给出了可操作的步骤。从安装 `createrepo` 工具开始，到创建分层目录、复制 rpm 包，再到执行 `createrepo` 命令生成索引，每一步都有明确的命令示例。特别提醒了关键细节：每次新增 rpm 包后，都需要重新执行索引生成命令，否则客户端可能无法感知更新。整个过程聚焦于 yum 源的核心构建逻辑，将 webserver 的具体配置留给读者自行扩展。对于想要快速搭建内部源、减少对外部网络依赖的运维人员，这套方法提供了一个轻量且清晰的起点。

本机暂存

IT 2016-03-10 00:08:53 / 累计浏览 2,040

多 SSH Key 管理技巧与 Git 多账户登录问题

这篇技术文章从开发者日常需要频繁登录多台远程服务器的场景出发，介绍了一种高效的管理方式。作者指出，虽然直接使用 `ssh` 命令配合端口号、别名等方式能工作，但当服务器数量增多时，命令会变得冗长且难以维护。文章的核心解决方案是熟练运用 `~/.ssh/config` 配置文件。通过为不同主机（如工作服务器、个人代理、学校数据库）设置简洁的 `Host` 别名，并预先配置好对应的 `HostName`、`User`、`Port` 甚至 `IdentityFile`（指定不同的SSH密钥）和 `LocalForward`（端口转发）规则，可以将复杂的登录逻辑固化下来。此后，只需输入一个简单的别名即可建立连接。作者通过多个配置实例，清晰地展示了如何将一条可能包含多重参数的复杂命令，转化为结构清晰、易于管理的配置项。这种方式不仅极大提升了日常登录的效率，也使得对不同环境、不同密钥的切换与管理变得一目了然。对于需要同时处理多个项目和远程环境的开发者而言，掌握这项技巧能有效减少心智负担。

本机暂存

IT 2016-03-10 00:00:24 / 累计浏览 3,581

初入运维的小伙伴，别再问需不需要学Python了

这篇讲的是运维人员该不该学Python的老话题。作者从百度知道上一个常见的提问切入，观点很明确：掌握一门开发语言，尤其是Python，已经是高级运维工程师的必备技能。文章认为，不会开发，就难以深入理解业务流程、优化性能，也无法在复杂场景（如数千台服务器）中实现真正的自动化运维，只能依赖通用工具或拼凑开源软件。而Python恰好能胜任，它既是强大的脚本语言，满足绝大部分自动化需求，又能用于开发后端的C/S架构和Web界面，让运维人员有能力构建自己的运维平台，从而体现核心价值。作者也对比了其他语言。比如，PHP更专注于Web；Java显得臃肿；C++在运维场景中多数时候“是为了来装B的”；而Go语言虽新，但预计不会成为运维开发的主流。同时，针对“Python效率低”的说法，作者指出程序效率更取决于开发者本身，并以Tornado框架在Python下实现高并发作为例证，强调语言本身的影响只占一部分。文章的核心结论是：别再纠结“需不需要学”，Python因其简洁、全面和生态优势，就是运维转向开发、提升竞争力的首选工具。

本机暂存

IT 2016-03-09 23:59:15 / 累计浏览 1,724

如何通过 Yum 安装 Pure-ftpd

这篇教程从配置Yum源讲起，演示了在CentOS系统上快速部署Pure-ftpd FTP服务器的完整流程。核心方案是通过阿里云的EPEL源来获取软件包，从而解决官方源可能缺失的问题。教程的关键操作包括修改pure-ftpd.conf配置文件，例如启用日志、设置虚拟用户数据库路径、关闭匿名登录，以及配置被动模式下的端口范围（48000-50000）。作者还详细说明了如何创建系统用户与虚拟用户，并设置相应的目录权限。为了确保服务可被外部访问，文中补充了防火墙规则的配置，放行了控制端口21和被动模式端口。最后，通过chkconfig和init.d脚本实现服务的持久化与启动。整套流程完整且实用，适合需要快速搭建FTP服务的运维人员直接参照。

本机暂存

IT 2016-03-09 23:39:27 / 累计浏览 2,944

如何设计软件模块的自动化测试？

这篇指南聚焦于如何为软件模块设计自动化测试，作者从模块的交互模式出发，将测试对象清晰地划分为两大类：消息触发型和主动扫描型。对于“守株待兔”的消息触发型模块，核心在于开发一个能模拟外部消息的测试程序，让它发送请求并等待响应，从而验证模块处理逻辑的正确性。而对于“主动出击”的主动扫描型模块，测试思路则是通过测试程序向其数据源（如数据库）注入测试数据，然后监听并验证它后续发出的消息或动作。文章不仅给出了对应的自动化测试框架图和详细的消息流程，还分享了宝贵的实战经验。比如，务必首先确保测试程序的消息接口协议和链路配置无误；测试初期宜用少量数据跑通流程，再逐步放量；为耗时较长的测试用例设置超时机制，避免无限等待；以及规范测试报告的存储与格式，方便结果集成与展示。自动化测试的终极目标是让机器承担重复的验证工作，在版本迭代中快速捕获回归缺陷。这篇内容为开发者设计针对不同交互模式模块的测试方案，提供了非常具体和可落地的参考框架。

本机暂存

IT 2016-03-09 12:53:37 / 累计浏览 3,562

腾讯资深运维专家周小军：QQ与微信架构的惊天秘密

这篇来自腾讯资深运维专家周小军的深度访谈，从一位“运维老兵”的视角，揭开了支撑QQ与微信海量社交数据背后那套复杂而精巧的存储与运维体系。访谈的核心亮点在于对微信与QQ核心存储架构差异的剖析。周小军详解了二者背后的NoSQL系统：微信消息业务依赖强调强一致性的Quorum_KV，它面向写多读少场景，通过Quorum协议保证数据可靠；而QQ的Grocery则采用最终一致性模型，优化读写均衡性能。这种“量体裁衣”的设计思想，正是应对不同社交产品数据特性的关键。此外，文章还清晰梳理了腾讯如何通过“全网调度”、SET标准化单元部署、以及华南/华中/华北三地同步等机制，构建起应对单机房故障的高可用容灾体系。除了硬核架构，周小军也毫无保留地分享了个人从天涯到腾讯的十余年运维心路，强调了运维的终极目标是提供“超出预期的服务能力”，并坚持通过“一万小时定律”与持续突破舒适区来锻造专业度。

本机暂存

IT 2016-03-07 23:56:39 / 累计浏览 1,765

使用whiptail在shell脚本中创建交互式对话框？

这篇文章介绍了一个让Shell脚本“活”起来的实用工具——whiptail。它能帮助你在纯终端环境下，快速创建出直观的用户交互界面，就像许多Linux软件安装过程中弹出的对话框一样。作者详细演示了whiptail的多种对话框类型，包括最基础的消息确认框（msgbox）、提供是/否选项的决策框（yesno），以及能接收用户文本输入的表单框（inputbox）。对于需要处理敏感信息的场景，还专门讲解了密码输入框的实现方法。更进一步，文章展示了如何用whiptail构建复杂的选择逻辑：创建单选菜单（menu）、单选列表（radiolist）供用户选择一项，以及多选清单（checklist）让用户勾选多个偏好。最后，它甚至支持在脚本中显示一个实时进度条（gauge），让长时间的任务反馈更友好。 whiptail是一个预先安装在大多数Linux发行版中的工具，这意味着你可以直接在脚本中调用它，无需额外安装。掌握它，就能轻松将你的脚本从简单的命令行工具，升级为具备良好用户体验的交互式程序。

本机暂存

IT 2016-03-03 14:19:27 / 累计浏览 3,785

IaaS、PaaS、SaaS 之间的区别

这篇讲的是云计算里三个最核心的层级模型：IaaS、PaaS和SaaS到底有什么不同。作者从“云”这个概念入手，先说明云计算本质上是分层的：最底层的IaaS（基础设施即服务）直接提供了虚拟化的服务器、存储和网络硬件，企业可以像租水电一样租用这些资源，省去了自建机房的麻烦，适合需要灵活控制底层环境的技术团队。往上一层是PaaS（平台即服务），它提供了完整的开发和部署环境。开发者不用再操心操作系统、数据库这些基础软件的安装维护，可以专注于应用本身的编写与协作，像Heroku、Google App Engine都是这类服务的代表。而最上层的SaaS（软件即服务）则与我们日常使用最贴近，所有功能都通过浏览器交付，比如我们常用的Google Docs、Dropbox或是Salesforce的CRM系统，用户开箱即用，无需关心底层任何技术细节。文章最后也指出，随着技术演进，像容器技术催生的CaaS等新模式不断出现，这些名词的界限其实在商业化的概念普及中变得模糊了。真正的理解，还是在于它们各自解决了用户哪一层的问题。

本机暂存

IT 2016-03-02 23:44:37 / 累计浏览 2,641

nc 传送文件

这篇讲的是如何用nc（netcat）这个网络工具直接传输文件，省去了传统方法中压缩、解压或配置权限的麻烦。作者从一个非常实用的角度切入，直接给出了传送整个文件夹和单个文件的具体命令行操作。文章核心在于展示nc配合管道和tar命令的简洁性。传送文件夹时，发送端通过tar打包压缩后管道给nc，接收端则监听端口并用tar解压还原，整个过程一步到位。对于单个文件，方法更为直接，用cat或重定向即可完成内容流式传输。这种用法尤其适合内网环境下快速交换配置文件或日志。作者没有展开复杂原理，而是聚焦于命令的实际写法和效果。通过这两组清晰的命令示例，读者能立刻上手操作，体会到这种轻量级方案在运维和开发场景中的便利性。

本机暂存

IT 2016-03-01 23:50:08 / 累计浏览 3,383

2015年版阿里云ECS服务器使用总结（与aws比较）

这篇讲的是国内云服务商阿里云和亚马逊AWS在服务器产品上的直接较量。作者从价格、稳定性、速度等多个维度进行了详细对比。价格上，阿里云包月实例比AWS同配置便宜约40%，但AWS的预留实例方案可将价格拉平。稳定性方面，AWS整体表现更可靠，而阿里云则以超快的工单响应和给力的客服支持取胜。速度测试是文章的重点。通过实测发现，阿里云1Mbps带宽下载速度约42-60KBs，但属于共享带宽，并发能力弱；AWS带宽上限更高，下载速度可达900KBs且不受影响。连接时间上，阿里云杭州节点（约280ms）明显优于北京节点（约2000ms），甚至快于AWS东京节点（约140ms）。在服务与备案等本土化体验上，阿里云具有明显优势。文章最后给出了务实的选择建议：对于需要全栈云服务的国内创业团队，阿里云已能满足基本需求；而追求更成熟技术架构的团队，可继续关注AWS中国区的发展。

本机暂存

IT 2016-02-20 16:42:46 / 累计浏览 1,622

linux下redis执行bgsave时，报overcommit_memory错误问题

这篇讲的是 Redis 在内存紧张时执行 bgsave 可能遭遇的 overcommit_memory 报错问题。作者从实际故障现象切入，详细说明了错误提示的含义：当系统内存耗尽，fork 子进程进行后台保存时，若恰有数据变更需要申请内存，就可能因分配失败而终止保存。根本原因在于 Linux 内核的内存分配策略参数 `vm.overcommit_memory` 默认为 0，较为保守。文章进一步剖析了这个内核参数的三个取值含义，并明确给出解决方案：将该参数设置为 1，允许内存适度超量分配。具体操作提供了三种方法：修改 sysctl.conf 文件、直接运行 sysctl 命令或写入 proc 文件系统，并附上了验证命令。此外，文章还延伸讨论了与内存管理密切相关的 OOM Killer 机制，解释了 Linux 如何选择进程终止来释放内存，并介绍了如何通过 /proc/meminfo 查看 CommitLimit 和 Committed_As 等关键内存指标。整篇文章逻辑清晰，从问题到原理再到解决和扩展，为处理此类内存配置问题提供了完整思路。

本机暂存

IT 2016-02-16 22:22:24 / 累计浏览 4,912

不要在linux上启用net.ipv4.tcp_tw_recycle参数

这篇文章从一个常见但危险的运维操作入手——启用Linux的 `net.ipv4.tcp_tw_recycle` 参数来加速TIME-WAIT状态回收。作者指出，尽管很多网络指南建议启用该参数以快速释放端口，但官方手册已明确警告其在NAT（网络地址转换）环境下的严重问题。文章深入剖析了问题的根源：当多个设备通过同一NAT出口访问服务器时，该参数会基于源IP地址快速回收连接，导致来自不同客户端、但具有相同出口IP的合法新连接被错误丢弃。这在家庭、网吧或企业网络中会引发大量难以排查的TCP连接建立失败。与此同时，文章对比了功能相似的 `net.ipv4.tcp_tw_reuse` 参数，阐明其在协议层面更安全，适用于客户端主动发起连接的场景。作者旨在纠正互联网上流传的错误优化建议，并借助清晰的TCP状态图解，从原理上讲解TIME-WAIT状态存在的必要性，帮助读者真正理解协议设计，避免因盲目调参而引入隐蔽故障。

本机暂存

IT 2016-02-16 20:58:35 / 累计浏览 2,202

使用vi命令出现Swap file "..." already exists!警告

这篇讲的是 Linux 用户用 `vi` 编辑文件时，可能遇到的一个经典小麻烦。具体来说，当你尝试打开一个文件时，可能会收到 “Swap file '...' already exists!” 的警告，导致无法正常进入编辑界面。文章作者在强制关机后就碰到了这个问题。其根本原因在于，`vi` 在编辑文件时会在同目录下生成一个隐藏的交换文件（.swp），用于数据恢复。这个警告意味着该文件已经存在，可能是上次编辑未正常退出，或文件正被其他用户编辑所致。文章提供的解决方案非常直接：进入文件所在目录，使用 `ls -a` 命令显示出所有隐藏文件，找到并删除那个对应的 `.swp` 文件（例如 `hello.ksh.swp`），然后就能重新正常打开原文件了。这个操作简单有效，清除了 `vi` 认为“正在被占用”的锁信号。对于经常在终端工作的朋友来说，这是一个很实用的故障排查小技巧。文章演示了从遇到报错、分析原因到动手解决的完整思路。

本机暂存

IT 2016-02-16 20:57:37 / 累计浏览 2,343

SecureCRT怎么设置字符集编码及缓存

使用SecureCRT连接Linux终端时，中文字符乱码是个常见问题。这篇教程详细拆解了问题的根源和彻底解决的方法。问题的根本原因在于字符编码不匹配。教程指出，只需将SecureCRT的默认编码设置为UTF-8，即可同时解决显示乱码和输入乱码两大问题。它提供了清晰的全局设置路径：从“Options”菜单进入“Global Options”，然后编辑默认会话设置，在“Appearance”选项卡中找到并勾选“Character encoding”为UTF-8。除了编码，文章还顺带讲了一个实用技巧——如何调整回滚缓冲区大小。在同一个配置界面的“Emulation”部分，可以将“Scrollback buffer”从默认的500行调大，最大支持128000行，方便回溯更长的历史命令输出。教程最后也提醒，上述修改会影响所有新建的连接。如果只想让某个特定会话生效，应该通过“Session Options”进行单独配置，这为用户提供了灵活的选择。

本机暂存

IT 2016-02-12 17:49:23 / 累计浏览 1,382

OS X 下好用的磁盘空间分析工具: ncdu

这篇讲的是在 OS X 下分析磁盘空间占用的两个选择：一个是界面精美但需要付费的图形化工具 Daisy Disk，另一个是免费、命令行风格的替代品 ncdu。作者从不想为软件付费的“抠门”心态出发，找到了 ncdu 作为解决方案。文章将两者做了对比：Daisy Disk 用环形图直观展示空间占用，体验优秀；ncdu 则在终端运行，用键盘操作，是“命令行版的 Daisy Disk”，更符合极客口味，但扫描时不会智能跳过挂载点，需要手动添加排除参数。文章的核心是提供了 ncdu 的实用指南：通过 `brew install ncdu` 即可快速安装。使用时，简单的 `ncdu ~` 可以分析个人文件夹，而扫描整个系统盘或外部硬盘时，则需要用 `ncdu / --exclude /Volumes` 这样的命令来排除干扰。最终，作者认为两者各有适用场景：习惯图形界面的用户可以选择购买 Daisy Disk，而偏好命令行或预算有限的用户，ncdu 是一个高效且免费的得力工具。

本机暂存