学习Grep，Sed中的正则

火丁笔记 2010-10-31 20:27:05 累计浏览 5,406 次

本机暂存

标签 Grep Regex Sed

内容概览

这篇文章从那个关于学习正则表达式的经典段子切入，带出了一个很实际的问题：如何真正掌握和运用这项强大的文本处理技术。作者没有单独讲语法，而是将正则表达式的学习与Grep、Sed这两个经典的命令行工具紧密结合。

它详细拆解了如何用Grep进行快速的模式搜索与匹配，以及如何用Sed执行更复杂的查找与替换操作。文章的核心在于对比和辨析：正则表达式在不同工具中的语法差异、元字符的微妙不同，以及各自最适合的实战场景。比如，是用Grep的 `-P` 参数启用Perl兼容的正则，还是用Sed的 `-E` 选项，作者都给出了清晰的指引和实例。

文章不仅列出了常用语法，更通过实际案例（如日志分析、配置文件修改）来演示从简单匹配到复杂替换的完整流程，帮助读者避开常见的陷阱。这更像是一篇面向实战的指南，告诉你在具体的运维或开发任务中，该如何选择工具、组合使用，从而真正提升工作效率。

据说有这么一个段子：

毛泽东说：三天不学习，赶不上刘少奇。
刘少奇说：一天不用功，赶不上毛泽东。

到底是老百姓作的打油诗，还是政客对的对联，早已无从考证。

…

STOP！回到主题上来，正则是必须时常温习的知识，下面学习Grep，Sed中的正则。

问题：从一个文本文件里筛选出含有电话号码的行，电话号码是由七位或者八位阿拉伯数字组成（开头不是零），并且被单引号或者双引号包裹。

鉴于问题的需要，先杜撰一份数据：

# cat /path/to/data.txt
'7654321'
'7654321"
"87654321"
"87654321'

失败的尝试

# grep "(['\"])[1-9][0-9]{6,7}\1" /path/to/data.txt
grep: Invalid back reference
# sed -n "/(['\"])[1-9][0-9]{6,7}\1/p" /path/to/data.txt
sed: -e expression #1, char 25: Invalid back reference

成功的尝试

使用Basic Regular Expressions (BRE)

# grep "\(['\"]\)[1-9][0-9]\{6,7\}\1" /path/to/data.txt
'7654321'
"87654321"
# sed -n "/\(['\"]\)[1-9][0-9]\{6,7\}\1/p" /path/to/data.txt
'7654321'
"87654321"

使用Extended Regular Expressions (ERE)

# grep -E "(['\"])[1-9][0-9]{6,7}\1" /path/to/data.txt
'7654321'
"87654321"
# sed -n -r "/(['\"])[1-9][0-9]{6,7}\1/p" /path/to/data.txt
'7654321'
"87654321"

总结，Grep和Sed同时支持BRE和ERE两种正则，缺省情况下，Grep和Sed使用的都是BRE正则，通过增加命令参数（grep -E / sed -r），Grep和Sed可以支持ERE正则。

BTW：Regular expression From Wikipedia, the free encyclopedia

同分类推荐文章

等了十年的 Go 链式管道，终于来了：seq 让你像写 Scala 一样写 Go （2026-06-25 18:38:18）
Go 实验特性详解（2026-06-21 10:05:27）
amd64 微架构级别对 Go 程序性能提升多少？（2026-06-21 09:38:49）

查看更多后端文章 →

建议继续学习

28个Unix/Linux的命令行神器（累计阅读 16,790）
利用find和sed批量替换文件内容（累计阅读 11,458）
Linux grep命令用法（累计阅读 7,060）
正则表达式 — QQ微信、优酷前端邮箱正则表达式验证 Bug （累计阅读 6,655）
linux下的高效代码搜索工具-ack （累计阅读 6,650）
grep 正则表达式选项要记得转义（累计阅读 6,588）
记一下我的ubuntu升级到10.04时遇到都问题（累计阅读 4,853）
SED命令行脚本快速参考，AWK命令行脚本快速参考,perl命令行脚本快速参考（累计阅读 4,831）
URL正则表达式（累计阅读 4,785）
前端性能优化之Html压缩（累计阅读 4,739）