技术头条 - 一个快速在微博传播文章的方式     搜索本站
您现在的位置首页 --> Linux --> 使用Vim(gvim)实现复杂的查找替换的一个例子

使用Vim(gvim)实现复杂的查找替换的一个例子

浏览:2503次  出处信息

今天老婆在整理文档的时候希望能快捷的排版某些格式,无奈发现word并不能满足要求,所以就让我用Vim试一下。
问题如下:

1 加州大学伯克利分校 University of California Berkeley 
2 加州大学洛杉机分校 University of California Los Angeles 
3 威斯康星大学麦迪逊分校 University of Wisconsin Madison
4 康乃尔大学 Cornell University 
=伊利诺伊大学厄本那―香槟分校 University of Illinois Urbana Champaign
6 卡内基美隆大学 Carnegie Mellon University 
=斯坦福大学 Stanford University 
=芝加哥大学 The University of Chicago

上面的文字都是用空格隔开的,现在希望拆分成三列,即数字一列,中文一列,英文一列,中间用tab键隔开,因为这样拷贝到excel中的时候直接就是3列。
考虑的步骤如下:

1.把=替换成上面一行的那个数字。
2.把最后一个数字后面的空格替换成tab
3.把最后一个中文字符后面的空格替换成tab。

OK,思路是这样的,在我们继续之前,我们还是先回顾加了解一些东东:

匹配数字:\d
匹配非数字:\D
匹配任意中文字符:[^\x00-\xff]
匹配非中文字符:[\x00-\xff]

好,知道了这些之后,我们开始~~

第一步:

%s/^\(\d\+\)\(\s.*\n\)=/\1\2\1 /gc

或者

%s/^\(\d\+\)\(\s.*\n\)\(=\)\(.*$\)/\1\2\1 \4/gc

这个命令实现了匹配一行之后的第一个=,并将其替换为上一行的数字,需要说明的就是\(\)中的内容,会被作为\1\2\3这样来标识,可以避免替换掉不想替换的内容。
这个命令只能实现匹配紧跟行后的第一个=,所以如果有多个=的话,需要执行多次。
还有就是,你会发现我在被替换的内容中,空格使用\s的,但是在替换的内容中,我是直接用了空格,貌似在后面的部分里不支持转义,所以只能用原来的字符-即空格。

第二步:

%s/\(\d\+\)\s/\1\t/gc

这个也比较简单,就是实现了最后一个数字后面的空格替换为tab(\t),我也不知道为啥\t在这里可以转义,但是上面的\s却不可以呢

最后一步:

%s/\([^\x00-\xff]\+\)\s/\1\t/gc

这里用到了上面提到的中文字符的匹配,实质上和第二步是一样的~~
OK,到了这里就全部结束啦,让我们看看最后的结果:

1 加州大学伯克利分校 University of California Berkeley 
2 加州大学洛杉机分校 University of California Los Angeles 
3 威斯康星大学麦迪逊分校 University of Wisconsin Madison
4 康乃尔大学 Cornell University 
4 伊利诺伊大学厄本那―香槟分校 University of Illinois Urbana Champaign
6 卡内基美隆大学 Carnegie Mellon University 
6 斯坦福大学 Stanford University 
6 芝加哥大学 The University of Chicago

OK,完全符合要求~~
附件中是写的脚本,按下F9就可以执行。(由于考虑到实际问题,第一步中仅把=替换为0 )
脚本下载

建议继续学习:

  1. VIM查找替换归纳总结    (阅读:4491)
  2. vim替换^M字符    (阅读:3816)
  3. string替换所有指定字符串(C++)    (阅读:3308)
  4. 使用tcpdump搞定一个替换问题    (阅读:2536)
  5. CSS图片替换    (阅读:1918)
QQ技术交流群:445447336,欢迎加入!
扫一扫订阅我的微信号:IT技术博客大学习
  • 作者:Dante    来源: Vimer
  • 标签: 替换
  • 发布时间:2009-12-18 23:31:25
© 2009 - 2024 by blogread.cn 微博:@IT技术博客大学习

京ICP备15002552号-1