第12章 正则表达式与文件格式化处理–《鸟哥的Linux》

  •   
  • 4296
  • Linux
  • 0
  • super_dodo
  • 2013/10/11

重点回顾:

1.正则表达式就是处理字符串的方法,它是以行为单位来进行字符串的处理行为。

2.正则表达式通过一些特殊符号的辅助,可以让用户轻易达到查找、删除、替换某特定字符串的处理过程。

3.只要工具程序支持正则表达式,那么该工具程序就可以用来作为正则表达式的字符串处理之用。

4.正则表达式与通配符是完全不一样的。通配符(wildcard)代表的是bash操作接口的一个功能,但正则表达式则是一种字符串处理的表示方式!

5.使用grep或其他工具进行正则表达式的字符串比较时,因为编码问题会有不同的状态,因此,最好将LANG等变量设置为C或者en等英文语系!

6.grep与egrep在正则表达式里面是很常见的两个程序,其中egrep支持更严谨的正则表达式的语法。

7.由于编码系统的不同,不同的语系(LANG)会造成正则表达式选取数据的区别,因此可以利用特殊符号如[:upper:]来替代编码范围较佳。

8.由于严谨度的不同,正则表达式之上还有更严谨的扩展正则表达式。

9.基础正则表达式的特殊字符有*,?,[],[-],[^],^,$等。

10.常见的正则表达式工具有grep、sed、vim等.

11.printf可以通过一些特殊符号来将数据进行格式化输出。

12.awk可以使用“字段”为依据,进行数据的重新整理与输出。

13.文件的比较中,可以利用diff及cmp进行比较,其中diff主要用在纯文本文件方面的新旧版本比较。

14。patch命令可以将旧版数据更新到新版(主要由diff创建patch的补丁来源文件).