AWK正規表示式


AWK有非常強大和高效的處理正規表示式。一些複雜的任務,可以使用簡單的正規表示式解決。任何命令列專家都知道正規表示式的威力。

本教學介紹使用合適的例子標準的正規表示式。

Dot(點)

它匹配的行字元結束,除非任何單個字元。例如下面簡單的例子匹配 fin, fun, fan等。

[jerry]$ echo -e "cat\nbat\nfun\nfin\nfan" | awk '/f.n/'

在執行上面的程式碼後,得到以下結果:

fun
fin
fan

行的開始

它匹配行的開始。比如下面的例子列印所有使用模式行的開始。

[jerry]$ echo -e "This\nThat\nThere\nTheir\nthese" | awk '/^The/'

在執行上面的程式碼後,得到以下結果:

There
Their

行結尾

行的末尾匹配。比如下面的例子列印帶有字母n結束的行。

[jerry]$ echo -e "knife\nknow\nfun\nfin\nfan\nnine" | awk '/n$/'

在執行上面的程式碼後,得到以下結果:

fun
fin
fan

匹配字元集

它被用來匹配只有一個幾個字元。比如下面的例子匹配模式Call 和Tall 但不是Ball。

[jerry]$ echo -e "Call\nTall\nBall" | awk '/[CT]all/'

在執行上面的程式碼後,得到以下結果:

Call
Tall

排他設定

在排他性設定插入否定設定在方括號字元。例如範例下面的只列印Ball。

[jerry]$ echo -e "Call\nTall\nBall" | awk '/[^CT]all/'

在執行上面的程式碼後,得到以下結果:

Ball

變更

豎線允許正規表示式來進行邏輯或運算。比如下面的例子列印Ball 和 Call。

[jerry]$ echo -e "Call\nTall\nBall\nSmall\nShall" | awk '/Call|Ball/'

在執行上面的程式碼後,得到以下結果:

Call
Ball

零次或一次

它匹配零次或一次出現前面的字元。比如下面的例子匹配Colour以及Color。我們通過使用由u作為一個可選的字元?

[jerry]$ echo -e "Colour\nColor" | awk '/Colou?r/'

在執行上面的程式碼後,得到以下結果:

Colour
Color

零個或多個出現

它匹配零個或多個出現前面的字元。例如下面的例子匹配ca, cat, catt等等。

[jerry]$ echo -e "ca\ncat\ncatt" | awk '/cat*/'

在執行上面的程式碼後,得到以下結果:

ca
cat
catt

一個或多個出現

它匹配前面一個或多個出現的字元。比如下面的例子匹配2的一個或多個出現。

[jerry]$ echo -e "111\n22\n123\n234\n456\n222"  | awk '/2+/'

在執行上面的程式碼後,得到以下結果:

22
123
234
222

分組

括號()被用於分組和字元|被用於替代品。例如下面的正規表示式匹配任何含有Apple Juice 或 Apple Cake.

[jerry]$ echo -e "Apple Juice\nApple Pie\nApple Tart\nApple Cake" | awk '/Apple (Juice|Cake)/'

在執行上面的程式碼後,得到以下結果:

Apple Juice
Apple Cake