awk是個優(yōu)秀文本處理工具,可以說是一門程序設(shè)計語言。下面是awk內(nèi)置變量。 一、內(nèi)置變量表 屬性 | 說明 | $0 | 當(dāng)前記錄(作為單個變量) | $1~$n | 當(dāng)前記錄的第n個字段,字段間由FS分隔 | FS | 輸入字段分隔符 默認(rèn)是空格 | NF | 當(dāng)前記錄中的字段個數(shù),就是有多少列 | NR | 已經(jīng)讀出的記錄數(shù),就是行號,從1開始 | RS | 輸入的記錄他隔符默 認(rèn)為換行符 | OFS | 輸出字段分隔符 默認(rèn)也是空格 | ORS | 輸出的記錄分隔符,默認(rèn)為換行符 | ARGC | 命令行參數(shù)個數(shù) | ARGV | 命令行參數(shù)數(shù)組 | FILENAME | 當(dāng)前輸入文件的名字 | IGNORECASE | 如果為真,則進(jìn)行忽略大小寫的匹配 | ARGIND | 當(dāng)前被處理文件的ARGV標(biāo)志符 | CONVFMT | 數(shù)字轉(zhuǎn)換格式 %.6g | ENVIRON | UNIX環(huán)境變量 | ERRNO | UNIX系統(tǒng)錯誤消息 | FIELDWIDTHS | 輸入字段寬度的空白分隔字符串 | FNR | 當(dāng)前記錄數(shù) | OFMT | 數(shù)字的輸出格式 %.6g | RSTART | 被匹配函數(shù)匹配的字符串首 | RLENGTH | 被匹配函數(shù)匹配的字符串長度 | SUBSEP | 34 |
2、實例 1、常用操作 1 2 | [chengmo@ localhost ~]$ awk '/^root/{print $0}' /etc/passwd
root:x:0:0:root: /root : /bin/bash
|
/^root/ 為選擇表達(dá)式,$0代表是逐行 2、設(shè)置字段分隔符號(FS使用方法) 1 2 | [chengmo@ localhost ~]$ awk 'BEGIN{FS=':'}/^root/{print $1,$NF}' /etc/passwd
root /bin/bash
|
FS為字段分隔符,可以自己設(shè)置,默認(rèn)是空格,因為passwd里面是”:”分隔,所以需要修改默認(rèn)分隔符。NF是字段總數(shù),$0代表當(dāng)前行記錄,$1-$n是當(dāng)前行,各個字段對應(yīng)值。 3、記錄條數(shù)(NR,FNR使用方法) 1 2 3 4 5 6 7 8 9 | [chengmo@ localhost ~]$ awk 'BEGIN{FS=':'}{print NR,$1,$NF}' /etc/passwd
1 root /bin/bash
2 bin /sbin/nologin
3 daemon /sbin/nologin
4 adm /sbin/nologin
5 lp /sbin/nologin
6 sync /bin/sync
7 shutdown /sbin/shutdown
……
|
NR得到當(dāng)前記錄所在行 4、設(shè)置輸出字段分隔符(OFS使用方法) 1 2 | [chengmo@ localhost ~]$ awk 'BEGIN{FS=':';OFS='^^'}/^root/{print FNR,$1,$NF}' /etc/passwd
1^^root^^ /bin/bash
|
OFS設(shè)置默認(rèn)字段分隔符 5、設(shè)置輸出行記錄分隔符(ORS使用方法) 1 2 | [chengmo@ localhost ~]$ awk 'BEGIN{FS=':';ORS='^^'}{print FNR,$1,$NF}' /etc/passwd
1 root /bin/bash ^^2 bin /sbin/nologin ^^3 daemon /sbin/nologin ^^4 adm /sbin/nologin ^^5 lp /sbin/nologin
|
從上面看,ORS默認(rèn)是換行符,這里修改為:”^^”,所有行之間用”^^”分隔了。 6、輸入?yún)?shù)獲取(ARGC ,ARGV使用) 1 2 3 4 | [chengmo@ localhost ~]$ awk 'BEGIN{FS=':';print 'ARGC='ARGC;for(k in ARGV) {print k'='ARGV[k]; }}' /etc/passwd
ARGC=2
0= awk
1= /etc/passwd
|
ARGC得到所有輸入?yún)?shù)個數(shù),ARGV獲得輸入?yún)?shù)內(nèi)容,是一個數(shù)組。 7、獲得傳入的文件名(FILENAME使用) 1 2 | [chengmo@ localhost ~]$ awk 'BEGIN{FS=':';print FILENAME}{print FILENAME}' /etc/passwd
/etc/passwd
|
FILENAME,$0-$N,NF 不能使用在BEGIN中,BEGIN中不能獲得任何與文件記錄操作的變量。 8、獲得linux環(huán)境變量(ENVIRON使用) 1 2 | [chengmo@ localhost ~]$ awk 'BEGIN{print ENVIRON['PATH'];}' /etc/passwd
/usr/lib/qt-3 .3 /bin : /usr/kerberos/bin : /usr/lib/ccache : /usr/lib/icecc/bin : /usr/local/bin : /bin : /usr/bin : /usr/local/sbin : /usr/sbin : /sbin : /usr/java/jdk1 .5.0_17 /bin : /usr/java/jdk1 .5.0_17 /jre/bin : /usr/local/mysql/bin : /home/web97/bin
|
ENVIRON是子典型數(shù)組,可以通過對應(yīng)鍵值獲得它的值。 9、輸出數(shù)據(jù)格式設(shè)置:(OFMT使用) 1 2 | [chengmo@ localhost ~]$ awk 'BEGIN{OFMT='%.3f';print 2/3,123.11111111;}' /etc/passwd
0.667 123.111
|
OFMT默認(rèn)輸出格式是:%.6g 保留六位小數(shù),這里修改OFMT會修改默認(rèn)數(shù)據(jù)輸出格式。 10、按寬度指定分隔符(FIELDWIDTHS使用) [chengmo@ localhost ~]$ echo 20100117054932 | awk ‘BEGIN{FIELDWIDTHS=”4 2 2 2 2 3″}{print $1″-”$2″-”$3,$4″:”$5″:”$6}’ 2010-01-17 05:49:32 FIELDWIDTHS其格式為空格分隔的一串?dāng)?shù)字,用以對記錄進(jìn)行域的分隔,F(xiàn)IELDWIDTHS=”4 2 2 2 2 2″就表示$1寬度是4,$2是2,$3是2 …. 。這個時候會忽略:FS分隔符。 11、RSTART RLENGTH使用 1 2 3 4 | [chengmo@ localhost ~]$ awk 'BEGIN{start=match('this is a test',/[a-z]+$/); print start, RSTART, RLENGTH }'
11 11 4
[chengmo@ localhost ~]$ awk 'BEGIN{start=match('this is a test',/^[a-z]+$/); print start, RSTART, RLENGTH }'
0 0 –1
|
RSTART 被匹配正則表達(dá)式首位置,RLENGTH 匹配字符長度,沒有找到為-1.
|