目录
工作原理
命令格式
普通格式
BEGIN格式
语句循环格式
awk常见的内建变量(可直接用)
按行打印行内容
统计行数量
按字段输出文本
通过管道、双引号调用 Shell 命令
awk编辑器是一种流编辑器
工作原理
- 逐行读取文本,默认以空格或tab键为分隔符进行分隔,将分隔所得的各个字段保存到内建变量中,并按模式或者条件执行编辑命令。
- awk信息的读入也是逐行读取的,执行结果可以通过print的功能将字段数据打印显示。
- 在使用awk命令的过程 中,可以使用逻辑操作符“&&“表示“与”、“||“表示“或”、“!“表示“非”;还可以进行简单的数学运算,如+、-、*、/、%、^分别表示加、减、乘、除、取余和乘方。
命令格式
普通格式
awk 选项 '模式或条件 {操作}' 文件 1 文件 2 … #对文件1,文件2进行操作
awk -f 脚本文件 文件 1 文件 2 … #用脚本对对文件1,文件2进行操作
BEGIN格式
awk 'BEGIN {...}; 条件{...}; END {...}' 文件
- BEGIN {...} 表示处理文件前要执行的操作
- 条件{...} 表示对匹配满足指定条件的文件行内容要执行的操作
- END {...} 表示处理完文件所有行内容后要执行的操作
语句循环格式
awk '{控制语句条件 {操作}}' 文件
awk 'if(条件表达式) {操作}' 文件 #行内容满足if的条件则执行操作
awk '变量=条件表达式?值1:值2; {操作}' 文件
#行内容是否条件表达式,如果条件成立则变量取值1,条件不成立则变量取值2
awk 'BEGIN{执行循环前的操作; while("命令" | getline) 每次循环的操作; 执行循环完后的操作}' #使用while循环对每行内容执行操作
awk常见的内建变量(可直接用)
- FS:列分割符。指定每行文本的字段分隔符,默认为空格或制表位。与"-F"作用相同
- NF:当前处理的行的字段个数。
- NR:当前处理的行的行号(序数)。
- $0:当前处理的行的整行内容。
- $n:当前处理行的第n个字段(第n列)。
- FILENAME:被处理的文件名。
- RS:行分隔符。awk从文件上读取资料时,将根据RS的定义把资料切割成许多条记录,而awk一次仅读入一条记录,以进行处理。预设值是'\n'
- FNR:awk当前读取的记录数,其变量值小于等于NR(比如当读取第二个文件时,FNR是从0开始重新计数,而NR不会)。
NR==FNR:用于在读取两个或两个以上的文件时,判断是不是在读取第一个文件
按行打印行内容
awk '{print $0}' 文件 #打印文件里所有内容
awk 'NR=1{print $0}' 文件 #打印文件里第一行内容
awk 'NR=1,NR=3{print $0}' 文件 #答应文件里第一行到第三行的内容
awk 'NR>=80{print $0}' 文件 #打印文件里80行以后的内容
awk '(NR>=70)&&(NR<=80){print $0}' 文件 #打印文件70行到80行的内容
awk '(NR>=70)||(NR<=80){print $0}' 文件 #打印文件70行和80行的内容
awk '(NR<=3)||(NR>=80){print $0}' 文件 #打印文件前3行和后80行的内容
awk '(NR%)==1 {print $0}' 文件 #打印文件奇数行
awk '{print $0;getline}' 文件 #打印文件奇数行 getline为跳到下一行
awk '(NR%)==0 {print $0}' 文件 #打印偶数行
awk '{getline;print $0}' 文件 #打印偶数行 getline为跳到下一行
awk '/root/{print $0}' 文件 #打印包含root的行内容
awk '/\/bin\/bash$/{print $0}' 文件 #打印以/bin/bash结尾的行内容
统计行数量
awk 'BEGIN {X=0}; /bash$/ {x++};END {print x}' 文件 #统计以bash结尾的行数
awk 'BEGIN {n=0;while("who" | getline)n++; print $n}' #统计who命令的有多少行
按字段输出文本
默认以空格或tab键为分隔符进行分隔
awk -F ":" '{print $3}' 文件 #输出每行中(以:分隔)的第3个字段
awk -F ":" '{print $1,$3}' 文件 #输出每行中(以:分隔)的第1、3个字段awk -F ":" '$3<5{print $1,$3}' 文件
#输出每行(以:分隔)第3个字段的值小于5的第1、3 个字段内容
awk -F ":" '!($3<200){print $0}' 文件 #输出每行第3个字段的值不小于200的行
awk -F ":" '/bash$/ {print $1":"$3}' 文件#输出每行以bash结尾的,并且以:分隔的第 一个字段和第三个字段,最后以:分隔输出内容
awk -F ":" '$3<5{print $1,$3,$NF}' 文件
#输出每行(以:分隔)第3个字段的值小于5的第1、3个字段和最后一个字段内容
awk -F ":" '$3<5{print NR,$0}' 文件 #打印行号,同行输出
awk -F ":" '$3<5{print NR} $3<5{print $0}' 文件 #打印行号,不同行输出
awk -F ":" '$3~“bash”{print $0}' 文件
#输出每行中(以:分隔)的第3个字段包含bash的行内容 ~ 表示包含的意思
通过管道、双引号调用 Shell 命令
echo $PATH | awk 'BEGIN{RS=":"};END{print NR}'
#统计以冒号分隔的文本段落数,END{}语句块中,往往会放入打印结果等语句
awk -F: '/bash$/{print | "wc -l"}' /etc/passwd
#调用 wc -l 命令统计使用 bash 的用户个数,等同于 grep -c "bash$" /etc/passwd
free -m | awk '/Mem:/ {print int($3/($3+$4)*100)"%"}' #查看当前内存使用百分比
top -b -n 1 | grep Cpu | awk -F ',' '{print $4}' | awk '{print $1}'
#查看当前CPU空闲率,(-b -n 1 表示只需要1次的输出结果)
date -d "$(awk -F "." '{print $1}' /proc/uptime) second ago" +"%F %H:%M:%S"
#显示上次系统重启时间
awk 'BEGIN {n=0 ; while ("w" | getline) n++ ; {print n-2}}'
#调用w命令,并用来统计在线用户数
awk 'BEGIN {"hostname" | getline ; {print $0}}' #调用 hostname,并输出当前的主机名