Linux文本处理三剑客:awk(内置函数详解笔记)

Linux系统中,AWK 是一个非常强大的文本处理工具,它的内置函数使得对文本数据进行处理更加高效和便捷。

本文将介绍 AWK 内置函数的几种主要类型:

  • 算数函数
  • 字符串函数
  • 时间函数
  • 位操作函数
  • 其他常用函数

我们将使用一个示例文本文件来演示这些函数的用法,并提供详细的注释说明,继续分享。

基础学习,可以回头查看:Linux文本处理三剑客:awk(结构化命令)

1.算数函数

函数名功能参数示例输出
atan2(y,x)返回正切值 y/x 的角度值,角度以弧度为单位y, xatan2(10, -10) * 180 / PI135
cos(expr)返回 expr 的余弦值,输入参数以弧度为单位exprcos(60 * PI / 180.0)0.5
exp(expr)返回自然数 e 的 expr 次幂exprexp(5)148.413159
int(expr)返回数值 expr 的整数部分exprint(5.12345)5
log(expr)计算 expr 自然对数exprlog(5.5)1.704748
rand返回一个大于等于 0 小于 1 的随机数-rand()0.237788
sin(expr)返回角度 expr 的正弦值,角度以弧度为单位exprsin(30 * PI / 180)0.5
sqrt(expr)计算 expr 的平方根exprsqrt(1024.0)32
srand([expr])使用种子值生成随机数exprsrand(10)1417959587

注释:

  • 以上表格仅列出了 AWK 提供的内置算术函数。
  • 算术函数的参数必须是数值。
  • 算术函数的返回值是数值。
# 反正切函数
awk 'BEGIN {PI = 3.14159265x = -10y = 10result = atan2 (y,x) * 180 / PI;printf "对于 (x=%f, y=%f),反正切值为 %f 度\n", x, y, result
}'# 余弦函数
awk 'BEGIN {PI = 3.14159265param = 60result = cos(param * PI / 180.0);printf "%f 度的余弦值为 %f\n", param, result
}'# 自然指数函数
awk 'BEGIN {param = 5result = exp(param);printf "%f 的自然指数值为 %f\n", param, result
}'# 取整函数
awk 'BEGIN {param = 5.12345result = int(param)print "Truncated value =", result
}'# 自然对数函数
awk 'BEGIN {param = 5.5result = log (param)printf "log(%f) = %f\n", param, result
}'# 随机数函数
awk 'BEGIN {print "Random num1 =" , rand()print "Random num2 =" , rand()print "Random num3 =" , rand()
}'#正弦函数
awk 'BEGIN {PI = 3.14159265param = 30.0result = sin(param * PI /180)printf "The sine of %f degrees is %f.\n", param, result
}'# 平方根函数
awk 'BEGIN {param = 1024.0result = sqrt(param)printf "sqrt(%f) = %f\n", param, result
}'# 设置随机数种子
awk 'BEGIN {param = 10printf "srand() = %d\n", srand()printf "srand(%d) = %d\n", param, srand(param)
}'

2.字符串函数

函数名功能参数示例输出
asort(arr, [d [, how]])使用 GAWK 值比较的一般规则排序 arr 中的内容arr, d, howasort(arr)-
asorti(arr, [d [, how]])对数组的索引排序arr, d, howasorti(arr)-
gsub(regexp, replacement [, target])全局替换子串regexp, replacement, targetgsub("World", "Jerry", str)Hello, Jerry
index(str, sub)检测子串是否存在str, subindex(str, subs)5
length(str)返回字符串长度strlength(str)16
match(str, regex)搜索与正则表达式匹配的子串str, regexmatch(str, subs)5
split(str, arr, regex)分割字符串str, arr, regexsplit(str, arr, ",")One, Two, Three, Four
sprintf(format, expr-list)按指定格式构造字符串format, expr-listsprintf("%s", "Hello, World !!!")Hello, World !!!
strtonum(str)将字符串转换为数值strstrtonum("123")123
sub(regex, sub, string)执行一次子串替换regex, sub, stringsub("World", "Jerry", str)Hello, Jerry
substr(str, start, l)返回子串str, start, lsubstr(str, 1, 5)Hello
tolower(str)将所有大写字母转换为小写字母strtolower(str)hello, world !!!
toupper(str)将所有小写字母转换为大写字母strtoupper(str)HELLO, WORLD !!!

注释:

  • 以上表格仅列出了 AWK 提供的内置字符串函数。
  • 字符串函数的参数可以是字符串或变量。
  • 字符串函数的返回值是字符串。
# 按字母顺序排列数组元素
$ awk 'BEGIN {arr[0] = "Three"arr[1] = "One"arr[2] = "Two"print "排序前数组元素:"for (i in arr) {print arr[i]}asort(arr)print "排序后数组元素:"for (i in arr) {print arr[i]}
}'# 按索引顺序排列数组元素
awk 'BEGIN {arr["Two"] = 1arr["One"] = 2arr["Three"] = 3asorti(arr)print "排序后数组索引:"for (i in arr) {print arr[i]}
}'# 替换字符串
awk 'BEGIN {str = "Hello, World"print "替换前字符串 = " strgsub("World", "Jerry", str)print "替换后字符串 = " str
}'# 查找子串的位置
awk 'BEGIN {str = "One Two Three"subs = "Two"ret = index(str, subs)printf "子串 \"%s\" 在第 %d 个位置找到.\n", subs, ret
}'# 获取字符串长度
awk 'BEGIN {str = "Hello, World !!!"print "长度 = ", length(str)
}'# 使用正则表达式匹配子串
awk 'BEGIN {str = "One Two Three"subs = "Two"ret = match(str, subs)printf "子串 \"%s\" 在第 %d 个位置找到.\n", subs, ret
}'# 将字符串分割为数组
awk 'BEGIN {str = "One,Two,Three,Four"split(str, arr, ",")print "数组包含以下元素:"for (i in arr) {print arr[i]}
}'# 使用 sprintf() 格式化字符串
awk 'BEGIN {str = sprintf("%s", "Hello, World !!!")print str
}'# 将字符串转换为数字
awk 'BEGIN {print "Decimal num = " strtonum("123")print "Octal num = " strtonum("0123")print "Hexadecimal num = " strtonum("0x123")
}'# 使用 sub() 替换字符串
awk 'BEGIN {str = "Hello, World"print "替换前字符串 = " strsub("World", "Jerry", str)print "替换后字符串 = " str
}'# 获取子字符串
awk 'BEGIN {str = "Hello, World !!!"subs = substr(str, 1, 5)print "Substring = " subs
}'# 小写转换
awk 'BEGIN {str = "HELLO, WORLD !!!"print "Lowercase string = " tolower(str)
}'# 大写转换
awk 'BEGIN {str = "hello, world !!!"print "Uppercase string = " toupper(str)
}'

3.时间函数

函数名功能参数示例输出
systime返回从 Epoch 以来到当前时间的秒数-systime()1418574432
mktime(datespec)将字符串转换为时间戳datespecmktime("2014 12 14 30 20 10")1418604610
strftime([format [, timestamp[, utc-flag]]])格式化时间戳format, timestamp, utc-flagstrftime("Time = %m/%d/%Y %H:%M:%S", systime())Time = 12/14/2014 22:08:42

注释:

  • 以上表格仅列出了 AWK 提供的内置时间函数。
  • 时间戳是一个数值,表示从 Epoch 以来经过的秒数。
  • Epoch 是 Unix 时间的起点,为 1970 年 1 月 1 日 00:00:00 UTC。
# 获取当前时间戳
awk 'BEGIN {print "Number of seconds since the Epoch = " systime()
}'
# 将字符串转换为时间戳
awk 'BEGIN {print "Number of seconds since the Epoch = " mktime("2014 12 14 30 20 10")
}'# 格式化时间戳
awk 'BEGIN {print strftime("Time = %m/%d/%Y %H:%M:%S", systime())
}'# 打印当前星期几
awk 'BEGIN {print strftime("%A")
}'

4.位操作函数

函数名功能参数示例输出
and执行位与操作num1, num2and(10, 6)2
compl按位求补num1compl(10)9.0072E+15
lshift左移位操作num1, shiftlshift(10, 1)20
rshift向右移位操作num1, shiftrshift(10, 1)5
or按位或操作num1, num2or(10, 6)14
xor按位异或操作num1, num2xor(10, 6)12

注释:

  • 以上表格仅列出了 AWK 提供的内置位操作函数。
  • 位操作函数的参数必须是整数。
  • 位操作函数的返回值是整数。
# 位与操作
awk 'BEGIN {num1 = 10num2 = 6printf "(%d AND %d) = %d\n", num1, num2, and(num1, num2)
}'# 按位求补
awk 'BEGIN {num1 = 10printf "compl(%d) = %d\n", num1, compl(num1)
}'# 左移位操作
awk 'BEGIN {num1 = 10printf "lshift(%d) by 1 = %d\n", num1, lshift(num1, 1)
}'# 向右移位操作。
awk 'BEGIN {num1 = 10printf "rshift(%d) by 1 = %d\n", num1, rshift(num1, 1)
}'# 按位或操作。
awk 'BEGIN {num1 = 10num2 = 6printf "(%d OR %d) = %d\n", num1, num2, or(num1, num2)
}'# 按位异或操作
[jerry]$ awk 'BEGIN {num1 = 10num2 = 6printf "(%d XOR %d) = %d\n", num1, num2, xor(num1, num2)
}'

5.其他常用函数

函数名功能参数示例输出
close(expr)关闭管道的文件exprclose(cmd, "to")-
delete从数组中删除元素数组索引delete arr[0]-
exit([expr])终止脚本执行exprexit 10-
fflush([output-expr])刷新打开文件或管道的缓冲区output-exprfflush()-
getline读入下一行-getline < file-
next停止处理当前记录,进入下一条记录的处理过程-if ($0 ~/Shyam/) next-
nextfile停止处理当前文件,从下一个文件第一个记录开始处理-if ($0 ~ /file1:str2/) nextfile-
return([expr])从用户自定义的函数中返回值exprreturn result-
system(cmd)执行特定的命令cmdsystem("date")0

释:

  • 以上表格仅列出了 AWK 提供的其它内置函数。
  • 每个函数的具体使用方法请参考 AWK 官方文档。
# 关闭管道
awk 'BEGIN {cmd = "tr [a-z] [A-Z]"print "hello, world !!!" |& cmdclose(cmd, "to")cmd |& getline outprint out;close(cmd);
}'# 从数组中删除元素
awk 'BEGIN {arr[0] = "One"arr[1] = "Two"arr[2] = "Three"arr[3] = "Four"print "删除前:"for (i in arr) {print arr[i]}delete arr[0]delete arr[1]print "删除后:"for (i in arr) {print arr[i]}
}'# 终止脚本执行
awk 'BEGIN {print "Hello, World !!!"exit 10print "AWK never executes this statement."
}'# 刷新打开文件或管道的缓冲区
fflush([output-expr])# 读入下一行
awk '{getline; print $0}' file.txt # 执行特定的命令然后返回其退出状态。返回值为 0 表示命令执行成功;非 0 表示命令执行失败。
awk 'BEGIN { ret = system("date"); print "Return value = " ret }'

如果您觉得有些用处,熟练操作这些代码后,相信你会有一些收获。

欢迎在评论区留言,关注。谢谢您的阅读!

敬请关注!

往期学习笔记:

Windows系统开启Linux子系统(Ubuntu)

Linux常用命令(目录操作命令)

Linux常用命令:文件的创建、复制、移动、查找和删除命令

Linux常用命令:文本文件的查看与编辑

Linux常用命令:文本文件的拼接与分割

Linux常用命令:文件的权限管理

Linux常用命令:文件的下载、压缩与解压

Linux常用命令:常见的操作符

Linux常用命令:系统操作命令
 

 Linux文本处理三剑客:grep

Linux文本处理三剑客:sed

Linux文本处理三剑客:awk

Linux文本处理三剑客:awk(常用匹配模式)

Linux文本处理三剑客:awk(结构化命令)

Linux文本处理三剑客:awk(对具体文本的示例代码)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/719215.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

局域网如何搭建服务器?

随着网络的普及和应用场景的不断拓展&#xff0c;局域网搭建服务器逐渐成为大家关注的话题。在日常生活和工作中&#xff0c;我们经常需要通过局域网和互联网进行文件共享、资源访问等操作&#xff0c;而搭建服务器则是实现这些功能的重要手段之一。本文将针对局域网搭建服务器…

SwiftUI 如何在运行时从底层动态获取任何 NSObject 对象实例

概览 众所周知,SwiftUI 的推出极大地方便了我们这些秃头码农们搭建 App 界面。不过,有时我们仍然需要和底层的 UIKit 对象打交道。比如:用 SwiftUI 未暴露出对象的接口改变视图的行为或外观。 从上图可以看到,我们 SwiftUI 代码并没有设置视图的背景色,那么它是怎么变成绿…

vscode 本地/远程添加python解释器

文章目录 1. 背景2. 增加python解释器 1. 背景 我们在使用 vscode 去远程调试代码时&#xff0c;如果环境存在多个 Python 版本&#xff08;如用 conda 管理&#xff09;&#xff0c;没有选择正确的 Python 解释器会导致少包、库不适配等各种问题 2. 增加python解释器 windo…

鸿蒙系统适配的流程

鸿蒙系统适配的流程通常涉及以下关键步骤&#xff0c;以下是鸿蒙系统适配的一般流程&#xff0c;具体流程可能会根据项目的具体需求和开发团队的情况进行调整和优化。北京木奇移动技术有限公司&#xff0c;专业的软件外包开发公司&#xff0c;欢迎交流合作。 1. 准备工作&#…

超越脆弱:用否定法策略优化考研复试准备

很多情况下,你的想象力会为当前的世界添加一些东西。很抱歉,我会在本章中告诉你,这种方法完全是落后的方法:根据脆弱性和反脆弱性的概念,严格来说,正确的想象就是从未来中排除或削减不属于未来的东西,采用否定法,脆弱的事物终将破碎。——《反脆弱:从不确定性中获益》…

盘点:国家智能算力中心

文章目录 1. Main2. My thoughtsReference 1. Main 按照《中国算力白皮书&#xff08;2022年&#xff09;》的定义&#xff0c;算力主要分为四部分&#xff1a;通用算力、智能算力、超算算力、边缘算力。通用算力以CPU芯片输出的计算能力为主&#xff1b;智能算力以GPU、FPGA、…

【一起学习Arcade】(6):属性规则实例_约束规则和验证规则

一、约束规则 约束规则用于指定要素上允许的属性配置和一般关系。 与计算规则不同&#xff0c;约束规则不用于填充属性&#xff0c;而是用于确保要素满足特定条件。 简单理解&#xff0c;约束规则就是约束你的编辑操作在什么情况下可执行。 如果出现不符合规则的操作&#…

CGI中使用Cookie

文章目录 CGI中使用Cookiecookie的语法设置Cookie获取Cookie检索Cookie信息文件上传实例1. 创建HTML表单2. 编写Python脚本处理上传 文件下载对话框 CGI中使用Cookie 在CGI&#xff08;Common Gateway Interface&#xff09;中使用Cookie涉及设置和获取由Web服务器发送到浏览器…

java导出多个xml文件的压缩zip

代码&#xff1a; // 设置响应头response.setCharacterEncoding("UTF-8");//设置响应的字符编码为UTF-8response.setContentType("application/octet-stream");//设置响应的内容类型为二进制流&#xff0c;通常用于文件下载。response.setHeader("Con…

解释一下前端框架中的虚拟DOM(virtual DOM)和实际DOM(real DOM)之间的关系。

聚沙成塔每天进步一点点 ⭐ 专栏简介 前端入门之旅&#xff1a;探索Web开发的奇妙世界 欢迎来到前端入门之旅&#xff01;感兴趣的可以订阅本专栏哦&#xff01;这个专栏是为那些对Web开发感兴趣、刚刚踏入前端领域的朋友们量身打造的。无论你是完全的新手还是有一些基础的开发…

leetcode日记(36)全排列

想思路想了很久……思路对了应该会很好做。 我的思路是这样的&#xff1a;只变化前n个数字&#xff0c;不断增加n&#xff0c;由2到nums.size()&#xff0c;使用递归直到得到所有结果 代码如下&#xff1a; class Solution { public:vector<vector<int>> permut…

正信法律:借款纠纷的民事起诉状怎么写

在借款纠纷中&#xff0c;当协商无果时&#xff0c;诉诸法律成为债权人追回债务的有效途径。而民事起诉状作为启动诉讼程序的法律文书&#xff0c;其撰写质量直接关系到案件的受理与判决。本文旨在简明扼要地阐述如何撰写一份规范的借款纠纷民事起诉状。 起诉状需包含以下几个关…

阿克曼转向车型导航末段位姿调整控制

1目标 分析RPP算法时控制器算法学习1-RPP受控纯追踪算法发现,在终点时如果角度还有较大偏差,该算法无法进行很好的调整,故开始尝试在末端接近目标点时,用自己的控制算法去调整位姿,姑且命名为TEA算法(Target-End-Adjust Algorithm for Ackermann) 2控制思路 step1. 将…

【百度】B端数据中台组_大数据研发工程师(J68899)

北京市技术3人2023-12-14 工作职责&#xff1a; 负责百家号和Feed相关大数据的基础建设负责数仓引擎、Spark底层的优化和基础建设为百度系APP相关业务分析及策略优化提供大数据支持参与百度系APP日志数据架构开发和APP端性能分析平台建设 职责要求&#xff1a; 本科及以上学…

C# Onnx segment-anything 分割万物 一键抠图

目录 介绍 效果 模型信息 sam_vit_b_decoder.onnx sam_vit_b_encoder.onnx 项目 代码 下载 C# Onnx segment-anything 分割万物 一键抠图 介绍 github地址&#xff1a;https://github.com/facebookresearch/segment-anything The repository provides code for runn…

设计模式(十二)享元模式

请直接看原文: 原文链接:设计模式&#xff08;十二&#xff09;享元模式-CSDN博客 -------------------------------------------------------------------------------------------------------------------------------- 享元模式定义 享元模式是结构型设计模式的一种&am…

Kubernetes-1

学习Kubernetes第一天 k8s-11、什么是Kubernetes2、配置Kubernetes2.1、准备三台全新的虚拟机2.2、关闭防火墙和SElinux2.3、修改主机名2.4、升级操作系统(三台一起操作)2.5、配置主机hosts文件&#xff0c;相互之间通过主机名互相访问2.6、配置master和node之间的免密通道2.7、…

KMP算法和Manacher算法

KMP算法 KMP算法解决的问题 KMP算法用来解决字符串匹配问题: 找到长串中短串出现的位置. KMP算法思路 暴力比较与KMP的区别 暴力匹配: 对长串的每个位,都从头开始匹配短串的所有位. KMP算法: 将短字符串前后相同的部分存储在 n e x t next next数组里,让之前匹配过的信息指…

我的单片机入门之旅

我的单片机入门之旅 前言 单片机作为现代电子技术的重要组成部分&#xff0c;广泛应用于各个领域。而作为一个初学者&#xff0c;我对单片机一无所知。但是&#xff0c;通过不断的学习和实践&#xff0c;我逐渐掌握了单片机的基本概念和使用方法。在我的单片机入门之旅中&…

【每日前端面经】2024-03-03

题目来源: 牛客 说说你对Vue3的理解&#xff1f; Vue2面对对象编程&#xff0c;Vue3函数时编程对TS支持的更好选项式API替代组合式API响应式原理由Object.defineProperty变为Proxy支持template中存在多个根节点重写虚拟DOM增加setup修饰符支持tree-shaking&#xff0c;减小体…