使用AWK进行文本处理

awk 的基本概念

awk 是一种强大的文本处理语言,广泛用于模式匹配和数据提取。这种编程语言设计用于对文本文件进行操作,尤其适用于格式化的文本,如 CSV 或空格分隔的表格数据。下面详细介绍 awk 的一些基本概念:

1. 记录和字段

  • 记录:在 awk 中,默认的记录是指输入文本的一行。
  • 字段:每条记录默认按空白字符(空格或制表符)分割成多个字段。第一个字段可以通过 $1 访问,第二个字段是 $2,依此类推,直到最后一个字段 $NF。整条记录可以用 $0 访问。

2. 模式和动作

awk 的基本结构是“模式 { 动作 }”,模式用于指定哪些记录将被选中进行处理,动作则定义了一系列对这些记录执行的操作。

  • 模式:可以是正则表达式、条件表达式(如比较操作)、特定的记录标识(如行号),或者不指定(意味着选择所有记录)。
  • 动作:用花括号 {} 包围,包含一系列 awk 命令,如打印输出、计算、字符串操作等。

3. 内建变量

awk 提供了多个内建变量,用于处理文本数据:

  • FS:字段分隔符(Field Separator),默认是空白字符。
  • RS:记录分隔符(Record Separator),默认是换行符。
  • OFS:输出字段分隔符(Output Field Separator),默认是空格。
  • ORS:输出记录分隔符(Output Record Separator),默认是换行符。
  • NF:当前记录中的字段数量(Number of Fields)。
  • NR:已读的记录数(Number of Records)。
  • FNR:当前文件中已读的记录数(同 NR,但在处理多个文件时会为每个文件重置)。

4. awk 程序的执行流程

awk 程序通常遵循以下执行流程:

  1. BEGIN块:在读取任何输入之前执行的代码块,通常用于初始化操作。

    BEGIN { FS=":"; OFS=":"; print "Start of Report" }
    

  2. 模式和动作:对输入的每一条记录,awk 都会检查是否匹配给定的模式,如果匹配,则执行相应的动作。

    $1 > 50 { print $0 }
    

  3. END块:在读取所有输入后执行的代码块,常用于总结和完成工作。

    END { print "End of Report" }
    

5. 强大的文本处理功能

awk 支持数组(包括关联数组),提供了字符串和数学函数,支持流程控制语句(如 if、while、for),使其不仅仅是文本处理工具,还是一个完整的编程环境。

通过理解这些基本概念,你可以开始使用 awk 来编写简单到复杂的文本处理脚本,处理各种数据分析和报告任务。

awk基本命令和语法

学习 awk 的基本命令和语法是掌握这个强大文本处理工具的第一步。下面,我将详细介绍如何开始使用 awk,包括常用的命令、语法规则,以及一些实用的例子。

1. 基本语法

awk 的基本命令格式通常是这样的:

awk 'pattern { action }' input-file

  • pattern:是一个条件表达式,用于选择哪些记录(行)需要应用 action。如果省略 pattern,action 将应用于所有记录。
  • action:在大括号中,包含一系列命令,用于处理符合 pattern 的记录。

2. 打印文本和字段

awk 最常用的命令可能就是 print 了,它用于显示记录或字段。

示例:打印每一行的内容

awk '{ print }' filename.txt

示例:打印每行的第一个和第三个字段

awk '{ print $1, $3 }' filename.txt

3. 使用内建变量

awk 提供了多种内建变量,如 NR(当前行号)、NF(当前行的字段数)等。

示例:打印每行的行号和行内容

awk '{ print NR, $0 }' filename.txt

示例:打印每行的最后一个字段

awk '{ print $NF }' filename.txt

4. 字段和记录分隔符

通过设置 FS(字段分隔符)和 RS(记录分隔符),你可以改变 awk 的行为,使其适应不同格式的输入。

示例:改变字段分隔符为逗号

awk 'BEGIN { FS = "," } { print $1 }' filename.txt

5. 模式匹配

awk 允许你使用模式(通常是正则表达式)来选择要操作的记录。

示例:选择包含 "error" 的行

awk '/error/ { print $0 }' filename.txt

6. 范围模式

awk 支持范围模式,允许你选择一个开始和结束模式之间的所有记录。

示例:从包含 "START" 的行开始,到包含 "END" 的行结束

awk '/START/,/END/' filename.txt

7. BEGIN 和 END 块

BEGINEND 是特殊的模式,它们分别在处理任何输入行之前和处理完所有输入行之后执行。

示例:在开始时和结束时添加文本

awk 'BEGIN { print "Start Processing" } { print $0 } END { print "End Processing" }' filename.txt

8. 数学和字符串函数

awk 提供了一系列的数学和字符串处理函数。

示例:将每行的第一个字段转为大写

awk '{ print toupper($1) }' filename.txt

9. 处理多个文件

awk 可以同时处理多个输入文件。

 
awk '{ print FILENAME, NR, $0 }' file1.txt file2.txt

学习资源

  • 在线教程:网站如 Tutorialspoint、GeeksforGeeks 提供详细的教程。
  • 书籍:《sed & awk》是一本经典书籍,非常适合深入学习。
  • 官方文档:阅读 GNU awk 手册,了解所有功能和高级技巧。

通过上述基础知识和示例,你可以开始使用 awk 来处理和分析文本数据。随着实践的增加,你将能更深入地理解和运用 awk 的高级功能。

实际编写脚本

通过写一些简单的脚本来加深对 awk 的理解:

统计文件:编写脚本统计文本中单词的频率

要使用 awk 编写一个脚本来统计文本文件中单词的频率,你可以利用 awk 的关联数组来实现。这个脚本将读取文本文件中的每一行,分割每行成单词,并使用数组来记录每个单词出现的次数。

编写脚本

下面是一个简单的 awk 脚本,用于统计一个文本文件中各个单词的出现频率:

#!/bin/bash# 使用 awk 统计文本中单词的频率
awk '
{# 默认字段分隔符是空白,所以直接遍历每个字段for (i = 1; i <= NF; i++) {# 将单词转为小写,以统一相同单词的不同形式word = tolower($i)# 去除单词周围的标点符号gsub(/[^a-zA-Z0-9]/, "", word)# 统计单词频率if (word != "") {words[word]++}}
}
END {# 打印每个单词及其频率for (w in words) {print w, words[w]}
}
' filename.txt

脚本解释

  1. 循环遍历每个字段awk 默认按空白字符(空格、制表符等)分割每行,每个字段视为一个单词。for (i = 1; i <= NF; i++) 遍历这些字段。
  2. 单词处理:使用 tolower($i) 将单词转为小写,这样不区分大小写。使用 gsub(/[^a-zA-Z0-9]/, "", word) 去除单词中的非字母数字字符,这有助于去除末尾的标点符号。
  3. 统计频率:使用关联数组 words 来存储每个单词出现的次数。如果单词不为空(if (word != "")),则其出现次数增加。
  4. 结束处理:在 END 块中,输出数组 words 中的每个元素和对应的次数。遍历数组使用 for (w in words)

使用脚本

  1. 将上述脚本保存为一个文件,例如 word_freq.sh
  2. 赋予该脚本执行权限:
    chmod +x word_freq.sh
    

  3. 运行脚本,传入要分析的文本文件名作为参数:
    ./word_freq.sh filename.txt
    

这个脚本提供了一个基础的框架,你可以根据具体需求调整和改进,例如改进单词的分割规则,或者添加更多的文本处理功能。通过这样的练习,你可以加深对 awk 功能和文本处理技巧的理解。

数据提取:提取特定条件的数据行或字段。

使用 awk 提取符合特定条件的数据行或字段是一种常见的文本处理任务。你可以利用 awk 的模式匹配和字段处理功能来实现这一点。以下是一些具体的例子,演示如何使用 awk 来提取数据:

示例 1: 提取特定条件的行

假设你有一个 CSV 文件,其中包含用户信息,格式如下:

ID,Name,Age,Email
1,John Doe,30,john.doe@example.com
2,Jane Smith,25,jane.smith@example.com
3,Bob Johnson,35,bob.j@example.com

你想提取年龄大于 30 的用户信息。

脚本:

awk -F, '$3 > 30 { print $0 }' users.csv

解释:

  • -F, 设置字段分隔符为逗号。
  • $3 > 30 是一个条件,检查第三个字段(年龄)是否大于 30。
  • { print $0 } 如果条件为真,则打印整行。

示例 2: 提取特定字段的数据

继续使用上述 CSV 文件,假设你只想提取年龄大于 30 的用户的邮箱地址。

脚本:

awk -F, '$3 > 30 { print $4 }' users.csv

解释:

  • 这个命令与前一个例子相似,只不过这次你使用 { print $4 } 来只打印第四个字段(Email)。

示例 3: 根据多个条件提取数据

假设你还想根据多个条件来过滤数据,例如提取年龄大于 25 且名字包含 "Jane" 的记录。

脚本:

 
awk -F, '$3 > 25 && /Jane/ { print $0 }' users.csv

解释:

  • && 是逻辑与运算符,用于组合多个条件。
  • /Jane/ 是一个正则表达式模式,用于匹配包含 "Jane" 的行。
  • 如果两个条件都满足,就打印整行。

示例 4: 使用 BEGIN 和 END 块

你也可以使用 BEGINEND 块来在处理前后执行特定的操作,比如设置表头或汇总。

脚本:

awk -F, 'BEGIN { print "Users Older Than 30" } $3 > 30 { print $2 } END { print "End of Report" }' users.csv

解释:

  • BEGIN 块在处理任何输入行之前执行,用于打印标题。
  • $3 > 30 { print $2 } 在条件满足时打印用户姓名。
  • END 块在处理完所有输入行后执行,用于打印结束语。

这些示例展示了如何使用 awk 来执行基本的数据提取任务。通过这种方式,你可以有效地从大量数据中提取有价值的信息,这在数据分析和日常的系统管理任务中非常有用。

数据转换:将数据从一种格式转换为另一种格式。

使用 awk 进行数据转换是一个非常实用的场景,尤其是当你需要将数据从一种格式转换为另一种更适用于特定应用的格式时。这可以包括格式的简单转换,如 CSV 转换为 TSV,或者更复杂的转换,如重塑数据结构。下面我将提供一些示例来演示如何使用 awk 完成这些任务。

示例 1: CSV 转 TSV(制表符分隔的值)

假设你有一个 CSV 文件(逗号分隔的值),你想将其转换为 TSV 文件(制表符分隔的值)。

输入 CSV 示例:

ID,Name,Age
1,John Doe,30
2,Jane Smith,25

awk 脚本:

awk -F, 'BEGIN { OFS="\t" } { print $1, $2, $3 }' input.csv > output.tsv

解释:

  • -F, 设置输入字段分隔符为逗号。
  • BEGIN { OFS="\t" } 在处理任何输入之前设置输出字段分隔符为制表符。
  • { print $1, $2, $3 } 对于输入文件的每一行,打印所有字段,字段间由 OFS 定义的制表符分隔。
  • 输出重定向到 output.tsv 文件。

示例 2: 重塑数据结构

假设你需要将数据的结构从一行多个字段转换为多行,每行两个字段,其中第一个字段是 ID,第二个字段是其他信息。

输入数据:

ID,Name,Age,Email
1,John Doe,30,john@example.com
2,Jane Smith,25,jane@example.com

awk 脚本:

awk -F, '{print $1, "Name", $2print $1, "Age", $3print $1, "Email", $4
}' input.csv > reshaped_data.txt

解释:

  • 对于每一行输入,生成三行输出。
  • 每行输出包括 ID 和一个其他字段的值。

示例 3: JSON 格式化输出

假设你想将 CSV 数据转换为 JSON 格式。

输入 CSV 示例:

ID,Name,Age
1,John Doe,30
2,Jane Smith,25

awk 脚本:

awk -F, 'BEGIN {print "["
}
NR > 1 {printf "\t{\n\t\t\"ID\": \"%s\",\n\t\t\"Name\": \"%s\",\n\t\t\"Age\": \"%s\"\n\t}", $1, $2, $3if (NR < FNR) {print ","}
}
END {print "\n]"
}' input.csv > output.json

解释:

  • BEGIN 块中打印 JSON 开始的方括号。
  • 对于每行数据(跳过标题行),使用 printf 按 JSON 格式打印每个字段。
  • END 块中打印结束的方括号。

这些示例展示了 awk 在数据转换中的多样性和灵活性,从简单的格式转换到复杂的数据重塑和结构化输出。这种灵活性使得 awk 成为处理和准备数据的强大工具。

数组和函数:学习如何使用 awk 中的数组和自定义函数。

awk 中,数组和函数是两个非常强大的特性,它们可以极大地增强脚本的功能和灵活性。这里我将详细介绍如何在 awk 中使用数组和定义及调用自定义函数。

1. 数组的使用

awk 支持一维和多维数组(通过模拟实现),可以用于各种数据收集和处理任务。

一维数组

示例:统计每个单词在文本中出现的次数。

awk '{for (i = 1; i <= NF; i++) {word = tolower($i)count[word]++}
}
END {for (word in count)print word, count[word]
}' input.txt

解释

  • 数组 count 用于存储每个单词的出现次数。
  • 循环通过 NF(字段数量,即单词数量)遍历每行的所有单词。
  • END 块中,遍历数组并打印每个单词及其出现次数。
多维数组

虽然 awk 本身不直接支持多维数组,但可以通过连接索引来模拟。

示例:记录不同人在不同年份的收入。

awk -F, '{income[$1][$2] += $3
}
END {for (person in income) {for (year in income[person]) {print person, year, income[person][year]}}
}' income_data.csv

解释

  • $1 是人名,$2 是年份,$3 是收入。
  • income[$1][$2] 模拟二维数组,存储每个人每年的收入总和。

2. 自定义函数

awk 允许你定义自己的函数,这可以帮助重用代码、清理脚本并使其更易于维护。

定义和使用函数

示例:编写一个函数计算并返回平均值。

function average(total, count) {return total / count
}BEGIN {sum = 0n = 0
}
{sum += $1n++
}
END {avg = average(sum, n)print "Average:", avg
}

解释

  • function average(total, count) 定义了一个计算平均值的函数。
  • 在脚本的 END 部分调用 average() 函数计算平均值并打印。

小结

通过使用数组和自定义函数,awk 脚本可以更加强大和灵活。数组提供了一种方便的方式来收集和操作数据集合,而自定义函数则允许你封装复杂的逻辑,使得脚本更加模块化和可重用。实践这些特性将有助于提升你在数据处理和脚本编写方面的技能。

复杂的文本分析:学习如何处理复杂的文本分析任务,如多维数组的使用等。

处理复杂的文本分析任务是 awk 特别擅长的领域。通过利用 awk 的强大功能,如多维数组、字符串函数和模式匹配,你可以执行高级数据分析和处理。在本部分,我们将探讨一些复杂的文本分析技巧,包括如何使用多维数组和处理复杂数据结构。

1. 多维数组的使用

虽然 awk 本身不支持真正的多维数组,但可以通过字符串索引模拟多维数组的功能。这对于需要处理和分析来自不同维度的数据(如时间序列数据、分组统计数据等)非常有用。

示例:处理销售数据

假设你有一个销售数据文件,格式如下:

Date,Region,Product,Amount
2023-01-01,North,Widget,100
2023-01-01,South,Gadget,150
2023-01-02,North,Widget,80
2023-01-02,South,Gadget,200

你需要分析每个区域在每个日期的总销售额。

awk -F, 'NR > 1 { sales[$2][$1] += $4 }
END {for (region in sales) {for (date in sales[region]) {print date, region, sales[region][date]}}
}' sales_data.csv

解释

  • 使用逗号作为字段分隔符(-F,)。
  • 使用数组 sales 两个键:第一个是区域($2),第二个是日期($1),累加金额($4)。
  • END 块中,双层循环遍历 sales 数组,打印出每个区域每天的总销售额。

2. 使用 awk 进行数据重构和格式化

利用 awk 的文本处理功能,可以将数据从一种格式转换为另一种格式,比如从 CSV 转换为 JSON,这对于现代应用程序接口和数据交换非常有用。

示例:转换为 JSON 格式

使用前面的销售数据,将其转换为 JSON 格式。

awk -F, 'BEGIN {print "["first = 1
}
NR > 1 {if (!first) print ","first = 0printf "\t{\"Date\": \"%s\", \"Region\": \"%s\", \"Product\": \"%s\", \"Amount\": %s}", $1, $2, $3, $4
}
END {print "\n]"
}' sales_data.csv

解释

  • BEGIN 块中,打印 JSON 的开始。
  • 对于每行数据(跳过标题行),使用 printf 打印 JSON 对象。
  • 使用 first 变量控制逗号的打印,避免在第一个元素后打印。
  • END 块中,结束 JSON 数组。

3. 复杂的文本处理

对于包含复杂结构的文本(如日志文件、配置文件等),awk 可以使用其正则表达式能力和字符串处理函数来提取和处理数据。

示例:解析日志文件

假设有一个简单的日志文件,需要提取其中的错误消息及其时间戳。

awk '/ERROR/ { print $1, $2, $3, $4 }' server.log

解释

  • 搜索包含 "ERROR" 的行。
  • 打印出错误发生的日期和时间(假设这些信息位于行的前几个字段)。

通过上述示例,你可以看到 awk 在处理多维数据、格式转换和复杂文本分析方面的灵活性和强大功能。掌握这些技能可以帮助你解决许多实际的数据处理问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/824554.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一文了解OCI标准、runC、docker、contianerd、CRI的关系

docker和contanerd都是流行的容器运行时&#xff08;container runtime&#xff09;&#xff1b;想讲清楚他们两之间的关系&#xff0c;让我们先从runC和OCI规范说起。 一、OCI标准和runC 1、OCI&#xff08;open container initiative&#xff09; OCI是容器标准化组织为了…

利用动态规划优化10年投资回报:策略、证明与算法分析

利用动态规划优化10年投资回报&#xff1a;策略、证明与算法分析 a. 存在最优投资策略的证明b. 最优子结构性质的证明c. 最优投资策略规划算法设计d. 新限制条款下最优子结构性质的证明 在面对投资策略规划问题时&#xff0c;我们的目标是在10年后获得最大的回报。Amalgamated投…

Java上传文件到服务器

1、使用jsch <!--sftp文件上传--><dependency><groupId>com.jcraft</groupId><artifactId>jsch</artifactId><version>0.1.55</version></dependency> 2、配置类 package com.base.jsch;import lombok.Data; import o…

数据结构与算法-哈希表

哈希表 哈希表&#xff08;hash table&#xff09;&#xff0c;又称散列表&#xff0c;它通过建立键 key 与值 value 之间的映射&#xff0c;实现高效的元素查询。具体而言&#xff0c;我们向哈希表中输入一个键 key &#xff0c;则可以在 时间内获取对应的值 value 。 1.基础…

牛客 NC205 跳跃游戏(三)【中等 贪心 Java,Go,PHP】

题目 题目链接&#xff1a; https://www.nowcoder.com/practice/14abdfaf0ec4419cbc722decc709938b 思路 参考答案Java import java.util.*;public class Solution {/*** 代码中的类名、方法名、参数名已经指定&#xff0c;请勿修改&#xff0c;直接返回方法规定的值即可*** …

搜维尔科技:Manus Xsens Metagloves新一代手指捕捉

Manus Xsens Metagloves新一代手指捕捉 搜维尔科技&#xff1a;Manus Xsens Metagloves新一代手指捕捉

Go 单元测试之Mysql数据库集成测试

文章目录 一、 sqlmock介绍二、安装三、基本用法四、一个小案例五、Gorm 初始化注意点 一、 sqlmock介绍 sqlmock 是一个用于测试数据库交互的 Go 模拟库。它可以模拟 SQL 查询、插入、更新等操作&#xff0c;并且可以验证 SQL 语句的执行情况&#xff0c;非常适合用于单元测试…

基于SpringBoot+Vue社区医院服务平台(源码+文档+包运行)

一.系统概述 随着信息技术在管理上越来越深入而广泛的应用&#xff0c;管理信息系统的实施在技术上已逐步成熟。本文介绍了社区医院信息平台的开发全过程。通过分析社区医院信息平台管理的不足&#xff0c;创建了一个计算机管理社区医院信息平台的方案。文章介绍了社区医院信息…

如何在Linux CentOS部署宝塔面板并实现固定公网地址访问内网宝塔

文章目录 一、使用官网一键安装命令安装宝塔二、简单配置宝塔&#xff0c;内网穿透三、使用固定公网地址访问宝塔 宝塔面板作为建站运维工具&#xff0c;适合新手&#xff0c;简单好用。当我们在家里/公司搭建了宝塔&#xff0c;没有公网IP&#xff0c;但是想要在外也可以访问内…

QAnything部署Mac m1环境

本次安装时Qanything已经更新到了v1.3.3&#xff0c;支持纯python安装。安装过程比较简单&#xff0c;如下&#xff1a; QAnything/README_zh.md at qanything-python-v1.3.1 netease-youdao/QAnything GitHub 首先需要用Anaconda3创建隔离环境&#xff0c;简要说明下Anaco…

春藤实业启动SAP S/4HANA Cloud Public Edition项目,与工博科技携手数字化转型之路

3月11日&#xff0c;广东省春藤实业有限公司&#xff08;以下简称“春藤实业”&#xff09;SAP S/4HANA Cloud Public Edition&#xff08;以下简称“SAP ERP公有云”&#xff09;项目正式启动。春藤实业董事长陈董、联络协调项目经理慕总、内部推行项目经理陈总以及工博董事长…

SQLAlchemy批量更新

在 SQLAlchemy 1.4 版本中&#xff0c;批量更新仍然是一个常见的需求。虽然 SQLAlchemy 1.4 引入了一些新功能和改进&#xff0c;但基本的批量更新策略与之前的版本相似。以下是一些在 SQLAlchemy 1.4 中执行批量更新的常见方法&#xff1a; 1. 使用 update() 语句 你可以使用…

酒店水电能源计量管理系统

酒店水电能源计量管理系统是一种针对酒店行业设计的能源管理系统&#xff0c;旨在实现对水电能源的计量、监测和管理。本文将从系统特点、构成以及带来的效益三个方面展开介绍。 系统特点 1.多元化计量&#xff1a;该系统能够对酒店内的水、电能源进行多元化计量&#xff0c;…

第3章 网络基础知识

aws入门篇 03.IP地址与CIDR_哔哩哔哩_bilibili 3.1 IP地址 相当于互联网上的门牌号码&#xff0c;分为ipv4/ipv6&#xff0c;ipv6就是为了解决ipv4的地址耗尽问题的。 v4是1个32位的地址空间192.168.0.1&#xff08;更应该看作是2进制&#xff09; v6是1个128位的地址空间 20…

软件项目总体测试计划(Word原件2024)

一、 前言 &#xff08;一&#xff09; 背景 &#xff08;二&#xff09; 目的 &#xff08;三&#xff09; 测试目标 &#xff08;四&#xff09; 适用范围与读者对象 &#xff08;五&#xff09; 术语与缩写 二、 软件测试实施流程 &#xff08;一&#xff09; 测试工作总体流…

Bash 脚本常用命令

一、基础命令 echo&#xff1a;输出内容到屏幕或文件。 示例&#xff1a;输出“Hello&#xff0c; World&#xff01;”到屏幕。 echo "Hello, World!"pwd&#xff1a;显示当前工作目录。 示例&#xff1a;查看当前目录路径。 pwdcd&#xff1a;改变当前工作目录…

华为OD-C卷-查找众数及中位数[100分]

题目描述 众数是指一组数据中出现次数量多的那个数&#xff0c;众数可以是多个。 中位数是指把一组数据从小到大排列&#xff0c;最中间的那个数&#xff0c;如果这组数据的个数是奇数&#xff0c;那最中间那个就是中位数&#xff0c;如果这组数据的个数为偶数&#xff0c;那…

2024年MathorCup数学建模C题物流网络分拣中心货量预测及人员排班解题文档与程序

2024年第十四届MathorCup高校数学建模挑战赛 C题 物流网络分拣中心货量预测及人员排班 原题再现&#xff1a; 电商物流网络在订单履约中由多个环节组成&#xff0c;图1是一个简化的物流网络示意图。其中&#xff0c;分拣中心作为网络的中间环节&#xff0c;需要将包按照不同流…

【Python基础】MySQL

文章目录 [toc]创建数据库创建数据表数据插入数据查询数据更新 个人主页&#xff1a;丷从心 系列专栏&#xff1a;Python基础 学习指南&#xff1a;Python学习指南 创建数据库 import pymysqldef create_database():db pymysql.connect(hostlocalhost, userroot, passwordr…

文心一言 vs GPT4 全面比较

文心一言和GPT4是两种不同的自然语言处理模型&#xff0c;它们在性能、应用场景和优缺点等方面存在一些差异。下面是它们的全面比较&#xff1a; 1. 性能&#xff1a; - 文心一言&#xff1a;文心一言是一种基于Transformer的中文语言模型&#xff0c;具有较好的语言理解和生成…