csv 模块是 Python 标准库中的一个模块,用于处理 CSV(逗号分隔值)文件。它提供了简单易用的功能来读取和写入 CSV 文件。以下是一些常用的操作:
一、读取 CSV 文件
新建文件data.csv,内容如下:
使用 csv.reader 读取CSV 文件
使用reader之前先要使用python的内置标准函数open()打开文件。open()的用法见:
python的open()函数-CSDN博客
import csvwith open('data.csv', mode='r', newline='') as file:
csv.reader(file) 创建的 reader 对象是一个迭代器,用于逐行读取 CSV 文件中的数据。reader 对象的格式是一个生成器对象,每次迭代返回一行数据,每一行数据以列表的形式呈现,每个列表元素对应 CSV 文件中的一个字段(单元格)。
逐行打印reader数据:
import csvwith open('data.csv', mode='r', newline='') as file:reader = csv.reader(file)for row in reader:print(row)
打印输出结果:
['line0_0', 'line0_1', 'line0_2', 'line0_3', 'line0_4', 'line0_5']
['line1_0', 'line1_1', 'line1_2', 'line1_3', 'line1_4', 'line1_5']
['line2_0', 'line2_1', 'line2_2', 'line2_3', 'line2_4', 'line2_5']
['line3_0', 'line3_1', 'line3_2', 'line3_3', 'line3_4', 'line3_5']
['line4_0', 'line4_1', 'line4_2', 'line4_3', 'line4_4', 'line4_5']
['line5_0', 'line5_1', 'line5_2', 'line5_3', 'line5_4', 'line5_5']
将reader数据转换为列表:
import csvwith open('data.csv', mode='r', newline='') as file:reader = csv.reader(file)csv_data = list(reader)
打印输出结果:
[['line0_0', 'line0_1', 'line0_2', 'line0_3', 'line0_4', 'line0_5'], ['line1_0', 'line1_1', 'line1_2', 'line1_3', 'line1_4', 'line1_5'], ['line2_0', 'line2_1', 'line2_2', 'line2_3', 'line2_4', 'line2_5'], ['line3_0', 'line3_1', 'line3_2', 'line3_3', 'line3_4', 'line3_5'], ['line4_0', 'line4_1', 'line4_2', 'line4_3', 'line4_4', 'line4_5'], ['line5_0', 'line5_1', 'line5_2', 'line5_3', 'line5_4', 'line5_5'], ['', '', '', '', '', ''], ['', '', '', '', '', ''], ['', '', '', '', '', ''], ['', '', '', '', '', ''], ['', '', '', '', '', '']]
csv.reader 对象的特性
返回类型:csv.reader 对象的每一项是一个列表,每个列表表示 CSV 文件中的一行数据。列表中的元素是每个字段的值。
迭代方式:csv.reader 是一个迭代器,可以使用 for 循环逐行遍历 CSV 文件。
默认分隔符:csv.reader 默认使用逗号(,)作为字段分隔符,但你可以通过设置 delimiter 参数来使用其他分隔符,如分号(;)。
reader = csv.reader(file, delimiter=';')
引号处理:csv.reader 可以处理字段中的引号。默认情况下,它会将被引号括起来的字段视为一个单独的字段,并自动处理字段中的引号和转义字符。
reader = csv.reader(file, quotechar='"')
例如,data.csv的内容如下:
import csvwith open('data.csv', newline='', encoding='gbk') as csvfile:reader = csv.reader(csvfile, quotechar='"')for row in reader:print(row)
输出结果:
['A', 'B']
['A,B']
在这个例子中,第一行中的逗号是字段之间的分隔符,第二行的逗号被双引号包围,这个逗号不被解释为字段之间的分隔符,而是作为一个字段中的字符存在。
转义符:escapechar
escapechar 参数用于指定一个转义字符。在 CSV 文件中,如果某个字段中包含了 quotechar 指定的字符,并且您不希望这个字符被解释为字段的边界,您可以使用 escapechar 来转义它。转义字符通常出现在要转义的字符之前,表示该字符应该按字面意义解释,而不是作为特殊字符。
import csvwith open('data.csv', newline='', encoding='gbk') as csvfile:reader = csv.reader(csvfile, quotechar='"', escapechar='\\')for row in reader:print(row)
输出结果:
['Trunpm', '30', 'He said, "Hello!"']
He said前面的双引号和末尾的双引号,由于没有转义符,就被识别为字段的边界。而Hello!处的双引号有转义符,就被识别为字符双引号。
当然,除了"\",也可以使用别的字符作为转义符。例如:
import csvwith open('data.csv', newline='', encoding='gbk') as csvfile:reader = csv.reader(csvfile, quotechar='"', escapechar='#')for row in reader:print(row)
输出结果相同。
csv.DictReader
使用 csv.DictReader
从 CSV 文件中读取数据,并将每一行数据转换为字典格式。
读CSV 文件并将其转换为字典的示例:
import csv# 打开 CSV 文件进行读取
with open('output.csv', mode='r', newline='') as file:# 创建 DictReader 对象reader = csv.DictReader(file)# 读取数据并打印for row in reader:print(row)
二、写入csv文件
使用 csv.writer 写入
import csvdata = [["Name", "Age", "City"],["Alice", "30", "New York"],["Bob", "25", "Los Angeles"]
]with open('output.csv', mode='w', newline='') as file:writer = csv.writer(file)writer.writerows(data)
csv.writer(file):创建一个 CSV 写入器对象。
writer.writerows(data):将 data 中的所有行写入 CSV 文件。
基本的写入和读取
import csv# 读取
with open('data.csv', mode='r', newline='') as file:reader = csv.reader(file)data = list(reader)# 写入
with open('output.csv', mode='w', newline='') as file:writer = csv.writer(file)writer.writerows(data)# 再次读取
with open('output.csv', mode='r', newline='') as file:reader = csv.reader(file)data = list(reader)print(data)
使用 csv.DictWriter 写入
import csvfieldnames = ['Name', 'Age', 'City']
data = [{'Name': 'Alice', 'Age': '30', 'City': 'New York'},{'Name': 'Bob', 'Age': '25', 'City': 'Los Angeles'}
]with open('output.csv', mode='w', newline='') as file:writer = csv.DictWriter(file, fieldnames=fieldnames)writer.writeheader()writer.writerows(data)
csv.DictWriter(file, fieldnames=fieldnames):创建一个字典写入器对象。fieldnames 指定了字典的键的顺序。
writer.writeheader():写入 CSV 文件的头部(列名)。
writer.writerows(data):将字典数据写入 CSV 文件。
读和写的demo:
import csvfieldnames = ['Name', 'Age', 'City']
data = [{'Name': 'Alice', 'Age': '30', 'City': 'New York'},{'Name': 'Bob', 'Age': '25', 'City': 'Los Angeles'}
]with open('output.csv', mode='w', newline='') as file:writer = csv.DictWriter(file, fieldnames=fieldnames)writer.writeheader()writer.writerows(data)with open('output.csv', mode='r', newline='') as file:reader = csv.DictReader(file)data = list(reader)print(data)
输出结果:
[{'Name': 'Alice', 'Age': '30', 'City': 'New York'}, {'Name': 'Bob', 'Age': '25', 'City': 'Los Angeles'}]
三、不同的分隔符
CSV 文件的分隔符默认是逗号(,),但有时候需要使用其他分隔符,例如分号(;)。可以通过设置 delimiter 参数来指定不同的分隔符。
import csv# 读取使用分号作为分隔符的 CSV 文件
with open('input.csv', mode='r', newline='') as file:reader = csv.reader(file, delimiter=';')for row in reader:print(row)# 写入使用分号作为分隔符的 CSV 文件
with open('output.csv', mode='w', newline='') as file:writer = csv.writer(file, delimiter=';')writer.writerows(data)