在Python中,读取二进制文件使用open()
函数,并将模式(mode)设置为'rb'
('r’表示读取,'b’表示二进制)。这样,可以读取文件内容作为字节(bytes)对象,而不是作为文本字符串。
如:
# 打开一个二进制文件用于读取
with open('Resources/pic1.png', 'rb') as image_file:# 读取文件的全部内容image_bytes = image_file.read()# 将字节转换为十六进制字符串,并添加空格以提高可读性(可选)hex_str = image_bytes.hex()hex_str_with_spaces = ' '.join(hex_str[i:i + 2] for i in range(0, len(hex_str), 2))# 打印十六进制字符串print(hex_str_with_spaces)
但是,考虑到文件可能比较大,可以考虑分块读取进行处理;同时也考虑到打印输出到控制台的数据比较大,故应该把它写到文本中输出。
优化后:
# 定义块大小
block_size = 1024 * 1024 # 1MB# 以二进制模式打开图片文件和输出文件
with open('Resources/pic1.png', 'rb') as image_file, open('Resources/image_hex.txt', 'w') as hex_file:# 不断读取块,直到文件末尾while True:# 读取一个块的数据block = image_file.read(block_size)# 检查是否已到达文件末尾if not block:break# 将块数据转换为十六进制字符串,并添加换行符以提高可读性hex_str = block.hex()hex_file.write(hex_str + '\n') # 或者使用空格分隔每个字节对