使用方法(二选一即可):
- python 这个文件名.py --xml_dir xml文件路径 --image_dir 图片所在路径 --out_dir 输出文件夹
- 放在和VOC2007同级路径下运行即可
import os
import xml.etree.ElementTree as ET
import cv2
import argparse
from tqdm import tqdmdef xml_to_txt(xml_dir,img_dir,out_dir):if not os.path.exists(out_dir): # 如果输出路径不存在,创建输出路径os.makedirs(out_dir)annotations = os.listdir(xml_dir) # 获取指定文件夹的文件列表#tqdm是用来显示进度条的,可以改成你原来那样子就不会有进度条了for i, file in tqdm(enumerate(annotations),desc='已经处理了',total=len(annotations),unit='xml_file'):txt_name = file.split('.')[0] + '.txt'#txt的文件名txt_pos = out_dir + '/' + txt_name#txt文件带路径的文件名with open(txt_pos,mode='w') as f_txt:#f_txt是用于txt文件读写的文件对象with open(xml_dir+'/'+file,encoding='utf-8') as f_xml:#f_xml是用于xml文件读写的文件对象tree = ET.parse(f_xml)root = tree.getroot()for obj in root.iter('object'):src = cv2.imread(img_dir+'/img{:0>5d}.jpg'.format(i+1))width=src.shape[1]height=src.shape[0]xmlbox=obj.find('bndbox')#获取对应的bndbox中的对应的坐标值文本并转为int型x_max=int(xmlbox.find('xmax').text)x_min=int(xmlbox.find('xmin').text)y_max=int(xmlbox.find('ymax').text)y_min=int(xmlbox.find('ymin').text)#计算对应的x y w hx = ((x_min + x_max) / 2.0)*(1.0/width)y = ((y_min + y_max) / 2.0)*(1.0/height)w = (x_max-x_min)*(1.0/width)h = (y_max-y_min)*(1.0/height)f_txt.write('0' + ' ')f_txt.write(str(x) + ' ' + str(y) + ' ' + str(w) + ' ' + str(h) + ' ')f_txt.write('\n')if __name__ == '__main__':parser = argparse.ArgumentParser()parser.add_argument('--xml_dir', type=str, default='./VOC2007/Annotations', help='xml文件所在目录')parser.add_argument('--img_dir', type=str, default='./VOC2007/JPEGImages', help='图片文件所在目录')parser.add_argument('--out_dir', type=str, default='./resultLabels', help='输出文件夹')opt = parser.parse_args()xml_to_txt(opt.xml_dir,opt.img_dir,opt.out_dir)