oxford-iiit-pet 数据集

文章目录

    • 项目说明
      • 数据集说明 oxford-iiit-pet
    • 代码实现
      • 数据处理
      • 整理原始数据-分类
        • 划分 训练集和测试集


项目说明


数据集说明 oxford-iiit-pet

数据官方网站:
https://www.robots.ox.ac.uk/~vgg/data/pets/
下载 .torrent 文件,然后下载完整文件。

主要分为 images 和 annotations 文件


images 由以下类别图片构成:

Abyssinian Ragdoll boxer keeshond scottish_terrier
Bengal Russian_Blue chihuahua leonberger shiba_inu
Birman Siamese english_cocker_spaniel miniature_pinscher staffordshire_bull_terrier
Bombay Sphynx english_setter newfoundland wheaten_terrier
British_Shorthair american_bulldog german_shorthaired pomeranian yorkshire_terrier
Egyptian_Mau american_pit_bull_terrier great_pyrenees pug
Maine_Coon basset_hound havanese saint_bernard
Persian beagle japanese_chin samoyed

大写字母开头的是猫;小写字母开头的是狗。


annotations/xmls/Abyssinian_1.xml

<annotation><folder>OXIIIT</folder><filename>Abyssinian_1.jpg</filename><source><database>OXFORD-IIIT Pet Dataset</database><annotation>OXIIIT</annotation><image>flickr</image></source><size><width>600</width><height>400</height><depth>3</depth></size><segmented>0</segmented><object><name>cat</name><pose>Frontal</pose><truncated>0</truncated><occluded>0</occluded><bndbox><xmin>333</xmin><ymin>72</ymin><xmax>425</xmax><ymax>158</ymax></bndbox><difficult>0</difficult></object></annotation>


代码实现

数据处理

import os
import shutil
import random

整理原始数据-分类

将零散的数据,根据名字放到不同文件夹


def split_types(data_dir="images/",ret_dir="dataset/"):'''归类图像到不同目录中'''for file_name in os.listdir(data_dir):file_path = os.path.join(data_dir, file_name)type_dir = os.path.join(ret_dir + file_name.split('_')[0].strip())if not os.path.exists(type_dir):os.makedirs(type_dir)shutil.copy(file_path, type_dir+one_pic)

划分 训练集和测试集
origin_dir = '/Users/luyi/Downloads/oxford-iiit-pet/images/'
save_dir = ''# 对原始数据集 划分 训练集和测试集 
def random2Dataset(data_dir=origin_dir,ratio=0.3):label_list = os.listdir(data_dir)for label in label_list:if label.startswith('.'):continuetype_dir = os.path.join(data_dir, label)train_dir_type = os.path.join(save_dir, 'train', label)test_dir_type  = os.path.join(save_dir, 'test', label)if not os.path.exists(train_dir_type):os.makedirs(train_dir_type)if not os.path.exists(test_dir_type):os.makedirs(test_dir_type)file_names = os.listdir(type_dir)test_num = int(len(file_names) * ratio)print('-- ', label, test_num, )random.shuffle(file_names)#创建测试集 for file_name in file_names[:test_num]: if file_name.startswith('.'):continue file_path = os.path.join(type_dir, file_name)save_path = os.path.join(test_dir_type, file_name) shutil.move(one_path, new_path)#创建训练集for file_name in file_names[test_num:]:if file_name.startswith('.'):continuefile_path = os.path.join(type_dir, file_name)save_path = os.path.join(train_dir_type, file_name) shutil.move(one_path, new_path)

2023-02-28

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/7385.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C# 继承和静态属性或方法

目录 继承&#xff1a; 静态属性和方法&#xff1a; 在子类中访问父类的静态属性和方法&#xff1a; 继承与静态属性或方法的关系&#xff1a; 注意&#xff1a; PS&#xff1a;如有错漏之处&#xff0c;敬请指正 在C#中&#xff0c;继承&#xff08;inheritance&#xf…

JavaScript基础(五)

三目运算符 用于判断并赋值 语法: 判断条件?条件成立执行语句:条件不成立执行语句; (条件&#xff1f;"true":"false";) 例: <script> var age prompt(请输入年龄) var name (age>18)?"已成年":"未成年禁止登录" a…

开源投票系统源码及搭建 在线投票活动创建系统的设计与开发

在当今数字化时代&#xff0c;在线投票活动已成为各类组织、企业和个人不可或缺的一部分。无论是选举、问卷调查、产品评选还是其他需要收集公众意见的场景&#xff0c;一个高效、稳定且易于使用的在线投票系统都至关重要。 分享一款基于开源投票系统源码的在线投票活动创建系…

uniapp从数组中删除重复项

在 UniApp&#xff08;或任何使用 JavaScript 的环境中&#xff09;从数组中删除重复项&#xff0c;你可以使用多种方法。以下是一些常见的方法&#xff1a; 1. 使用 filter() 和 indexOf() 你可以使用 Array.prototype.filter() 方法结合 Array.prototype.indexOf() 方法来创…

【网络知识】光猫、路由器 和 交换机 的作用和区别?

数字信号&#xff1a;是指自变量是离散的、因变量也是离散的信号&#xff0c;这种信号的自变量用整数表示&#xff0c;因变量用有限数字中的一个数字来表示。在计算机中&#xff0c;数字信号的大小常用有限位的二进制数表示。 模拟信号&#xff1a;模拟信号是指用连续变化的物…

偏微分方程算法之混合边界条件下的差分法

目录 一、研究目标 二、理论推导 三、算例实现 四、结论 一、研究目标 我们在前几节中介绍了Poisson方程的边值问题&#xff0c;接下来对椭圆型偏微分方程的混合边值问题进行探讨&#xff0c;研究对象为&#xff1a; 其中&#xff0c;为矩形区域&#xff0c;为上的连续函数…

巴东电子商务奖励标准!巴东县网红直播基地、电子商务示范企业奖励补贴

巴东电子商务奖励标准&#xff01;巴东县网红直播基地、电子商务示范企业奖励补贴的内容整理如下&#xff1a;奖励内容较多 查找想了解的奖励可按 CtrlF 然后输入关键词即可 巴东县电子商务发展专项资金支持对象 本项目奖补对象适用于在我县注册、纳税、从事电子商务的商贸类企…

ISIS的基本概念

1.ISIS概述 IS-IS是一种链路状态路由协议&#xff0c;IS-IS与OSPF在许多方面非常相似&#xff0c; 例如运行IS-IS协议的直连设备之间通过发送Hello报文发现彼此&#xff0c;然后建立邻接关系&#xff0c;并交互链路状态信息。 CLNS由以下三个部分组成&#xff1a; CLNP&#xf…

民航无人机证书的含金量

民航无人机证书&#xff0c;尤其是由中国民用航空局飞行标准司直接签发的CAAC无人机执照&#xff0c;具有很高的含金量。 这种驾照是由国家权威机构颁发的&#xff0c;具有很高的权威性&#xff0c;是合法操控无人机的重要依据。 持有CAAC无人机执照的从业人员可以从事无人机相…

VALSE 2024特邀报告内容解析|多模态视觉融合方法:是否存在性能极限?

2024年视觉与学习青年学者研讨会&#xff08;VALSE 2024&#xff09;于5月5日到7日在重庆悦来国际会议中心举行。本公众号将全方位地对会议的热点进行报道&#xff0c;方便广大读者跟踪和了解人工智能的前沿理论和技术。欢迎广大读者对文章进行关注、阅读和转发。文章是对报告人…

No space left on device

报错提示 [ERROR] Upload Local File hwzt-third-party-out.jar Failed [ERROR] java.lang.RuntimeException: cp: error writing : No space left on device [ERROR] com.alibabacloud.commons.ssh.sshj.SshjConnection.executeCustomCharset(SshjConnection.java:172) …

flask网站开发计划

我想写一个flask开发网站的合集文章&#xff0c;该网站主要是采集网络上的文章&#xff08;不同站点&#xff0c;用Python识别出正文内容&#xff09;&#xff0c;然后做成长图形式&#xff0c;发布到flask站点&#xff0c;并提供“下载”按钮&#xff0c;点击下载按钮&#xf…

文档打分系统部署操作手册

后台部署 java 运行环境的安装CentOS系统中安装Java Development Kit (JDK)-CSDN博客Redis的安装&#xff0c;配置文件与配置服务启动以及开机自动运行CentOS 7.9上安装Redis_centos7.9编译安装redis-CSDN博客Mysql的安装&#xff0c;配置文件与配置服务启动以及开机自动运行转…

送给正在入行的小白:最全最有用的网络安全学习路线已经安排上了

在这个圈子技术门类中&#xff0c;工作岗位主要有以下三个方向&#xff1a; 安全研发安全研究&#xff1a;二进制方向安全研究&#xff1a;网络渗透方向 下面逐一说明一下。 第一个方向&#xff1a;安全研发 你可以把网络安全理解成电商行业、教育行业等其他行业一样&#xf…

基于 Spring Boot 博客系统开发(七)

基于 Spring Boot 博客系统开发&#xff08;七&#xff09; 本系统是简易的个人博客系统开发&#xff0c;为了更加熟练地掌握 SprIng Boot 框架及相关技术的使用。&#x1f33f;&#x1f33f;&#x1f33f; 基于 Spring Boot 博客系统开发&#xff08;六&#xff09;&#x1f…

【RAG 博客】Haystack 中的 DiversityRanker 与 LostInMiddleRanker 用来增强 RAG pipelines

Blog&#xff1a;Enhancing RAG Pipelines in Haystack: Introducing DiversityRanker and LostInTheMiddleRanker ⭐⭐⭐⭐ 文章目录 Haystack 是什么1. DiversityRanker2. LostInTheMiddleRanker使用示例 这篇 blog 介绍了什么是 Haystack&#xff0c;以及如何在 Haystack 框…

AI把OpenAI内斗魔改成晋江文学,插图也能画,最新工具爆火,网友冲崩服务器

AI魔改OpenAI内斗大戏…… 这晋江味儿要冲出屏幕了&#xff01; Ilya就是这样的人&#xff0c;对待身边的人冷漠如冰&#xff0c;对待工作却不择手段…… △来自知乎Midreal小助手 而且剧情还不那么离谱&#xff0c;AI自由发挥下很多点都符合逻辑。 “所以我们在评估投资回报…

Surya:强大的开源 OCR 文字识别工具

在当今数字化时代&#xff0c;文字识别技术扮演着至关重要的角色。VikParuchuri/surya 便是一款令人瞩目的开源 OCR 文字识别工具。 主要功能&#xff1a; 支持 90 多种语言的文字识别&#xff1a;Surya 具备强大的语言兼容性&#xff0c;能够轻松应对多种语言的文字识别任务&…

翻译《The Old New Thing》 - What are SYSTEM_FONT and DEFAULT_GUI_FONT?

What are SYSTEM_FONT and DEFAULT_GUI_FONT? - The Old New Thing (microsoft.com)https://devblogs.microsoft.com/oldnewthing/20050707-00/?p35013 Raymond Chen 2005年07月07日 在 Windows 编程中&#xff0c;GetStockObject 函数提供了两种特殊的字体&#xff1a;SYST…

【数据库原理及应用】期末复习汇总高校期末真题试卷05

试卷 一、选择题 1.( )是存储在计算机内有结构的数据的集合。 A.数据库系统 B.数据库 C.数据库管理系统 D.数据结构 2.数据库的三级模式结构中&#xff0c;数据库对象—视图是( ) A.外模式 B.内模式 C.存储模式 D.模式 3.在下列关于关系表的陈述中&#xff0c;错误的是(…