实战Keras3.0:自定义图片数据集分类任务

一、创建自定义图片数据集

1、数据收集

以10张小狗图片和10张小猫图片为例

c6ea5a14cba94e4fa286394997a8b4ee.jpeg

692c4c04d29a4b648b29ef8cd13c061f.jpeg

2、数据预处理

1、创建Excel表格,并在其中创建两列,一列是图片路径,另一列是对应的标签(狗0、猫1)

af1b67e770f449aab427027c8c054e71.jpeg

 2、用pandas库的read_excel函数读取Excel,用PIL库的Image函数将图片数据格式化

import pandas as pd
from sklearn.model_selection import train_test_split
import keras
from PIL import Image
import numpy as np
import matplotlib.pyplot as plt#读取Excel表格
data = pd.read_excel('/Users/Desktop/cat_dog/dog_and_cat.xlsx')#图片数据处理
def imageDigitization(image_data):train_data = []for image_item  in image_data:#读取图片img = Image.open(image_item)# 缩放图片img_resized = img.resize((200, 200))img_array = np.array(img_resized)train_data.append(img_array)return np.array(train_data)  #标签数据处理
def labelDigitization(y):train_label=[]for label_item in y:train_label.append(label_item)return  np.array(train_label)  #格式化图片和标签数据  
X = data['A'].values
X = imageDigitization(X)
y = data['B'].to_list()
y = labelDigitization(y)#图片数据归一化
X= X.astype('float32') /255.0  

3、验证数据

用matplotlib库pyplot查看数据集,因图像NumPy数组,标签是整数数组。这些标签对应于图像所代表的类别,由于数据集不包括类名称,所以将根据标签的整数自定义映射名称的数组。

#验证数据
class_names = ['dog', 'cat']plt.figure(figsize=(20,20))
for i in range(20):plt.subplot(10,10,i+1)plt.xticks([])plt.yticks([])plt.grid()plt.imshow(X[i], cmap=plt.cm.binary)plt.xlabel(class_names[y[i]])
plt.show()

56ee9bcac2b9487398b8a33661a681cb.jpeg

4、数据准备

用sklearn库的train_test_split划分训练集和测试集,标签one-hot编码。

# 划分训练集和测试集  
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)#标签one-hot编码
y_train = keras.utils.to_categorical(y_train,num_classes=2)
y_test = keras.utils.to_categorical(y_test,num_classes=2)

二、搭建网络

任务类型猫、狗图像二分类问题

# 创建一个Sequential模型
model = Sequential()# 添加第一个卷积层,使用32个3x3的卷积核,激活函数为ReLU,输入形状为200x200x3
model.add(Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=(200,200, 3)))# 添加第二个卷积层,使用64个3x3的卷积核,激活函数为ReLU
model.add(Conv2D(64, (3, 3), activation='relu'))# 添加最大池化层,池化大小为2x2
model.add(MaxPooling2D(pool_size=(2, 2)))# 将卷积层的输出展平,以便输入到全连接层
model.add(Flatten())# 添加一个全连接层,使用128个神经元,激活函数为ReLU
model.add(Dense(128, activation='relu'))# 添加一个输出层,使用2个神经元,激活函数为softmax
model.add(Dense(2, activation='softmax'))# 编译模型,优化器为Adam,损失函数为分类交叉熵,评估指标为准确率
model.compile(optimizer='adam', loss='categorical_crossentropy',  metrics=['accuracy'])

模型结构 

Model: "sequential"
_________________________________________________________________Layer (type)                Output Shape              Param #   
=================================================================conv2d (Conv2D)             (None, 198, 198, 32)      896       conv2d_1 (Conv2D)           (None, 196, 196, 64)      18496     max_pooling2d (MaxPooling2  (None, 98, 98, 64)        0         D)                                                              flatten (Flatten)           (None, 614656)            0         dense (Dense)               (None, 128)               78676096  dense_1 (Dense)             (None, 2)                 258       =================================================================
Total params: 78695746 (300.20 MB)
Trainable params: 78695746 (300.20 MB)
Non-trainable params: 0 (0.00 Byte)

三、模型训练

保存模型、评估准确率

#模型训练
history=model.fit(X_train, y_train,validation_data=(X_test, y_test),epochs=20,verbose=1)#保存模型
model_path = '/Users/code/model/dog_and_cat.keras'
model.save(model_path)#评估准确率
test_loss, test_acc = model.evaluate(X_test, y_test, verbose=2)
print('\nTest accuracy:', test_acc)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/593183.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java企业人事信息管理系统Myeclipse开发mysql数据库web结构java编程计算机网页项目

一、源码特点 java Web企业人事信息管理系统是一套完善的java web信息管理系统,对理解JSP java编程开发语言有帮助,系统具有完整的源代码和数据库,系统主要采用B/S模式开发。开发环境 为TOMCAT7.0,Myeclipse8.5开发,数据库为M…

【学习记录23】Linux环境下安装nginx

自己折腾了个服务器在上面跑前端项目,记录一下以备后期查询,为了省钱每年都换一次云服务器。。。每次都得重装各种东西!!! 1、安装所需环境 //安装gcc yum install gcc-c//安装PCRE pcre-devel yum install -y pcre …

Python-单行赋值的执行顺序

一般情况下,python 的元组赋值可以当作没有顺序: a, b 1, 2 a Out[3]: 1 b Out[4]: 2 但是如果交换的变量存在关联,元组赋值就是有顺序的: a, b b, a a, b Out[6]: (2, 1) 结果是a,b的值交换了顺序。如果按照: …

RTC第二个功能和应用程序

一般RTC模块设备管理时间日历、计时器等。从年到二。一些爱普生RTC 模块可以通过使用来自32768 Hz的分割频率来管理次第二功能。本文件 描述了RTC模块的三个具体的应用程序。(表1) 表1中的功能和产品 [FOUT函数应用程序] 图1描述了RTC模块&#xff0…

springboot项目maven install 失败提示unable to rename “*.jar“ to “*.jar.original“

项目场景: 项目作为springcloud项目,安装包的打包一直使用的是idea中 maven->lifestyle->install 问题描述 今天打包的时候报错:unable to rename “*.jar” to “*.jar.original” 而且打包出来的jar包的大小明显小了 原因分析&…

iOS和iPadOS设备启动到打开App

一、设备启动过程 启动过程每个步骤包含的组件都经 Apple 加密签名以启用完整性检查,因此只有在验证信任链后,启动才能继续; 这些组件包括引导载入程序、内核、内核扩展项和蜂窝网络基带固件; 这一安全启动链的设计旨在验证软件的…

Python数据挖掘与机器学习实践技术应用

近年来,Python编程语言受到越来越多科研人员的喜爱,在多个编程语言排行榜中持续夺冠。同时,伴随着深度学习的快速发展,人工智能技术在各个领域中的应用越来越广泛。机器学习是人工智能的基础,因此,掌握常用…

qt .pro工程转vs工程

1. 新建vs空项目或者Qt Console Application; 2. 扩展 -》Qt VS Tools -》Open Qt Project (.pro) 打开对应的pro文件即可将.pro工程转成vs工程; 注意: (1)转成的vs工程在pro文件同级目录下,双击打开vcx…

网络通信(7)-TCP协议解析

目录 一、定义 二、主要特点 三、报文格式 四、工作方式

科兴未来|中国北京 · HICOOL 2024全球创业大赛招募启动

HICOOL 2024全球创业大赛正式启动,我们诚挚地邀请来自世界各地的创业项目报名参赛,在全球舞台上展示自己,加速成长。 一、参赛收获 大赛将为获奖项目提供包括人才落户、子女教育、医疗保障等在内的创业政策支持。此外,参赛项目将…

桶式移位器

前言 本篇文章介绍CPU的核心部件之一:桶式移位器,简称BS,英文全称为Barrel Shifter 桶式移位器最大的特点就是能在单周期内完成多种方式,各种位数的移位操作 常见的移位操作 常见的移位操作种类如下: 算术右移 是指…

实验笔记之——基于windows复现Instant-NGP

之前博客对NeRF-SLAM进行了调研,本博文先复现一下Intant-NGP。 学习笔记之——NeRF SLAM(基于神经辐射场的SLAM)-CSDN博客文章浏览阅读851次,点赞22次,收藏21次。NeRF 所做的任务是 Novel View Synthesis(…

在前端开发中,如何优化网站的加载速度?

在前端开发中,网站的加载速度是一个至关重要的因素,它直接影响着用户体验和搜索引擎优化(SEO)。一个快速、响应迅速的网站不仅能让用户更加满意,还能提高网站的排名和流量。那么,如何优化网站的加载速度呢&…

计算机网络面试题总结

总结自Network | JavaGuide(Java面试 学习指南) 什么是OSI7层模型? 什么是TCP/IP 四层模型? 为什么网络要分层? 应用层有哪些常见的协议? 传输层有哪些常见的协议? 网络层有哪些常见的协议? 从输入…

python 基础教程一(序列的基础知识)

#为单行注释 多行注释为三个‘开头和结尾 常用内置函数 pow函数 pow(x,y,[z])求x的y次幂 如果z不省略对z进行%运算 abs函数求绝对值 divmod(x,y) 同时输出商和余数 **round(x,[d])**函数会把浮点数变为最接近的整数值,会四舍五入。x为浮点数,d为保留几…

el-radio-button自适应充满盒子的写法

业务场景&#xff1a;当盒子较宽时&#xff0c;希望 el-radio-button 自适应充满盒子。 el-radio-button 自适应充满盒子的写法 <el-form :inline"true" :model"searchForm"><el-form-item style"display: flex; align-items: center;"…

python moviepy 图文批量合成带字幕口播视频

最近在研究将图片和文本批量合成为带字幕口播视频 主要是基于python的moviepy库 from generator import audio, pics, subs, videodef main():texts_input examplepics_input example# 图片分辨率预处理pics.adjust(pics_input)# 文字转语音audio.text_to_audio(texts_inpu…

【Java EE初阶七】多线程案例(阻塞队列与生产者消费者模型)

1. 阻塞队列 队列是先进先出的一种数据结构&#xff1b; 阻塞队列&#xff0c;是基于队列&#xff0c;做了一些扩展&#xff0c;适用于多线程编程中&#xff1b; 阻塞队列特点如下&#xff1a; 1、是线程安全的 2、具有阻塞的特性 2.1、当队列满了时&#xff0c;就不能往队列里…

算法分析与设计 第七次理论作业

算法分析与设计 第七次理论作业 文章目录 算法分析与设计 第七次理论作业一. 单选题&#xff08;共2题&#xff0c;20分&#xff09;二. 填空题&#xff08;共8题&#xff0c;80分&#xff09; 一. 单选题&#xff08;共2题&#xff0c;20分&#xff09; (单选题) 回溯法在搜索…

串口通信要点解析

目录 简介&#xff1a; UART 协议解析&#xff1a; 串口协议工作过程&#xff1a; 简介&#xff1a; 串行通信协议包括&#xff1a; UART通用异步收发传输器 (Universal Asynchronous ReceiverTransmitter) 是一种串行异步收发协议 (异步是指通信双方使用各自的时钟控制数据…