模型训练识别手写数字(二)

模型训练识别手写数字(一)使用手写数字图像进行模型测试

一、生成手写数字图像

1. 导入所需库

import cv2
import numpy as np
import os

cv2用于计算机视觉操作。

numpy用于处理数组和图像数据。

os用于文件和目录操作。

2. 初始化画布

canvas = np.zeros((280, 280), dtype="uint8")

创建一个280x280的黑色画布(值为0表示黑色)。 

 3. 鼠标回调函数

def draw(event, x, y, flags, param):if event == cv2.EVENT_MOUSEMOVE and flags == cv2.EVENT_FLAG_LBUTTON:cv2.circle(canvas, (x, y), 5, 255, -1)

draw函数在鼠标移动时绘制白色圆点(值为255)到画布上。圆点的半径为5像素。 

 4. 创建窗口并设置回调

cv2.namedWindow("Canvas")
cv2.setMouseCallback("Canvas", draw)

创建一个名为“Canvas”的窗口,并设置鼠标回调函数。 

  5. 主循环

while True:cv2.imshow("Canvas", canvas)key = cv2.waitKey(1) & 0xFF

不断显示画布,等待用户输入。 

   6. 处理用户输入

if key == ord('c'):canvas = np.zeros((280, 280), dtype="uint8")
elif key == ord('q'):break

按 'c' 键清空画布,按 'q' 键退出循环。 

    7. 保存图像目录

save_dir = "Data"
if not os.path.exists(save_dir):os.makedirs(save_dir)

检查并创建保存图像的目录。 

     8. 保存图像文件

save_path = os.path.join(save_dir, "handwritten_digit.png")
if cv2.imwrite(save_path, canvas):print(f"Image saved successfully at {save_path}")
else:print("Failed to save image.")

将画布保存为PNG文件,并输出保存状态。 

  9. 关闭窗口 

cv2.destroyAllWindows()

关闭所有OpenCV窗口。 

二、调用训练的模型进行测试

1. 导入所需库

import cv2
import matplotlib.pyplot as plt
import numpy as np
from keras.api.models import load_model

cv2用于图像处理。

matplotlib.pyplot用于可视化结果。

numpy用于数值计算。

load_model用于加载训练好的Keras模型。

2. 加载训练的模型 

model = load_model("my_model.h5")

从文件中加载训练好的模型。

 3. 加载手写数字图像

original_img = cv2.imread("Data/handwritten_digit.png", cv2.IMREAD_GRAYSCALE)

读取手写数字图像,并以灰度模式加载。 

 4. 处理图像用于预测 

img = cv2.resize(original_img, (28, 28))  # 调整为28x28大小
img = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)[1]  # 二值化
img = img.astype('float32') / 255  # 归一化

 将图像调整为28x28像素,这是模型所需的输入尺寸。

使用阈值处理将图像二值化(黑白),并将背景设置为白色,手写数字为黑色。

将图像数据归一化到[0, 1]范围。

  5. 调整图像形状以便于预测

img = img.flatten()  # 展平为一维数组
img = img.reshape(1, 784)  # 调整形状为 (1, 784)

将28x28的图像展平为784个像素值的单行数组,以适应模型的输入格式。 

6. 进行预测

predictions = model.predict(img)
predicted_class = np.argmax(predictions, axis=1)

 7. 可视化预测结果

plt.figure(figsize=(6, 6))# 显示原图
plt.imshow(original_img, cmap='gray', aspect='equal')  # 使用原始图像
plt.title(f'Predicted: {predicted_class[0]}', fontsize=14)
plt.axis('off')plt.tight_layout()
plt.show()

创建一个图形窗口,并显示原始图像。

在标题中显示模型预测的类别。

使用tight_layout()优化图形布局,并显示图形。

手写8,预测却是2;说明模型在训练集上表现良好,但在测试却表现差。

目前使用的是一个全连接神经网络(Feedforward Neural Network)。这个网络的结构通常包括以下几个部分:

  1. 输入层:接受输入数据,例如在你的例子中是手写数字的像素值。
  2. 隐藏层:通过全连接的方式进行计算,使用激活函数(如 ReLU)引入非线性。
  3. 输出层:生成预测结果,通常使用 softmax 激活函数进行分类。

全连接神经网络在处理图像时通常需要将输入图像展平(flatten),这可能导致对空间特征的捕捉不够有效,因此卷积神经网络(CNN)更适合图像数据,因为它们能够利用卷积层自动提取空间特征,从而提高分类性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/883561.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【学术会议论文投稿】前端框架巅峰对决:React、Vue与Angular的全面解析与实战指南

【JPCS独立出版】​第三届能源与动力工程国际学术会议(EPE 2024)_艾思科蓝_学术一站式服务平台 更多学术会议请看:https://ais.cn/u/nuyAF3 引言 在快速发展的前端技术领域,选择合适的框架或库对于项目的成功至关重要。React、Vu…

什么是Java策略模式?与Spring的完美结合

文章目录 什么是策略模式?策略模式的组成部分: 策略模式的示例在Spring中的妙用1. 使用Spring配置2. 在上下文中选择策略3. 动态切换策略 总结推荐阅读文章 在软件设计中,策略模式是一种非常常见的设计模式,它能够让算法的变化独立…

CesiumJS 案例 P7:添加指定长宽的图片图层(原点分别为图片图层的中心点、左上角顶点、右上角顶点、左下角顶点、右下角顶点)

CesiumJS CesiumJS API:https://cesium.com/learn/cesiumjs/ref-doc/index.html CesiumJS 是一个开源的 JavaScript 库,它用于在网页中创建和控制 3D 地球仪(地图) 一、添加指定长宽的图片图层(原点为图片图层的中心…

Redis的Key和Value的设计原则有哪些?

在设计 Redis 的 Key 和 Value 时,需要考虑一些原则,以确保数据存储和检索的效率,以及满足特定用例的需求。以下是一些设计 Redis Key 和 Value 的原则: Key 的设计原则 1.可读性:一个Key应该具有比较好的可读性,让人能看得懂是…

Kaggle竞赛——灾难推文分类(Disaster Tweets)

目录 1. 准备工作2. 资源导入3. 数据处理4. 绘制词云图5. 数据可视化5.1 词数和字符数可视化5.2 元特征可视化5.3 类别可视化 6. 词元分析6.1 一元语法统计6.2 多元语法统计 7. 命名实体识别8. 推文主题提取9. 构建模型9.1 数据划分与封装9.2 模型训练与验证 10. 模型评估11. 测…

SQL:Windows下MySQL的安装教程(超详细)

一.系统环境: 操作系统: Windows11; MySQL版本: mysql-community-8.0.40.0; 二.MySQL下载: 访问MySQL 官网下载地址:https://www.mysql.com/,点击DOWNLOADS; 跳转后页…

Maven---依赖管理,项目构建工具

1.Maven安装和配置 1.1设置本地仓库 提前准备好仓库的位置,打开配置文件maven/conf/setting.xml 1.2配置阿里镜像源 在mirrors节点(标签)下添加阿里中央仓库镜像,把原本的镜像源注释掉,不要写在mirrors标签外 <mirror><id>alimaven</id><name>aliy…

6 款超实用的 Coze 插件,让你的智能体开发效率提升 200%

最近我一直在频繁使用 Coze 智能体&#xff0c;帮朋友和客户实现各种定制化需求。 Coze 不仅提供了强大的工作流编排能力和全面的功能节点&#xff0c;还有大量由开发者和平台上传的插件库支持。 对于智能体开发者来说&#xff0c;找到一款合适、好用的插件&#xff0c;真的能…

python构建flask服务用于视频文件的处理后返回

背景:一个改进的 Flask 服务示例,它接收一个 MP4 文件和一个名为 `style` 的参数,并将上传的 MP4 文件保存在服务器的本地,然后返回一个预先存在的 MP4 文件。 1. **安装 Flask**: ```bash pip install Flask ``` 2. **创建 Flask 应用**: 下面是一个简单的 Flas…

java学习技巧分享

学习Java编程语言是一个循序渐进的过程&#xff0c;需要耐心和持续的努力。以下是一些有助于提高Java学习效率的技巧&#xff1a; 1. 基础知识优先&#xff1a; - 在深入学习之前&#xff0c;确保你理解了基本的计算机科学概念&#xff0c;如数据类型、变量、控制结构&#xff…

【实用知识】Spring Boot 优雅捕捉异常的几种姿势

&#x1f449;博主介绍&#xff1a; 博主从事应用安全和大数据领域&#xff0c;有8年研发经验&#xff0c;5年面试官经验&#xff0c;Java技术专家&#xff0c;WEB架构师&#xff0c;阿里云专家博主&#xff0c;华为云云享专家&#xff0c;51CTO 专家博主 ⛪️ 个人社区&#x…

设计模式(二)

设计模式(二) 敏捷开发模式&#xff1a;Refactoring to Patterns 重构特点&#xff1a; 1. 静态 --------> 动态 1. 早绑定 -----------> 晚绑定 1. 继承 ----------> 组合 1. 编译时依赖 --------> 运行时依赖 1. 紧耦合 -------> 松耦合组件协作模式 通过…

JVM(HotSpot):GC之G1垃圾回收器

文章目录 一、简介二、工作原理三、Young Collection 跨代引用四、大对象问题 一、简介 1、适用场景 同时注重吞吐量&#xff08;Throughput&#xff09;和低延迟&#xff08;Low latency&#xff09;&#xff0c;默认的暂停目标是 200 ms超大堆内存&#xff0c;会将堆划分为…

华为云弹性云服务器无法登录远程操作

遇到的问题&#xff1a; 就是你在创建弹性云服务器的时候选择了没有子网的虚拟私有云&#xff0c; 你属于误删了虚拟私有云的子网&#xff0c;自己没有注意看 如果在华为云创建弹性云服务器时选择的虚拟私有云&#xff08;VPC&#xff09;没有配置子网&#xff0c;那么在尝试远…

压力测试指南-压力测试中的性能瓶颈定位与优化

压力测试中的性能瓶颈定位与优化 在当今快速迭代的软件开发环境中&#xff0c;确保应用能够承受高并发访问和大规模数据处理变得至关重要。压力测试作为评估系统极限能力的关键手段&#xff0c;不仅能揭示潜在的性能问题&#xff0c;还能指导我们进行针对性的优化。本文将深入…

【mysql 进阶】2-1. MySQL 服务器介绍

MySQL 服务器简介 通常所说的 MySQL 服务器指的是mysqld程序&#xff0c;当运⾏mysqld后对外提供MySQL 服务&#xff0c;这个专题的内容涵盖了以下关于MySQL 服务器以及相关配置的内容&#xff0c;包括&#xff1a; 服务器⽀持的启动选项。可以在命令⾏和配置⽂件中指定这些选…

异次元v4.0

萌次元商城系统基于异次元店铺系统3.0 全新重构&#xff0c;历时两年精心打磨&#xff0c;初心不改。我们采用纯原生PHP打造了一款极具潜力的个人创业型商城系统。数据库底层经过对hyperf/database 的深度优化&#xff0c;感谢hyperf开发团队提供的强大ORM组件。模版渲染引擎采…

嵌入式C语言字符串具体实现

大家好,今天主要给大家分享一下,如何使用C语言进行字符串操作与实现。 第一:字符串相关操作实现 复制函数五个基本要素: 头文件:#include <string.h> 函数原型:strcpy(char dest[],char src[]) -----string copy 功能:把src数组中\0之前的所有字符,连同‘\…

在xml 中 不等式 做转义处理的问题

对于这种要做转义处理&#xff0c;<![CDATA[ < ]]>

DevEco Studio的使用 习题答案<HarmonyOS第一课>

一、判断题 1. 如果代码中涉及到一些网络、数据库、传感器等功能的开发,均可使用预览器进行预览。 正确(True)错误(False) 错误(False)回答正确 2. module.json5文件中的deviceTypes字段中,配置了phone,tablet,2in1等多种设备类型,才能进行多设备预览。 正确(True)…