【机器学习实战入门】使用Python进行MNIST手写数字识别

在这里插入图片描述

什么是手写数字识别?

手写数字识别是计算机识别手写数字的能力。这对手工制造的设备来说是一个难题,因为手写数字并不完美,且人们书写数字的方式多种多样。手写数字识别旨在解决这一问题,通过使用数字的图像来识别该图像中的数字。
在这里插入图片描述

Python 深度学习项目的介绍

python 混合学习项目 - 手写数字识别

在本文中,我们将使用 MNIST 数据集实现一个手写数字识别应用程序。我们将使用一种特殊的深度神经网络,即卷积神经网络(Convolutional Neural Networks)。最终,我们将构建一个图形用户界面(GUI),您可以在其中手绘数字,并立即进行识别。

前提条件

这个有趣的 Python 项目要求您具备基本的 Python 编程知识、使用 Keras 库进行深度学习的知识以及使用 Tkinter 库构建 GUI 的能力。

使用以下命令安装此项目所需的所有库:

pip install numpy, tensorflow, keras, pillow

MNIST 数据集

这可能是机器学习和深度学习爱好者中最为流行的数据集之一。MNIST 数据集包含 60,000 张用于训练的手写数字图像(从零到九)和 10,000 张用于测试的图像。因此,MNIST 数据集有 10 个不同的类别。手写数字图像以 28×28 的矩阵形式表示,其中每个单元格包含一个灰度像素值。

下载项目完整源代码

链接: 使用Python进行MNIST手写数字识别 源代码与数据集 Python-Project-Handwritten-digit-recognizer

构建 Python 深度学习项目进行手写数字识别

以下是实现手写数字识别项目的步骤:

  1. 导入库并加载数据集
    首先,我们将导入训练模型所需的所有模块。Keras 库已经包含了一些数据集,MNIST 就是其中之一。因此,我们可以轻松地导入数据集并开始使用它。mnist.load_data() 方法会返回给我们训练数据、其标签以及测试数据和其标签。
import keras
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense, Dropout, Flatten
from keras.layers import Conv2D, MaxPooling2D
from keras import backend as K
# 数据集,分为训练集和测试集
(x_train, y_train), (x_test, y_test) = mnist.load_data()
print(x_train.shape, y_train.shape)
  1. 预处理数据
    图像数据不能直接输入到模型中,因此我们需要执行一些操作以处理数据,使其准备好用于我们的神经网络。训练数据的维度为 (60000,28,28)。卷积神经网络(CNN)模型需要一个额外的维度,因此我们将矩阵重新调整为 (60000,28,28,1) 形状。
x_train = x_train.reshape(x_train.shape[0], 28, 28, 1)
x_test = x_test.reshape(x_test.shape[0], 28, 28, 1)
input_shape = (28, 28, 1)
# 将类别向量转换为二进制类别矩阵
y_train = keras.utils.to_categorical(y_train, num_classes)
y_test = keras.utils.to_categorical(y_test, num_classes)
x_train = x_train.astype('float32')
x_test = x_test.astype('float32')
x_train /= 255
x_test /= 255
print('x_train shape:', x_train.shape)
print(x_train.shape[0], 'training samples')
print(x_test.shape[0], 'test samples')
  1. 创建模型
    现在我们将在 Python 数据科学项目中创建我们的卷积神经网络(CNN)模型。CNN 模型通常包括卷积层和池化层,它更适合处理以网格结构表示的数据,这也是为什么 CNN 在图像分类任务中表现出色的原因。Dropout 层用于停用一些神经元,在训练过程中可以减少模型的过拟合。然后我们使用 Adadelta 优化器编译模型。
batch_size = 128
num_classes = 10
epochs = 10
model = Sequential()
model.add(Conv2D(32, kernel_size=(3, 3),activation='relu',input_shape=input_shape))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.25))
model.add(Flatten())
model.add(Dense(256, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(num_classes, activation='softmax'))
model.compile(loss=keras.losses.categorical_crossentropy,optimizer=keras.optimizers.Adadelta(),metrics=['accuracy'])
  1. 训练模型
    Keras 的 model.fit() 函数将开始训练模型。它需要训练数据、验证数据、训练轮数和批次大小作为参数。

模型训练需要一些时间。训练完成后,我们将权重和模型定义保存在 ‘mnist.h5’ 文件中。

hist = model.fit(x_train, y_train,batch_size=batch_size,epochs=epochs,verbose=1,validation_data=(x_test, y_test))
print("The model has successfully trained")
model.save('mnist.h5')
print("Saving the model as mnist.h5")
  1. 评估模型
    我们的数据集中有 10,000 张图像,这些图像将用于评估我们的模型表现如何。测试数据未参与数据的训练过程,因此对模型来说是新的数据。由于 MNIST 数据集非常平衡,我们模型的准确率可以达到约 99%。
score = model.evaluate(x_test, y_test, verbose=0)
print('Test loss:', score[0])
print('Test accuracy:', score[1])
  1. 创建 GUI 以预测数字
    为了构建 GUI,我们创建了一个新的文件,其中构建了一个交互窗口,用于在画布上绘制数字,并通过一个按钮识别数字。Tkinter 库包含在 Python 标准库中。我们创建了一个 predict_digit() 函数,该函数以图像作为输入,使用训练好的模型来预测数字。

然后我们创建了 App 类,该类负责构建我们应用程序的 GUI。我们创建了一个画布,可以在其中通过捕捉鼠标事件来绘制,通过一个按钮触发 predict_digit() 函数并显示结果。

以下是 gui_digit_recognizer.py 文件的完整代码:

from keras.models import load_model
from tkinter import *
import tkinter as tk
import win32gui
from PIL import ImageGrab, Image
import numpy as np
model = load_model('mnist.h5')
def predict_digit(img):# 将图像调整为 28x28 像素img = img.resize((28,28))# 将 RGB 转换为灰度img = img.convert('L')img = np.array(img)# 重新调整形状以支持模型输入并归一化img = img.reshape(1,28,28,1)img = img/255.0# 预测类别res = model.predict([img])[0]return np.argmax(res), max(res)
class App(tk.Tk):def __init__(self):tk.Tk.__init__(self)self.x = self.y = 0# 创建元素self.canvas = tk.Canvas(self, width=300, height=300, bg = "white", cursor="cross")self.label = tk.Label(self, text="Thinking..", font=("Helvetica", 48))self.classify_btn = tk.Button(self, text = "Recognise", command =         self.classify_handwriting) self.button_clear = tk.Button(self, text = "Clear", command = self.clear_all)# 网格结构self.canvas.grid(row=0, column=0, pady=2, sticky=W, )self.label.grid(row=0, column=1,pady=2, padx=2)self.classify_btn.grid(row=1, column=1, pady=2, padx=2)self.button_clear.grid(row=1, column=0, pady=2)# self.canvas.bind("<Motion>", self.start_pos)self.canvas.bind("<B1-Motion>", self.draw_lines)def clear_all(self):self.canvas.delete("all")def classify_handwriting(self):HWND = self.canvas.winfo_id() # 获取画布的句柄rect = win32gui.GetWindowRect(HWND) # 获取画布的坐标im = ImageGrab.grab(rect)digit, acc = predict_digit(im)self.label.configure(text= str(digit)+', '+ str(int(acc*100))+'%')def draw_lines(self, event):self.x = event.xself.y = event.yr=8self.canvas.create_oval(self.x-r, self.y-r, self.x + r, self.y + r, fill='black')
app = App()
mainloop()

界面截图:

在这里插入图片描述

  • python 机器学习项目输出数字 2
    在这里插入图片描述

  • python 机器学习项目输出数字 5

在这里插入图片描述

  • python 项目输出数字 6

总结

在本文中,我们成功构建了一个 Python 深度学习项目,实现了手写数字识别应用。我们构建并训练了一个卷积神经网络模型,该模型在图像分类任务中非常有效。随后,我们构建了一个图形用户界面(GUI),可以在其中绘制数字,然后分类数字并显示结果。

参考资料

资料名称链接
Keras 官方文档https://keras.io/
TensorFlow 深度学习教程https://tensorflow.google.cn/
MNIST 数据集官网http://yann.lecun.com/exdb/mnist/
Python Tkinter 教程https://docs.python.org/3/library/tkinter.html
手写数字识别综述https://zhuanlan.zhihu.com/p/35863468
深度学习入门https://www.deeplearning-book.org/
Convolutional Neural Networks (CNN) 简介https://www.cnblogs.com/zyg123/p/8561567.html
Python 图像处理库 Pillow 介绍https://pillow.readthedocs.io/en/stable/
手写数字识别系统实现http://www.cs.ubc.ca/~_written/yangzhang981/courses/532/2016/Handwriting-Recognition.pdf
深度学习框架 Keras 指南https://www.programcreek.com/python/example/54362/keras.models.Sequential
手写数字识别数据预处理https://www.datacamp.com/community/tutorials/mnist-python
Windows GUI 编程教程https://msdn.microsoft.com/zh-cn/library/windows/desktop/ms632586.aspx
手写数字识别实际应用https://ieeexplore.ieee.org/document/8235104
卷积神经网络改进技巧https://towardsdatascience.com/a-keras-pipeline-for-image-classification-4a28f728750a
手写数字识别性能分析https://arxiv.org/abs/1707.09725
MNIST 数据集使用指南https://www.kaggle.com/c/digit-recognizer/data

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/892999.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

hive连接mysql报错:Unknown version specified for initialization: 3.1.0

分享下一些报错的可能原因吧 1.要开启hadoop 命令&#xff1a;start-all.sh 2.检查 hive-site.xml 和 hive-env.sh。 hive-site.xml中应设置自己mysql的用户名和密码 我的hive-site.xml如下&#xff1a; <configuration><property><name>javax.jdo.opt…

反转字符串中的单词 II:Swift 实现与详解

网罗开发 &#xff08;小红书、快手、视频号同名&#xff09; 大家好&#xff0c;我是 展菲&#xff0c;目前在上市企业从事人工智能项目研发管理工作&#xff0c;平时热衷于分享各种编程领域的软硬技能知识以及前沿技术&#xff0c;包括iOS、前端、Harmony OS、Java、Python等…

51c大模型~合集106

我自己的原文哦~ https://blog.51cto.com/whaosoft/13115290 #GPT-5、 Opus 3.5为何迟迟不发 新猜想&#xff1a;已诞生&#xff0c;被蒸馏成小模型来卖 「从现在开始&#xff0c;基础模型可能在后台运行&#xff0c;让其他模型能够完成它们自己无法完成的壮举——就像一个老…

机器学习(2):线性回归Python实现

1 概念回顾 1.1 模型假设 线性回归模型假设因变量y yy与自变量x xx之间的关系可以用以下线性方程表示&#xff1a; y β 0 β 1 ⋅ X 1 β 2 ⋅ X 2 … β n ⋅ X n ε y 是因变量 (待预测值)&#xff1b;X1, X2, ... Xn 是自变量&#xff08;特征&#xff09;β0, β1,…

AUTOSAR通信篇 - PDU和收发数据

点击订阅专栏不迷路 文章目录 一、概述二、OSI模型与AUTOSAR层级关系三、I-PDU、N-PDU、L-PDU及其关系3.1. L-PDU3.2. N-PDU3.3. I-PDU 四、数据流4.1. 普通数据流4.2. 诊断数据流4.3. 动态PDU数据流4.4. 安全通信数据流4.5. XCP数据流 返回总目录 一、概述 在学习Autosar通信…

《自动驾驶与机器人中的SLAM技术》ch4:预积分学

目录 1 预积分的定义 2 预积分的测量模型 ( 预积分的测量值可由 IMU 的测量值积分得到 ) 2.1 旋转部分 2.2 速度部分 2.3 平移部分 2.4 将预积分测量和误差式代回最初的定义式 3 预积分的噪声模型和协方差矩阵 3.1 旋转部分 3.2 速度部分 3.3 平移部分 3.4 噪声项合并 4 零偏的…

2025年01月蓝桥杯Scratch1月stema选拔赛真题—美丽的图形

美丽的图形 编程实现美丽的图形具体要求: 1)点击绿旗&#xff0c;角色在舞台中心&#xff0c;如图所示&#xff1b; 2)1秒后&#xff0c;绘制一个边长为 140的红色大正方形&#xff0c;线条粗细为 3&#xff0c;正方形的中心为舞台中心&#xff0c;如图所示; 完整题目可点击下…

58,【8】BUUCTF [PwnThyBytes 2019]Baby_SQL1

进入靶场 和2次注入的页面很像 不过养成查看源代码的好习惯 先访问source.zip 下载后解压&#xff0c;发现两个文件 第一个文件夹打开又有4个PHP文件 那还是先看index.php文件好了 有PHP和HTML两部分&#xff0c;下面是PHP部分代码&#xff08;HTML太长了&#xff0c;先放一…

AI编程工具横向评测--Cloudstudio塑造完全态的jupyter notebook助力数据分析应用开发

AI编程工具横向评测–Cloudstudio塑造完全态的jupyter notebook助力数据分析应用开发 数据分析类应用的开发&#xff0c;指的是首先进行数据分析&#xff0c;比如统计学分析、机器学习模型的构建等&#xff0c;然后将分析的流程开发成数据分析类的工具&#xff0c;或者将数据分…

医疗集群系统中基于超融合数据库架构的应用与前景探析

一、引言 1.1 研究背景与意义 随着医疗信息化的飞速发展,医疗数据呈爆炸式增长。从日常诊疗记录、患者病历,到各类医疗影像、检查检验数据等,海量信息不断涌现。据统计,医疗数据的年增长率高达 30% 以上 ,2025 年,全球医疗数据量将达到 2314 艾字节(EB)。如此庞大的数…

vue项目引入阿里云svg资源图标

1&#xff1a;生成svg图标 登录阿里云官网 1.1 创建项目组 1.2 从阿里云网站上面获取喜欢的图标加入到已有的项目组 1.3 如果团队有自己的设计师&#xff0c;也可以让设计师上传自己的svg图标到阿里云指定的项目组&#xff1b; 使用的时候&#xff0c;把 资源包下载到本地项…

网络安全面试题汇总(个人经验)

1.谈一下SQL主从备份原理&#xff1f; 答&#xff1a;主将数据变更写入自己的二进制log,从主动去主那里去拉二进制log并写入自己的二进制log,从而自己数据库依据二进制log内容做相应变更。主写从读 2.linux系统中的计划任务crontab配置文件中的五个星星分别代表什么&#xff…

Elasticsearch:Jira 连接器教程第二部分 - 6 个优化技巧

作者&#xff1a;来自 Elastic Gustavo Llermaly 将 Jira 连接到 Elasticsearch 后&#xff0c;我们现在将回顾最佳实践以升级此部署。 在本系列的第一部分中&#xff0c;我们配置了 Jira 连接器并将对象索引到 Elasticsearch 中。在第二部分中&#xff0c;我们将回顾一些最佳实…

5 分钟复刻你的声音,一键实现 GPT-Sovits 模型部署

想象一下&#xff0c;只需简单几步操作&#xff0c;就能生成逼真的语音效果&#xff0c;无论是为客户服务还是为游戏角色配音&#xff0c;都能轻松实现。GPT-Sovits 模型&#xff0c;其高效的语音生成能力为实现自然、流畅的语音交互提供了强有力的技术支持。本文将详细介绍如何…

【CSS】---- CSS 实现超过固定高度后出现展开折叠按钮

1. 实现效果 2. 实现方法 使用 JS 获取盒子的高度&#xff0c;来添加对应的按钮和样式&#xff1b;使用 CSS 的浮动效果&#xff0c;参考CSS 实现超过固定高度后出现展开折叠按钮&#xff1b;使用容器查询 – container 语法&#xff1b;使用 clamp 函数进行样式判断。 3. 优…

【git】如何删除本地分支和远程分支?

1.如何在 Git 中删除本地分支 本地分支是您本地机器上的分支&#xff0c;不会影响任何远程分支。 &#xff08;1&#xff09;在 Git 中删除本地分支 git branch -d local_branch_name git branch 是在本地删除分支的命令。-d是一个标志&#xff0c;是命令的一个选项&#x…

基于微信小程序的摄影竞赛系统设计与实现(LW+源码+讲解)

专注于大学生项目实战开发,讲解,毕业答疑辅导&#xff0c;欢迎高校老师/同行前辈交流合作✌。 技术范围&#xff1a;SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容&#xff1a;…

人工智能-机器学习之多分类分析(项目实战二-鸢尾花的多分类分析)

Softmax回归听名字&#xff0c;依然好像是做回归任务的算法&#xff0c;但其实它是去做多分类任务的算法。 篮球比赛胜负是二分类&#xff0c;足球比赛胜平负就是多分类 识别手写数字0和1是二分类&#xff0c;识别手写数字0-9就是多分类 Softmax回归算法是一种用于多分类问题…

DeepSeek-v3在训练和推理方面的优化

1. 基础架构&#xff1a;MLA&#xff0c;大幅减少了KV cache大小。&#xff08;计算量能不能减少&#xff1f;&#xff09; 2. 基础架构&#xff1a;MoE&#xff0c;同等参数量&#xff08;模型的”能力“&#xff09;下&#xff0c;训练、推理的计算量大幅减少。 3. MoE的load…

MySQL8数据库全攻略:版本特性、下载、安装、卸载与管理工具详解

大家好&#xff0c;我是袁庭新。 MySQL作为企业项目中的主流数据库&#xff0c;其5.x和8.x版本尤为常用。本文将详细介绍MySQL 8.x的特性、下载、安装、服务管理、卸载及管理工具&#xff0c;旨在帮助用户更好地掌握和使用MySQL数据库。 1.MySQL版本及下载 企业项目中使用的…