【TensorFlow深度学习】加载经典数据集MNIST的实战步骤

加载经典数据集MNIST的实战步骤

      • 1. 数据集概览
      • 2. 自动加载MNIST数据集
      • 3. 数据预处理
      • 4. 转换为TensorFlow Dataset对象
      • 5. 数据集的随机打散与批量处理
      • 6. 数据预处理函数的应用
      • 结语

在深度学习的实践中,加载经典数据集是入门及进阶学习不可或缺的一环。MNIST数据集作为图像识别领域的“Hello World”,因其简单、直观且结构化的特点,成为了许多初学者学习深度学习算法的首选数据集。本文将以TensorFlow 2.0环境为背景,详细介绍加载MNIST数据集的实战步骤,包括数据集的自动下载、数据预处理、转换为TensorFlow Dataset对象以及数据的批量处理和随机打散等关键环节。

1. 数据集概览

MNIST数据集包含60,000个训练样本和10,000个测试样本,每个样本是一张28x28像素的手写数字图片,共有10个类别(0-9)。这些图片以灰度形式存储,像素值范围从0到255。数据集还附带了对应的标签,用来指示每个图片代表的数字。

2. 自动加载MNIST数据集

TensorFlow通过Keras API提供了加载MNIST数据集的简便方法。以下代码展示了如何自动下载和加载MNIST数据集:

import tensorflow as tf
from tensorflow.keras import datasets(x_train, y_train), (x_test, y_test) = datasets.mnist.load_data()

这段代码首先导入必要的库,然后调用mnist.load_data()函数,该函数会自动检查本地是否存在数据集,如果不存在,则从远程服务器下载并解压到.keras/datasets目录下。数据集加载后,会返回两个元组,分别对应训练集和测试集,其中x_trainx_test为图像数据,y_trainy_test为对应的标签。

3. 数据预处理

原始数据通常需要经过预处理才能输入到神经网络中。对于MNIST数据集,预处理主要包括归一化和数据形状调整。

x_train, x_test = x_train / 255.0, x_test / 255.0

这段代码将图像数据的像素值归一化到[0,1]区间,这对于神经网络的训练是非常有益的,因为它可以提高训练速度并减少过拟合的风险。

4. 转换为TensorFlow Dataset对象

为了充分利用TensorFlow的高效数据处理能力,我们需要将数据转换为tf.data.Dataset对象。这不仅便于实现多线程读取、数据随机化等操作,还能与TensorFlow的训练流程无缝对接。

train_db = tf.data.Dataset.from_tensor_slices((x_train, y_train))
test_db = tf.data.Dataset.from_tensor_slices((x_test, y_test))

5. 数据集的随机打散与批量处理

在训练神经网络时,为了避免模型因为数据的顺序性而产生过拟合,通常会对训练数据进行随机打散处理。同时,为了高效利用GPU,我们会采用批量(batch)训练的方式。

BUFFER_SIZE = 10000
BATCH_SIZE = 128train_db = train_db.shuffle(BUFFER_SIZE).batch(BATCH_SIZE)
test_db = test_db.batch(BATCH_SIZE)

这里,shuffle(BUFFER_SIZE)用于随机打乱数据顺序,batch(BATCH_SIZE)则将数据分组,每组包含BATCH_SIZE个样本。

6. 数据预处理函数的应用

对于更复杂的预处理需求,比如对图像进行额外的处理或对标签进行one-hot编码,可以定义自定义的预处理函数并通过map方法应用到数据集中。

def preprocess(image, label):image = tf.cast(image, tf.float32) / 255.0image = tf.reshape(image, [-1, 28*28])label = tf.one_hot(label, depth=10)return image, labeltrain_db = train_db.map(preprocess).batch(BATCH_SIZE)
test_db = test_db.map(preprocess).batch(BATCH_SIZE)

这段代码中,preprocess函数实现了图像的归一化、形状调整以及标签的one-hot编码。通过map函数应用到数据集上,确保每个样本在训练前都经过了统一的预处理。

结语

通过上述步骤,成功地加载了MNIST数据集,进行了必要的数据预处理,并将其转换为适合深度学习训练的tf.data.Dataset对象。这些准备工作为后续的模型搭建和训练奠定了坚实的基础。实践证明,良好的数据准备是深度学习项目成功的关键。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/7626.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Springboot集成feign远程调用

需求&#xff1a;在leadnews-wemedia微服务里需要调用leadnews-article微服务的接口。新建一个支持feign调用的名为heima-leadnews-feign-api的模块 heima-leadnews-feign-api的pom文件里导入openfeign依赖 <dependency><groupId>org.springframework.cloud</g…

echarts学习笔记:柱状图+雷达图+双环形图+地图可视化+数据传递关系图+关键词条图+数据总览图+AntV/G2/DataV

GitHub - lgd8981289/imooc-visualization: https://www.bilibili.com/video/BV1yu411E7cm/?vd_source391a8dc379e0da60c77490e3221f097a 课程源码 国内echarts镜像站&#xff1a;ISQQW.COM x ECharts 文档&#xff08;国内同步镜像&#xff09; - 配置项 echarts图表集&…

openGauss学习笔记-277 openGauss性能调优-实际调优案例06-改写SQL消除子查询(案例1)

文章目录 openGauss学习笔记-277 openGauss性能调优-实际调优案例06-改写SQL消除子查询(案例1)277.1 现象描述277.2 优化说明openGauss学习笔记-277 openGauss性能调优-实际调优案例06-改写SQL消除子查询(案例1) 277.1 现象描述 select 1,(select count(*) from normal_d…

618挑选家用洗地机,需要注意哪些事项?有哪些家用洗地机值得买?

近年来&#xff0c;智能清洁家电越来越受到消费者的欢迎&#xff0c;洗地机作为清洁家电的新宠&#xff0c;凭借其集扫地、拖地、杀菌清洗于一体的强大功能&#xff0c;成为市场上的热销产品。那么&#xff0c;这类洗地机真的好用吗&#xff1f;怎么挑选到好用的家用的洗地机呢…

Java基础学习:Dozer映射框架

文章目录 一、Dozer 介绍二、Dozer的API映射方式三、使用1、java程序2、springboot项目&#xff08;1&#xff09;引入依赖&#xff08;2&#xff09;声明工具类&#xff08;3&#xff09;工具类委托spring管理 一、Dozer 介绍 Dozer是一个Java工具&#xff0c;主要用于在相同…

win10下,svn上传.so文件失败

问题&#xff1a;win10下使用TortoiseSVN&#xff0c;svn上传.so文件失败 解决&#xff1a;右键&#xff0c;选择Settings&#xff0c;Global ignore pattern中删除*.so&#xff0c;保存即可。

设置多用户远程登录windows server服务器

##设置多用户远程登录windows server服务器 ###1、远程登录windows server 2016 运行—>mstsc—>远程IP地址—>用户和密码 2、远程windows服务器设置多用户策略 运行—>gpedit.msc->计算机配置—管理模板—windows组件—远程桌面服务—远程桌面会话主机----连…

Unity调用智谱API(简单操作 文本实时翻译)

代码展示&#xff1a; using Newtonsoft.Json; using System; using System.Collections; using System.Collections.Generic; using UnityEngine; using UnityEngine.Networking; using UnityEngine.UI;public class ZhiPuAi : MonoBehaviour {// API的端点URLpublic string…

linux复习

与"区别 在Linux中&#xff0c;单引号&#xff08;&#xff09;和双引号&#xff08;"&#xff09;用于定义字符串&#xff0c;但它们在处理变量扩展和转义字符时有所不同。以下是具体分析&#xff1a; 1. **变量扩展**&#xff1a;在双引号内&#xff0c;变量可以…

阿里巴巴1688商品详情API返回值深度剖析:精准获取商品信息的关键

在电子商务日益繁荣的今天&#xff0c;阿里巴巴1688作为中国领先的B2B平台&#xff0c;汇聚了海量的供应商和商品信息。对于商家、开发者以及希望深入了解商品数据的用户来说&#xff0c;如何通过有效的方式获取这些商品信息成为了一个重要议题。阿里巴巴1688商品详情API的出现…

Semi-decentralized Federated Ego Graph Learning for Recommendation

论文概况 本文是2023年WWW的一篇联邦推荐论文&#xff0c;提出了一个半去中心化的联合自我图学习框架。 Introduction 作者提出问题 现有的推荐方法收集所有用户的自我图来组成一个全局图&#xff0c;导致隐私风险。联合推荐系统已被提出来缓解隐私问题&#xff0c;但在客户…

zabbix监控方式(zabbix-trapper)

中文&#xff1a;zabbix采集器&#xff0c;即zabbix sender 。 Zabbix-Trapper 监控方式可以一次批量发送数据给Zabbix Server&#xff0c;与主动模式不同&#xff0c;Zabbix-Trapper 可以让用户控制数据的发送&#xff0c;而不用Zabbix-Agent进程控制&#xff0c;这意味着可以…

PE文件(四)FileBuffer-ImageBuffer

文件执行的总过程 当文件从硬盘中读入虚拟内存&#xff08;FileBuffer&#xff09;中时&#xff0c;文件数据会被原封不动的复制一份到虚拟内存中&#xff0c;然后进行拉伸对齐。此时虚拟内存中文件数据叫做文件印象或者内存印象&#xff0c;即ImageBuffer。此时ImageBuffer中…

42.乐理基础-拍号-看懂拍号的意义

到这必然是已经知道 X、Y的意思了&#xff1a; 然后带入数字&#xff1a; 然后念拍号的时候&#xff0c;在国内&#xff0c;百分之九十的地方是从下往上念&#xff0c;念作四二拍&#xff0c;还有百分之十的地方是和国外一样&#xff0c;从上往下念&#xff0c;念作二四拍&…

使用vant组件库

官方文档&#xff1a;Vant 4 - A lightweight, customizable Vue UI library for mobile web apps. vue2对应vant2&#xff0c;vue3对应vant3/vant4 1.安装 官网的快速上手里都有介绍。 # Vue 3 项目&#xff0c;安装最新版 Vant&#xff1a; npm i vant -S# Vue 2 项目&am…

跨境支付行业研究

1. 行业基本情况 随着全球人均购买力增强、互联网普及率提升、支付渠道的进一步成熟、物流等配套设施的完善&#xff0c;网络购物已经成为全球兴起的消费习惯。另一方面&#xff0c;跨境电商对传统贸易的替代已经成为趋势。跨境电商在交易成本和便利程度上都有明显的优势 图1 …

【问题记录】ORA-31603 对象 ““ 属于类型 , 在方案 ““ 中未找到,存储过程procedure执行报错

文章目录 问题&#xff1a;解决方法 问题&#xff1a; ORA-31603: 对象 “V_RST_UTC01390” 属于类型 VIEW, 在方案 “RISKCONFIG_BAK” 中未找到 ORA-06512: 在 “SYS.DBMS_METADATA”, line 5805 ORA-06512: 在 “SYS.DBMS_METADATA”, line 8344 ORA-06512: 在 line 1&…

大数据API技术分享:使用API接口采集淘宝数据(商品详情丨关键词搜索丨店铺所有商品)

使用API接口采集淘宝数据&#xff08;商品详情、关键词搜索、店铺所有商品&#xff09;是大数据领域常见的应用场景。以下是一些关于如何使用API接口进行这些操作的技术分享&#xff1a; 1. 获取API权限 首先&#xff0c;你需要在淘宝开放平台注册成为开发者&#xff0c;并创建…

想做视频号小店,为何不建议开通个体店?开店步骤+做店思路如下

我是王路飞。 如果你想在视频号开通店铺的话&#xff0c;那么一定不要使用个体执照开通个体店&#xff1f; 这是为什么呢&#xff1f; 原因很简单&#xff0c;视频号个体店是无法入驻优选联盟的&#xff0c;只能企业店可以入驻。 因为现阶段视频号小店的自然流量很少&#…

五一 作业

#include <iostream>using namespace std; class Num { private:int a; public:Num() {}Num(int a):a(a){}//设置a的值void set(int a){this->aa;}//1-a的和void Sum(){if(a<1){cout<<"a<1"<<endl;return;}int sum0;for(int i1;i<a;i)…