numpy方法读取加载mnist数据集

方法来自机器之心公众号

首先下载mnist数据集,并将里面四个文件夹解压出来,下载方法见前面的博客

import tensorflow as tf
import numpy as np
import osdataset_path = r'D:\PycharmProjects\tensorflow\MNIST_data' # 这是我存放mnist数据集的位置
is_training = True# 定义加载mnist的函数
def load_mnist(path, is_training):# trX将加载储存所有60000张灰度图fd = open(os.path.join(path, 'train-images.idx3-ubyte'))loaded = np.fromfile(file=fd, dtype=np.uint8)trX = loaded[16:].reshape((60000, 28, 28, 1)).astype(np.float)fd = open(os.path.join(path, 'train-labels.idx1-ubyte'))loaded = np.fromfile(file=fd, dtype=np.uint8)trY = loaded[8:].reshape((60000)).astype(np.float)#teX将储存所有一万张测试用的图片fd = open(os.path.join(path, 't10k-images.idx3-ubyte'))loaded = np.fromfile(file=fd, dtype=np.uint8)teX = loaded[16:].reshape((10000, 28, 28, 1)).astype(np.float)fd = open(os.path.join(path, 't10k-labels.idx1-ubyte'))loaded = np.fromfile(file=fd, dtype=np.uint8)teY = loaded[8:].reshape((10000)).astype(np.float)# 将所有训练图片表示为一个4维张量 [60000, 28, 28, 1],其中每个像素值缩放到0和1之间trX = tf.convert_to_tensor(trX / 255., tf.float32)# one hot编码为 [num_samples, 10]trY = tf.one_hot(trY, depth=10, axis=1, dtype=tf.float32)teY = tf.one_hot(teY, depth=10, axis=1, dtype=tf.float32)# 训练和测试时返回不同的数据if is_training:return trX, trYelse:return teX / 255., teYdef get_batch_data():trX, trY = load_mnist(dataset_path, True)# 每次产生一个切片,每次从一个tensor列表中按顺序或者随机抽取出一个tensor放入文件名队列data_queues = tf.train.slice_input_producer([trX, trY])# 对队列中的样本进行乱序处理X, Y = tf.train.shuffle_batch(data_queues,batch_size=batch_size,capacity=batch_size * 64,min_after_dequeue=batch_size * 32,allow_smaller_final_batch=False)return (X, Y)

这里为什么要去掉训练集的前16个数字和标签的前8个数字呢?我看了一下,训练集train-images.idx3-ubyte文件确实有47040016个数字,比28*28*60000=47040000多了16个数字,训练集标签train-labels.idx1-ubyte文件下有60008个数字,也多出来8个数字,下面是mnist训练集的样本和标签的数据结构:

 

可以看出在train-images.idx3-ubyte中,第一个数为32位的整数(魔数,图片类型的数),第二个数为32位的整数(图片的个数),第三和第四个也是32为的整数(分别代表图片的行数和列数),接下来的都是一个字节的无符号数(即像素,值域为0~255) 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/491705.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

纳米线传感器来了,传感芯片还会远吗

来源:科学网“无旁路电路”纳米线桥接生长方案 黄辉供图微型气体检测仪 黄辉供图人工智能、可穿戴装备、物联网等信息技术迅猛发展,需要海量的传感器提供支持,大数据和云计算等业务也需要各种传感器实时采集数据来支撑。但目前的传感器存在国…

PyTorch框架学习七——自定义transforms方法

PyTorch框架学习七——自定义transforms方法一、自定义transforms注意要素二、自定义transforms步骤三、自定义transforms实例:椒盐噪声虽然前面的笔记介绍了很多PyTorch给出的transforms方法,也非常有用,但是也有可能在具体的问题中需要开发…

Fashion-MNIST下载地址

训练集的图像:60000,http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-images-idx3-ubyte.gz 训练集的类别标签:60000,http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-labels-idx1-ubyte.…

dfs算法

一般bfs算法都是使用递归 //下面简单的代码 visited[Max]; dfs(_graph g,int vo){ print(vo); visited[vo]1 for(int i0;i<Max;i){ if(visited[i]0){ dfs(g,i); } } }转载于:https://www.cnblogs.com/dick159/p/4900935.html

美国芯片简史:军方大力扶持下的产物 但一度被日 韩超越

来源&#xff1a;知乎专栏腾讯科技近日发起系列策划&#xff0c;聚焦各个芯片大国的发展历程。第四期&#xff1a;《美国芯片简史》。集成电路是电子信息产业的的基石&#xff0c;电子信息产业对国民经济与社会发展具有重大推动作用。从全球集成电路产业发展历程来看&#xff0…

PyTorch框架学习八——PyTorch数据读取机制(简述)

PyTorch框架学习八——PyTorch数据读取机制&#xff08;简述&#xff09;一、数据二、DataLoader与Dataset1.torch.utils.data.DataLoader2.torch.utils.data.Dataset三、数据读取整体流程琢磨了一段时间&#xff0c;终于对PyTorch的数据读取机制有了一点理解&#xff0c;并自己…

使用feed_dict不一定要用占位符

使用feed_dict一般会伴有占位符&#xff0c;如 x tf.placeholder(tf.float32) 但是没有tf.placeholder也可以使用feed_dict方法&#xff0c;如下面这个例子&#xff1a; import tensorflow as tfinput1 tf.constant([2], dtypetf.float32) input2 tf.constant([3], dtype…

报告 | 2019年全球数字化转型现状研究报告

来源&#xff1a;Prophet2019年&#xff0c;战略数字化转型的重要性已经不止于IT领域&#xff0c;而影响着全公司的竞争力。企业的相关预算直线攀升&#xff0c;利益相关方所关注的颠覆性技术数量急剧增加。数字化项目开始由首席高管主导&#xff0c;并由相互协作的跨职能团队管…

Android调用binder实现权限提升-android学习之旅(81)

当进程A权限较低&#xff0c;而B权限较高时&#xff0c;容易产生提权漏洞 fuzz测试的测试路径 First level Interface是服务 Second level Interface是服务中对应的接口 1.首先获取第一层和第二层接口&#xff0c;及服务以及对应服务提供的接口 2.根据以上信息结合参数类型信息…

PyTorch框架学习九——网络模型的构建

PyTorch框架学习九——网络模型的构建一、概述二、nn.Module三、模型容器Container1.nn.Sequential2.nn.ModuleList3.nn.ModuleDict()4.总结笔记二到八主要介绍与数据有关的内容&#xff0c;这次笔记将开始介绍网络模型有关的内容&#xff0c;首先我们不追求网络内部各层的具体…

将张量转换为 int32 类型

tf.to_int32函数&#xff1a; tf.to_int32(x,nameToInt32 ) 函数参数&#xff1a; x&#xff1a;一个 Tensor 、SparseTensor、list或ndarrayname&#xff1a;操作的名称&#xff08;可选&#xff09;。 函数返回值&#xff1a; tf.to_int32函数返回一个 Tensor 或 SparseT…

中国17种稀土有啥军事用途?没它们,美军技术优势将归零

来源&#xff1a;陶慕剑观察 稀土就是化学元素周期表中镧系元素——镧(La)、铈(Ce)、镨(Pr)、钕(Nd)、钷(Pm)、钐(Sm)、铕(Eu)、钆(Gd)、铽(Tb)、镝(Dy)、钬(Ho)、铒(Er)、铥(Tm)、镱(Yb)、镥(Lu)&#xff0c;再加上钪(Sc)和钇(Y)共17种元素。中国稀土占据着众多的世界第一&…

swiper链接href无效

preventClicks:false,加上属性转载于:https://www.cnblogs.com/wesky/p/4906468.html

PyTorch框架学习十——基础网络层(卷积、转置卷积、池化、反池化、线性、激活函数)

PyTorch框架学习十——基础网络层&#xff08;卷积、转置卷积、池化、反池化、线性、激活函数&#xff09;一、卷积层二、转置卷积层三、池化层1.最大池化nn.MaxPool2d2.平均池化nn.AvgPool2d四、反池化层最大值反池化nn.MaxUnpool2d五、线性层六、激活函数层1.nn.Sigmoid2.nn.…

一个招标书文件的需求分析

时间&#xff1a;2015年10月20日 地点&#xff1a;二教302 人员&#xff1a;郑成&#xff0c;刘中睿&#xff0c;李琦 内容&#xff1a; 问题&#xff1a;找出民间组织管理系统的利益相关者 讨论过程&#xff1a;   出资人&#xff1a;民政厅&#xff0c;民管局 功能的使用者…

tensor也可以作为索引

在TensorFlow中&#xff0c;tensor也可以作为索引&#xff0c;但只能作为同样为tensor类型变量的索引&#xff0c;不能作为list类型变量的索引如下面的例子&#xff1a; import tensorflow as tfindex tf.to_int32([0,1,2]) # index是一个tensor a [[1,2,3], [4,5,6]] b a…

PyTorch框架学习十一——网络层权值初始化

PyTorch框架学习十一——网络层权值初始化一、均匀分布初始化二、正态分布初始化三、常数初始化四、Xavier 均匀分布初始化五、Xavier正态分布初始化六、kaiming均匀分布初始化前面的笔记介绍了网络模型的搭建&#xff0c;这次将介绍网络层权值的初始化&#xff0c;适当的初始化…

W3C 战败:无权再制定 HTML 和 DOM 标准!

来源&#xff1a;CSDN历史性时刻&#xff01;——近日&#xff0c;W3C正式宣告战败&#xff1a;HTML和DOM标准制定权将全权移交给浏览器厂商联盟WHATWG。由苹果、Google、微软和Mozilla四大浏览器厂商组成的WHATWG已经与万维网联盟&#xff08;World Wide Web Consortium&#…

java 快捷工具,如何清理不需要的引用

Ctrl shift O转载于:https://www.cnblogs.com/hcfan/p/4913410.html

tf.cast()类型转换函数

tf.cast(x, dtype, nameNone) 参数 x&#xff1a;输入dtype&#xff1a;转换目标类型name&#xff1a;名称 返回&#xff1a;Tensor 例子&#xff1a; import tensorflow as tfa [1,0,1,0] b [1,2,3,4] c [True, True, False] d tf.cast(a, dtypebool) e tf.cast(b, d…