【深度学习与神经网络】MNIST手写数字识别1

简单的全连接层

导入相应库

import torch
import numpy as np
from torch import nn,optim
from torch.autograd import Variable
import matplotlib.pyplot as plt
from torchvision import datasets, transforms
from torch.utils.data import DataLoader

读入数据并转为tensor向量

# 训练集
# 转为tensor数据
train_dataset = datasets.MNIST(root='./',train=True, transform = transforms.ToTensor(), download=True)
test_dataset = datasets.MNIST(root='./',train=False, transform = transforms.ToTensor(), download=True)

装载数据集

# 批次大小
batch_size = 64# 装载训练集
train_loader = DataLoader(dataset = train_dataset, batch_size=batch_size, shuffle = True)
test_loader = DataLoader(dataset = test_dataset, batch_size=batch_size, shuffle = True)

定义网络结构
一层全连接网络，最后使用softmax转概率值输出

# 定义网络结构
class Net(nn.Module):def __init__(self):super(Net, self).__init__()self.fc1 = nn.Linear(784, 10)self.softmax = nn.Softmax(dim =1)def forward(self, x):# [64,1,28,28] ——> [64, 784]x = x.view(x.size()[0], -1)x = self.fc1(x)x = self.softmax(x)return x

定义模型
使用均方误差损失函数，梯度下降优化

# 定义模型
model = Net()
mes_loss = nn.MSELoss()
optimizer = optim.SGD(model.parameters(),0.5)

训练并测试网络：
训练时注意最后输出(64,10)
标签是(64) ，需要将其转为one-hot编码(64,10)

def train():for i,data in enumerate(train_loader):# 获得一个批次的数据和标签inputs, labels = data# 获得模型结果 (64,10)out = model(inputs)# to one-hot 把数据标签变为独热编码labels = labels.reshape(-1,1)one_hot = torch.zeros(inputs.shape[0],10).scatter(1, labels, 1)# 计算lossloss = mes_loss(out, one_hot)# 梯度清0optimizer.zero_grad()# 计算梯度loss.backward()# 修改权值optimizer.step()def test():correct = 0for i,data in enumerate(test_loader):# 获得一个批次的数据和标签inputs, labels = data# 获得模型结果 (64,10)out = model(inputs)# 获取最大值和最大值所在位置_,predicted = torch.max(out,1)# 预测正确数量correct += (predicted == labels).sum()print("test ac:{0}".format(correct.item()/len(test_dataset)))

调用模型训练10次

# 使用mse损失函数 
for epoch in range(10):print("epoch:",epoch)train()test()

训练结果：
在这里插入图片描述
准确率不够

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/757337.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

【深度学习与神经网络】MNIST手写数字识别1

简单的全连接层

相关文章

mysql主从及备份

C++: 多态实现原理解析

Android 开机启动的核心系统服务：你了解了吗？

[Python人工智能] 四十三.命名实体识别 (4)利用bert4keras构建Bert+BiLSTM-CRF实体识别模型

vue2 实战：模板模式与渲染模式代码互切

KMM初探

AI大模型智能大气科学探索之：ChatGPT在大气科学领域建模、数据分析、可视化与资源评估中的高效应用及论文写作

Http的缓存有哪些

Java 学习和实践笔记（41）：API 文档以及String类的常用方法

docker入门（一）—— docker概述

C语言经典面试题目（十六）

FSP40罗德与施瓦茨FSP40频谱分析仪

数据仓库系列总结

在Qt中使用线程类QThread

深度学习基础之《TensorFlow框架（7）—变量》

Springboot+vue的仓库管理系统（有报告）。Javaee项目，springboot vue前后端分离项目。

Leetcode 62. 不同路径

秒级生图，大模型 SDXL-turbo、LCM-SDXL 实战案例来了

Go 1.22 - 更加强大的 Go 执行跟踪

c++11 标准模板（STL）本地化库 - std::iscntrl(std::locale) 检查字符是否被本地环境分类为控制字符