(菜鸟入门)使用pytorch框架实现前馈神经网络

前馈神经网络

常见的前馈神经网络有感知机(Perceptrons)、BP(Back Propagation)网络等。前馈神经网络(FNN)是人工智能领域中最早发明的简单人工神经网络类型。各神经元分层排列。每个神经元只与前一层的神经元相连。接收前一层的输出,并输出给下一层.各层间没有反馈。在它内部,参数从输入层经过隐含层向输出层单向传播。与递归神经网络不同,在它内部不会构成有向环。下图为一个简单前馈神经网络示意图:

在这里插入图片描述
整个网络中无反馈,信号从输入层向输出层单向传播,可用一个有向无环图表示

感知器

感知器实际上是神经网络结构中的一个神经元,那么一个感知器就构成了最简单的神经网络。
感知器是前向结构的人工神经网络,可以被看作是一个有向图,由多个的节点层所组成,每一层都全连接到下一层。除了输入节点,每个节点都是一个带有非线性激活函数的神经元(或称处理单元)

实现前馈神经网络

之前的blog已经说过如何搭建windows系统的pytorch-gpu环境,我们使用pytorch来实现第一个前馈神经网络:
源代码:
源码中我作了详细的注释,供参考

import torch
import torch.nn as nn
import torchvision.datasets as dsets #torchvision为一个做图形处理的库,加载数据集
import torchvision.transforms as transforms'''
torchvision.datasets这个包中包含MNIST、FakeData、COCO、LSUN、ImageFolder、DatasetFolder、ImageNet、CIFAR等一些常用的数据集,并且提供了数据集设置的一些重要参数设置,可以通过简单数据集设置来进行数据集的调用。从这些数据集中我们也可以看出数据集设置的主要变量有哪些并且有什么功能对将来自己数据集的设置也有极大的帮助。
以上数据集的接口基本上很相近。它们至少包括两个公共的参数transform和target_transform,以便分别对输入和和目标做变换
'''
from torch.autograd import Variable
#torch.autograd提供了类和函数用来对任意标量函数进行求导。
import torch.utils.data as Data
#我们需要使用torch.utils.data.DataLoader加载数据
import matplotlib.pyplot as plt
#画图所需的库# Hyper Parameters 超参数(hyperparameters)/算法参数 根据经验进行设定,影响到权重和偏置的大小,比如迭代次数、隐藏层的层数、每层神经元的个数、学习速率等
input_size = 784
hidden_size = 500
num_classes = 10
num_epochs = 5
batch_size = 100
learning_rate = 0.001# MNIST Dataset 数据集
train_dataset = dsets.MNIST(root='./data', #指定数据集的目录train=True, transform=transforms.ToTensor(),  
# transforms.ToTensor() 将numpy的ndarray或PIL.Image读的图片转换成形状为(C,H, W)的Tensor格式,且/255归一化到[0,1.0]之间download=True)test_dataset = dsets.MNIST(root='./data', train=False, transform=transforms.ToTensor())# Data Loader (Input Pipeline)
train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True)test_loader = torch.utils.data.DataLoader(dataset=test_dataset, batch_size=batch_size, shuffle=False)
'''
dataset:加载数据的数据集
batch_size:加载批训练的数据个数
shuffle:在每个Epoch中打乱数据
'''
test_y=test_dataset.test_labels# Neural Network Model (1 hidden layer)
class Net(nn.Module):#初始化网络结构def __init__(self, input_size, hidden_size, num_classes):super(Net, self).__init__()self.fc1 = nn.Linear(input_size, hidden_size) #输入层,线性(liner)关系self.relu = nn.ReLU()#隐藏层,使用ReLU函数self.fc2 = nn.Linear(hidden_size, num_classes)  #输出层,线性(liner)关系#forword 参数传递函数,网络中数据的流动def forward(self, x):out = self.fc1(x)out = self.relu(out)out = self.fc2(out)return outnet = Net(input_size, hidden_size, num_classes)# Loss and Optimizer
criterion = nn.CrossEntropyLoss()  #设置loss为最小二乘loss
optimizer = torch.optim.Adam(net.parameters(), lr=learning_rate)  
#设置优化器,torch.optim.Adam
# Train the Model
for epoch in range(num_epochs):for i, (images, labels) in enumerate(train_loader):  #enumrate# Convert torch tensor to Variableimages = Variable(images.view(-1, 28*28))#图片大小为28*28labels = Variable(labels)#pytorch都是有tensor计算的,而tensor里面的参数都是Variable的形式# Forward + Backward + Optimizeoptimizer.zero_grad()  # zero the gradient bufferoutputs = net(images)loss = criterion(outputs, labels)loss.backward()optimizer.step()if (i+1) % 100 == 0:print ('Epoch [%d/%d], Step [%d/%d], Loss: %.4f' %(epoch+1, num_epochs, i+1, len(train_dataset)//batch_size, loss.item()))
#每训练100个step输出一次结果
# Test the Model
correct = 0
total = 0
for images, labels in test_loader:images = Variable(images.view(-1, 28*28))outputs = net(images)_, predicted = torch.max(outputs.data, 1)total += labels.size(0)#计算所有的label数量correct += (predicted == labels).sum()#计算预测对的label数量print('Accuracy of the network on the 10000 test images: %d %%' % (100 * torch.true_divide(correct, total)))# Save the Model
for i in range(1,4):plt.imshow(train_dataset.train_data[i].numpy(), cmap='gray')  plt.title('%i' % train_dataset.train_labels[i])  plt.show()  
torch.save(net.state_dict(), 'model.pkl')
#net.state_dict(),模型文件
test_output = net(images[:20])  pred_y = torch.max(test_output, 1)[1].data.numpy().squeeze()  print('prediction number',pred_y)  print('real number',test_y[:20].numpy())  

最小二乘Loss

class torch.nn.CrossEntropyLoss(weight=None, size_average=True)[source]
此标准将LogSoftMax和NLLLoss集成到一个类中。

当训练一个多类分类器的时候,这个方法是十分有用的。

weight(tensor): 1-D tensor,n个元素,分别代表n类的权重,如果你的训练样本很不均衡的话,是非常有用的。默认值为None。
调用时参数:

input : 包含每个类的得分,2-D tensor,shape为 batch*n

target: 大小为 n 的 1—D tensor,包含类别的索引(0到 n-1)。

Loss可以表述为以下形式:
在这里插入图片描述

当weight参数被指定的时候,loss的计算公式变为:
在这里插入图片描述

torch.optim.Adam

torch.optim是一个实现了各种优化算法的库。大部分常用的方法得到支持,并且接口具备足够的通用性,使得未来能够集成更加复杂的方法。
·
为了使用torch.optim,需要构建一个optimizer对象。这个对象能够保持当前参数状态并基于计算得到的梯度进行参数更新。
·
为了构建一个Optimizer,需要给它一个包含了需要优化的参数(必须都是Variable对象)的iterable。然后,你可以设置optimizer的参 数选项,比如学习率,权重衰减,等等。
·
例如:

optimizer = optim.SGD(model.parameters(), lr = 0.01, momentum=0.9)
optimizer = optim.Adam([var1, var2], lr = 0.0001)

·
对于Adam

class torch.optim.Adam(params, lr=0.001, betas=(0.9, 0.999), eps=1e-08, weight_decay=0)[source]

参数:

  1. params (iterable) – 待优化参数的iterable或者是定义了参数组的dict lr (float, 可选) –
  2. 学习率(默认:1e-3) betas (Tuple[float, float], 可选) –
  3. 用于计算梯度以及梯度平方的运行平均值的系数(默认:0.9,0.999) eps (float, 可选) –
  4. 为了增加数值计算的稳定性而加到分母里的项(默认:1e-8) weight_decay (float, 可选) –
    权重衰减(L2惩罚)(默认: 0)

附上pytorch文档的解释

torch.max

output = torch.max(input, dim)

1.输入

input是softmax函数输出的一个tensor
dim是max函数索引的维度0/1,0是每列的最大值,1是每行的最大值

2. 输出

函数会返回两个tensor,第一个tensor是每行的最大值,softmax的输出中最大的是1,所以第一个tensor是全1的tensor;第二个tensor是每行最大值的索引。

torch.nn.state_dict()

pytorch 中的 state_dict 是一个简单的python的字典对象,将每一层与它的对应参数建立映射关系.(如model的每一层的weights及偏置等等)

(注意,只有那些参数可以训练的layer才会被保存到模型的state_dict中,如卷积层,线性层等等)

squeeze函数

import numpy as npx = np.array([[[0], [1], [2]]])
print(x)
"""
x=[[[0][1][2]]]
"""
print(x.shape)  # (1, 3, 1)x1 = np.squeeze(x)  # 从数组的形状中删除单维条目,即把shape中为1的维度去掉print(x1)  # [0 1 2]
print(x1.shape)  # (3,)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/508018.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Windows下如何如何将项目上传至GitHub?

安装git客户端 进入官网,点击右侧下载windows版本的软件包 如果下载慢的话,给一个传送门,可以快速下载: 双击安装 一直点击下一步就可,安装位置可以自己选择一下 Github创建仓库 填写项目名称以及ba…

(pytorch-深度学习系列)pytorch卷积层与池化层输出的尺寸的计算公式详解

pytorch卷积层与池化层输出的尺寸的计算公式详解 注:这篇blog写的不够完善,在后面的CNN网络分析padding和stride详细讲了公式,感兴趣的可以移步这里:卷积神经网络中的填充(padding)和步幅(stride) 要设计卷积神经网络的结构&…

idea创建springboot项目,一直在reading pom.xml

problem:遇到的问题 idea创建springboot项目,一直在reading pom.xml 解决方法有三种: (1)修改windows配置文件 c;\windows\System32\drivers\etc\hosts将12.0.0.1 localhost前的注释符号#去掉 (2&#x…

springboot 项目实战 基本框架搭建(IDEA)

springboot 项目实战 基本框架搭建(IDEA) IDEA下载 我使用的是破解的专业版IDEA,使用权一直到2089年: 下载IDEA: 下载processional版本,然后百度搜索激活码即可概率激活,如果你不成功就多找几个激活码 配…

使用IDEA 连接mysql数据库,执行sql指令

使用IDEA 连接mysql数据库,执行sql指令 1 配置项目的SQL依赖 首先参考这篇博文,创建springboot的基本框架 在创建项目的过程中,需要选择SQL相关的依赖,如下: SQL勾选:MySQL Driver,JDBC API …

thymeleaf There was an unexpected error (type=Internal Server Error, status=500).

thymeleaf There was an unexpected error (typeInternal Server Error, status500). 使用thymeleaf依赖&#xff0c;无法访问html文件&#xff0c;解决方法有以下几种可能&#xff1a; 1. 未加载thymeleaf依赖&#xff0c;打开pom.xml&#xff0c;加入依赖&#xff1a; <…

org.attoparser.ParseException: Could not parse as expression: “

Caused by: org.attoparser.ParseException: Could not parse as expression: " {field: ‘id’, title: ‘ID’, fixed: ‘left’, unresize: true, sort: true} , {field: ‘number’, title: ‘学号’, edit: ‘number’, sort: true} , {field: ‘name’, title: ‘姓…

(pytorch-深度学习系列)pytorch中backwards()函数对梯度的操作

backwards()函数对梯度的操作 对于一个新的tensor来说&#xff0c;梯度是空的&#xff1b;但当对这个tensor进行运算操作后&#xff0c;他就会拥有一个梯度&#xff1a; x torch.ones(2, 2, requires_gradTrue) print(x) print(x.grad_fn)y x 2 print(y) print(y.grad_fn)…

(pytorch-深度学习系列)pytorch实现线性回归

pytorch实现线性回归 1. 实现线性回归前的准备 线性回归输出是一个连续值&#xff0c;因此适用于回归问题。回归问题在实际中很常见&#xff0c;如预测房屋价格、气温、销售额等连续值的问题。 与回归问题不同&#xff0c;分类问题中模型的最终输出是一个离散值。我们所说的图…

(pytorch-深度学习系列)pytorch实现多层感知机(手动定义模型)对Fashion-MNIST数据集进行分类-学习笔记

pytorch实现多层感知机对Fashion-MNIST数据集进行分类&#xff08;手动定义模型&#xff09; 多层感知机&#xff1a; 多层感知机在单层神经网络的基础上引入了一到多个隐藏层&#xff08;hidden layer&#xff09;。隐藏层位于输入层和输出层之间。 输入和输出个数分别为4和…

(pytorch-深度学习系列)ResNet残差网络的理解-学习笔记

ResNet残差网络的理解 ResNet伴随文章 Deep Residual Learning for Image Recognition 诞生&#xff0c;该文章是MSRA何凯明团队在2015年ImageNet上使用的网络&#xff0c;在当年的classification、detection等比赛中&#xff0c;ResNet均获了第一名&#xff0c;这也导致了Res…

(pytorch-深度学习系列)卷积神经网络LeNet-学习笔记

卷积神经网络LeNet 先上图&#xff1a;LeNet的网络结构 卷积(6个5∗5的核)→降采样(池化)(2∗2的核&#xff0c;步长2)→卷积(16个5∗5的核)→降采样(池化)(2∗2的核&#xff0c;步长2)→全连接16∗5∗5→120→全连接120→84→全连接84→10\begin{matrix}卷积 \\ (6个5*5的核…

(pytorch-深度学习系列)深度卷积神经网络AlexNet

深度卷积神经网络AlexNet 文字过多&#xff0c;但是重点已经标出来了 背景 在LeNet提出后的将近20年里&#xff0c;神经网络一度被其他机器学习方法超越&#xff0c;如支持向量机。虽然LeNet可以在早期的小数据集上取得好的成绩&#xff0c;但是在更大的真实数据集上的表现并…

(pytorch-深度学习)包含并行连结的网络(GoogLeNet)

包含并行连结的网络&#xff08;GoogLeNet&#xff09; 在2014年的ImageNet图像识别挑战赛中&#xff0c;一个名叫GoogLeNet的网络结构大放异彩。它虽然在名字上向LeNet致敬&#xff0c;但在网络结构上已经很难看到LeNet的影子。GoogLeNet吸收了NiN中网络串联网络的思想&#…

(pytorch-深度学习)实现稠密连接网络(DenseNet)

稠密连接网络&#xff08;DenseNet&#xff09; ResNet中的跨层连接设计引申出了数个后续工作。稠密连接网络&#xff08;DenseNet&#xff09;与ResNet的主要区别在于在跨层连接上的主要区别&#xff1a; ResNet使用相加DenseNet使用连结 ResNet&#xff08;左&#xff09;…

(pytorch-深度学习)循环神经网络

循环神经网络 在nnn元语法中&#xff0c;时间步ttt的词wtw_twt​基于前面所有词的条件概率只考虑了最近时间步的n−1n-1n−1个词。如果要考虑比t−(n−1)t-(n-1)t−(n−1)更早时间步的词对wtw_twt​的可能影响&#xff0c;需要增大nnn。 这样模型参数的数量将随之呈指数级增长…

(pytorch-深度学习)使用pytorch框架nn.RNN实现循环神经网络

使用pytorch框架nn.RNN实现循环神经网络 首先&#xff0c;读取周杰伦专辑歌词数据集。 import time import math import numpy as np import torch from torch import nn, optim import torch.nn.functional as Fimport sys sys.path.append("..") device torch.d…

(pytorch-深度学习)通过时间反向传播

通过时间反向传播 介绍循环神经网络中梯度的计算和存储方法&#xff0c;即通过时间反向传播&#xff08;back-propagation through time&#xff09;。 正向传播和反向传播相互依赖。正向传播在循环神经网络中比较直观&#xff0c;而通过时间反向传播其实是反向传播在循环神经…

(pytorch-深度学习)门控循环单元(GRU)

门控循环单元&#xff08;GRU&#xff09; 循环神经网络中的梯度计算 当时间步数较大或者时间步较小时&#xff0c;循环神经网络的梯度较容易出现衰减或爆炸。虽然裁剪梯度可以应对梯度爆炸&#xff0c;但无法解决梯度衰减的问题。通常由于这个原因&#xff0c;循环神经网络在…

(pytorch-深度学习)长短期记忆(LSTM)

长短期记忆&#xff08;LSTM&#xff09; LSTM 中引入了3个门&#xff0c;即 输入门&#xff08;input gate&#xff09;遗忘门&#xff08;forget gate&#xff09;输出门&#xff08;output gate&#xff09;以及与隐藏状态形状相同的记忆细胞&#xff08;某些文献把记忆细…