神经网络可以使用 torch.nn
包构建.
autograd
实现了反向传播功能, 但是直接用来写深度学习的代码在很多情况下还是稍显复杂,torch.nn
是专门为神经网络设计的模块化接口. nn
构建于 Autograd
之上, 可用来定义和运行神经网络. nn.Module
是 nn
中最重要的类, 可把它看成是一个网络的封装, 包含网络各层定义以及 forward
方法, 调用 forward(input)
方法, 可返回前向传播的结果.
一个典型的神经网络训练过程如下:
让我们来定义一个网络:
- 定义具有一些可学习参数(或权重)的神经网络
- 迭代输入数据集
- 通过网络处理输入
- 计算损失(输出的预测值与实际值之间的距离)
- 将梯度传播回网络
- 更新网络的权重, 通常使用一个简单的更新规则:
weight = weight - learning_rate * gradient
import torch
from torch.autograd import Variable
import torch.nn as nn
import torch.nn.functional as Fclass Net(nn.Module):def __init__(self):super(Net, self).__init__()# 卷积层 '1'表示输入图片为单通道, '6'表示输出通道数, '5'表示卷积核为5*5# 核心self.conv1 = nn.Conv2d(1, 6, 5)self.conv2 = nn.Conv2d(6, 16, 5)# 仿射层/全连接层: y = Wx + bself.fc1 = nn.Linear(16 * 5 * 5, 120)self.fc2 = nn.Linear(120, 84)self.fc3 = nn.Linear(84, 10)def forward(self, x):#在由多个输入平面组成的输入信号上应用2D最大池化.# (2, 2) 代表的是池化操作的步幅x = F.max_pool2d(F.relu(self.conv1(x)), (2, 2))# 如果大小是正方形, 则只能指定一个数字x = F.max_pool2d(F.relu(self.conv2(x)), 2)x = x.view(-1, self.num_flat_features(x))x = F.relu(self.fc1(x))x = F.relu(self.fc2(x))x = self.fc3(x)return xdef num_flat_features(self, x):size = x.size()[1:] # 除批量维度外的所有维度num_features = 1for s in size:num_features *= sreturn num_featuresnet = Net()
print(net)