【pytorch练习】使用pytorch神经网络架构拟合余弦曲线

在本篇博客中，我们将通过一个简单的例子，讲解如何使用 PyTorch 实现一个神经网络模型来拟合余弦函数。本文将详细分析每个步骤，从数据准备到模型的训练与评估，帮助大家更好地理解如何使用 PyTorch 进行模型构建和训练。

一、背景

在机器学习中，拟合曲线是一个常见的任务，尤其是在函数预测和回归问题中。今天，我们使用一个简单的神经网络模型来拟合余弦曲线，具体步骤包括：

准备训练数据；
构建神经网络模型；
训练模型；
可视化预测结果与真实数据。
本例通过 PyTorch 实现了整个流程，我们将逐步展开。

二、代码解析

导入必要的库

import torch
import torch.nn as nn
from torch.utils.data import DataLoader
from torch.utils.data import TensorDataset
import numpy as np
import matplotlib
import matplotlib.pyplot as plt
import os
os.environ["KMP_DUPLICATE_LIB_OK"] = "TRUE"
matplotlib.rcParams['font.sans-serif'] = ['SimHei']
matplotlib.rcParams['axes.unicode_minus'] = False

首先，我们导入了PyTorch相关的库 torch、torch.nn，以及用于数据加载的 DataLoader 和 TensorDataset。为了可视化结果，我们还引入了 matplotlib。

此外，为了避免某些系统环境下的警告信息，我们设置了 os.environ[“KMP_DUPLICATE_LIB_OK”] = “TRUE”，这有助于避免在多线程计算中遇到一些潜在的错误。

准备拟合数据

# 准备拟合数据
x = np.linspace(-2 * np.pi, 2 * np.pi, 400)  # 生成从 -2π 到 2π 的 400 个点
y = np.cos(x)  # 计算对应的余弦值# 绘制生成的数据的散点图
plt.figure(figsize=(7, 5), dpi=160)
plt.scatter(x, y, color='red', label='生成数据')
plt.title('x 和 cos(x) 数据散点图', fontsize=15)
plt.xlabel('x', fontsize=12)
plt.ylabel('cos(x)', fontsize=12)
plt.legend(fontsize=12)
plt.grid(True)
plt.show()

在这里插入图片描述
使用 numpy.linspace 生成一个包含 400 个点的 x 轴数据，范围从 -2π 到 2π，然后计算对应的 y 值，这里 y = cos(x)。

接下来，将数据整理成 PyTorch 能够接受的格式

# 将数据做成数据集的模样
X = np.expand_dims(x, axis=1)  # 使 X 变为二维数组
Y = y.reshape(400, -1)  # Y 为一列的数组
dataset = TensorDataset(torch.tensor(X, dtype=torch.float), torch.tensor(Y, dtype=torch.float))
dataloader = DataLoader(dataset, batch_size=10, shuffle=True)

通过 TensorDataset 将 x 和 y 数据捆绑成一个数据集，并使用 DataLoader 来批量加载数据，设置 batch_size=10，并启用数据打乱（shuffle=True）以增加模型训练的随机性。

构建神经网络
接下来，我们将构建一个简单的神经网络来拟合这些数据。在这个例子中，我们使用了一个全连接的神经网络，并采用了 ReLU 激活函数。网络的结构如下：

输入层：1 个神经元（因为我们的输入是一个 1D 数值）。
隐藏层 1：10 个神经元，使用 ReLU 激活函数。
隐藏层 2：100 个神经元，使用 ReLU 激活函数。
隐藏层 3：10 个神经元，使用 ReLU 激活函数。
输出层：1 个神经元，输出拟合的结果。

import torch.nn as nnclass Net(nn.Module):def __init__(self):super(Net, self).__init__()self.net = nn.Sequential(nn.Linear(in_features=1, out_features=10), nn.ReLU(),nn.Linear(10, 100), nn.ReLU(),nn.Linear(100, 10), nn.ReLU(),nn.Linear(10, 1))def forward(self, input: torch.FloatTensor):return self.net(input)# 创建模型实例
net = Net()
net

Net((net): Sequential((0): Linear(in_features=1, out_features=10, bias=True)(1): ReLU()(2): Linear(in_features=10, out_features=100, bias=True)(3): ReLU()(4): Linear(in_features=100, out_features=10, bias=True)(5): ReLU()(6): Linear(in_features=10, out_features=1, bias=True))
)

这段代码定义了一个简单的神经网络类 Net，它继承自 nn.Module。通过 nn.Sequential 来堆叠多个层，使得网络的结构更加简洁和易于理解。每一层都紧跟着一个 ReLU 激活函数，用于引入非线性特征。

训练模型
接下来，我们开始训练模型。我们选择 Adam 优化器，并使用均方误差（MSE）作为损失函数。在每个 epoch 中，我们都会迭代一次所有的训练数据，通过反向传播更新模型参数。

# 设置优化器和损失函数
optim = torch.optim.Adam(net.parameters(), lr=0.001)
Loss = nn.MSELoss()# 训练模型
for epoch in range(100):loss = Nonefor batch_x, batch_y in dataloader:# 前向传播y_predict = net(batch_x)# 计算损失loss = Loss(y_predict, batch_y)# 清空梯度optim.zero_grad()# 反向传播loss.backward()# 更新参数optim.step()# 每10步打印一次训练日志if (epoch + 1) % 10 == 0:print(f"训练步骤: {epoch+1}, 模型损失: {loss.item()}")

训练步骤: 10, 模型损失: 0.12506699562072754
训练步骤: 20, 模型损失: 0.024437546730041504
训练步骤: 30, 模型损失: 0.08189699053764343
训练步骤: 40, 模型损失: 0.03138166293501854
训练步骤: 50, 模型损失: 0.00651053711771965
训练步骤: 60, 模型损失: 0.0032562180422246456
训练步骤: 70, 模型损失: 0.00018047125195153058
训练步骤: 80, 模型损失: 0.005476313643157482
训练步骤: 90, 模型损失: 0.0014593529049307108
训练步骤: 100, 模型损失: 0.0008746677194721997

可视化
训练完成后，我们可以使用训练好的模型来进行预测，并将预测结果与真实数据进行比较。

# 绘制真实数据与预测数据的对比
plt.figure(figsize=(12, 7), dpi=160)
plt.plot(x, y, label="实际值", marker="X")
plt.plot(x, predict.detach().numpy(), label="预测值", marker='o')
plt.xlabel("x", size=15)
plt.ylabel("cos(x)", size=15)
plt.xticks(size=15)
plt.yticks(size=15)
plt.legend(fontsize=15)
plt.show()