基于ResNet-18的简单分类(新手,而且网络效果不咋滴,就是学个流程)

引言

先看问题:

我手边有一数据集,然后我想分分类!~~·

咳咳,最近刚做了一个:训练集有1143张,分为5类,里面图片是打乱的。测试集有248张,想把它分分类看看咋样。

再看一下效果: 

这是经过100轮训练后准确率。(准确率最高也就72%左右,要想再升高就要改变数据集或者改网络了)

同时我们也将训练后的结果保存到了文件夹里。

经过网络训练后,最后的显示图:

预测第一张图属于第一类,它的确也确实属于第一类;但第二张图预测它是第二类,但是它事实上属于第四类。


操作

一、明确知道代码结构流程

① Prepare dataset   构建数据集

② Design model using Class   设计模型 

③ Construct loss and optimizer  构造损失函数和优化器

④ Training   训练

⑤ Prediction  预测结果(第五步可适当补充想生成的图像)

二、写代码

1.构建数据集

在写代码的时候,如果数据集都构建不好,后续都不用进行了。

接下来,我们简单说一下两种数据集构建代码。

(1) torchvision内置的数据集

这种就是最为简单的一种,可以直接调用的。如 MNIST、Fashion-MNIST、EMNIST、COCO、LSUN、ImageFolder、DatasetFolder、Imageenet-12、CIFAR、STL10 等。

下面简单以 CIFAR-10 为例:

a. 下载

CIFAR-10 and CIFAR-100 datasets (toronto.edu)

(下载解压后如下,并将文件夹放入一个新的文件夹 CIFAR 里,并将该文件夹放入另一个文件夹SH1中。)

大致构建如下:

b. 简单介绍 CIFAR-10 

The CIFAR-10 dataset consists of 60000 32x32 colour images in 10 classes, with 6000 images per class. There are 50000 training images and 10000 test images.The dataset is divided into five training batches and one test batch, each with 10000 images. The test batch contains exactly 1000 randomly-selected images from each class. The training batches contain the remaining images in random order, but some training batches may contain more images from one class than another. Between them, the training batches contain exactly 5000 images from each class.
(该数据集包含10个类别的60000张32x32彩色图像,每类有6000张图像。其中,有50000张用于训练,10000张用于测试。数据集被分为五个训练批次和一个测试批次,每批包含10000张图像。测试批次包含每个类别中随机选取的1000张图像。训练批次按照随机顺序包含剩余的图像,但有些训练批次可能包含某一类图像的数量多于另一类。在它们之间,训练批次包含每类5000张图像.)

c. 下载并配置数据集及加载器
# 下载并配置数据集
trans = transforms.Compose([transforms.Resize((96, 96)), transforms.ToTensor()])  
train_dataset = datasets.CIFAR10(root=r'D:\SH1\CIFAR', train=True, transform=trans)
test_dataset = datasets.CIFAR10(root=r'D:\SH1\CIFAR', train=False, transform=trans)# 配置数据加载器
batch_size = 64
train_loader = DataLoader(dataset=train_dataset,batch_size=batch_size, shuffle=True)
test_loader = DataLoader(dataset=test_dataset,batch_size=batch_size, shuffle=True)

1. trans = transforms.Compose([transforms.Resize((96, 96)), transforms.ToTensor()]): 这行代码创建了一个数据转换操作的组合 trans,其中包括将图像大小调整为 (96, 96) 并将其转换为张量的操作。

2. train_dataset = datasets.CIFAR10(root=r'D:\SH1\CIFAR', train=True, transform=trans): 这行代码创建了一个 CIFAR-10 数据集的训练集 train_dataset,指定了数据集的根目录和使用的数据转换操作。

3. test_dataset = datasets.CIFAR10(root=r'D:\SH1\CIFAR', train=False, transform=trans): 这行代码创建了一个 CIFAR-10 数据集的测试集 test_dataset,同样指定了数据集的根目录和使用的数据转换操作。

4. batch_size = 64: 这行代码定义了批量大小为 64。

5. train_loader = DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True): 这行代码创建了一个训练数据加载器 train_loader,用于加载训练数据集,指定了数据集、批量大小和是否打乱数据顺序。

6. test_loader = DataLoader(dataset=test_dataset, batch_size=batch_size, shuffle=True): 这行代码创建了一个测试数据加载器 test_loader,用于加载测试数据集,同样指定了数据集、批量大小和是否打乱数据顺序。

(2)我们自己手里的数据集

a. 整理标签

以上上周我们老师给我的数据集为例。老师给我的数据集里面包含训练集和测试集以及相应的标签。

但是标签里面的信息太多了,我只需要它的名称以及类别。

以Training_Labels为例,我只需要第一列 image 和 第二列 myopic_maculopathy_grade。

import pandas as pd
# 读取原始标签文件
df_train = pd.read_csv('Training_labels.csv')
df_test = pd.read_csv('Testing_labels.csv')# 提取所需字段
new_df_train = df_train[['image', 'myopic_maculopathy_grade']]
new_df_test = df_test[['image', 'myopic_maculopathy_grade']]# 重命名列
new_df_train.columns = ['filename', 'label']
new_df_test.columns = ['filename', 'label']
# 保存新的标签文件
new_df_train.to_csv('train_labels.csv', index=False)
new_df_test.to_csv('test_labels.csv', index=False)

所以我通过上面的代码将第一列和第二列进行了提取,并且改成了:filename', 'label',生成了另外的标签。

同样以train_Labels为例:

b. 定义一个自定义数据集类 

我们要定义一个自定义数据集类 CustomDataset , 用于加载图像数据集并返回及其对应的标签。

class CustomDataset(Dataset):def __init__(self, csv_file, root_dir, transform=None):self.labels_df = pd.read_csv(csv_file)self.root_dir = root_dirself.transform = transformdef __len__(self):return len(self.labels_df)def __getitem__(self, idx):img_name = os.path.join(self.root_dir, self.labels_df.iloc[idx, 0])try:image = Image.open(img_name)except FileNotFoundError:print(f"File not found: {img_name}")raiselabel = int(self.labels_df.iloc[idx, 1])  # 使用标签列if self.transform:image = self.transform(image)return image, label

1. class CustomDataset(Dataset)::定义了一个名为 CustomDataset 的类,该类继承自 Dataset 类,用于创建自定义数据集。

2. def __init__(self, csv_file, root_dir, transform=None)::定义了类的初始化方法,接受三个参数:csv_file 表示包含标签信息的 CSV 文件路径,root_dir 表示图像文件所在的根目录,transform 表示数据转换操作,默认为 None。

3. self.labels_df = pd.read_csv(csv_file): 从给定的 CSV 文件中读取标签信息并存储在 labels_df 中。

4. self.root_dir = root_dir:将图像文件的根目录路径存储在 root_dir 中。

5. self.transform = transform:存储数据转换操作,例如将图像转换为张量等。

6. def __len__(self)::定义了 __len__ 方法,返回数据集的长度,即标签信息的数量。

7. def __getitem__(self, idx)::定义了 __getitem__ 方法,用于获取数据集中特定索引 idx 处的图像及其标签。

8. img_name = os.path.join(self.root_dir, self.labels_df.iloc[idx, 0]):构建图像文件的完整路径。

9. try...except...:尝试打开图像文件,如果文件不存在则捕获 FileNotFoundError 异常并打印错误信息。

10. label = int(self.labels_df.iloc[idx, 1]):从标签数据中提取标签信息,转换为整数类型。

11. if self.transform::检查是否存在数据转换操作。

12. image = self.transform(image):如果存在数据转换操作,则对图像进行相应的转换。

13. return image, label:返回处理后的图像及其对应的标签。

c. 配置数据集及加载器
# 定义数据转换
trans = transforms.Compose([transforms.Resize((96, 96)), transforms.ToTensor()])# 创建自定义数据集
train_dataset = CustomDataset(csv_file='train_labels.csv', root_dir='training', transform=trans)
test_dataset = CustomDataset(csv_file='test_labels.csv', root_dir='testing', transform=trans)# 配置数据加载器
train_loader = DataLoader(train_dataset, batch_size=64, shuffle=True, num_workers=0)  # 设置 num_workers=0 以避免多线程问题
test_loader = DataLoader(test_dataset, batch_size=64, shuffle=True, num_workers=0)

( 由于这个代码和下载并配置CIFAR-10数据集及加载器的代码差不多,刚才仔细讲过了,所以这里就不再讲一遍了)

2. 设计模型

我们用的是ResNet-18网络,要想更好的理解这个网络,我们需要了解一个知识点----残差块。

在 ResNet-18 中,残差块起着关键的作用,通过引入跳跃连接(skip connection)来缓解深层神经网络中的梯度消失问题,从而使得训练更深层的网络成为可能。具体来说:

1. 跳跃连接:在每个残差块中,通过将输入直接与输出相加(即跳跃连接),实现了从底层到顶层的直接信息传递。这种跳跃连接有助于梯度的流动,避免了梯度在深层网络中逐渐消失的问题。

2. 缓解梯度消失:由于跳跃连接的存在,即使在深层网络中,梯度可以通过跳跃连接直接传播到较浅层,从而减轻了梯度消失问题,使得网络更容易训练。

3. 增强网络性能:残差块的设计使得网络更加深层时仍能保持较好的性能,因为网络可以更好地学习残差(即残差块的输出与输入之间的差异),而不是直接学习原始特征。

了解后,我们要了解一下网络的结构图:

经典CNN网络:Resnet18网络结构输入和输出[通俗易懂]-腾讯云开发者社区-腾讯云 (tencent.com)

(网上有很多资料,我随便找了一个,应该还是比较容易的)

接下来,我们讲下代码:

(1) 残差块

class Residual(nn.Module):# 残差块def __init__(self, input_channels, num_channels,use_1x1conv=False, strides=1):super().__init__()self.conv1 = nn.Conv2d(input_channels, num_channels,kernel_size=3, padding=1, stride=strides)self.conv2 = nn.Conv2d(num_channels, num_channels,kernel_size=3, padding=1)if use_1x1conv:self.conv3 = nn.Conv2d(input_channels, num_channels,kernel_size=1, stride=strides)else:self.conv3 = Noneself.bn1 = nn.BatchNorm2d(num_channels)self.bn2 = nn.BatchNorm2d(num_channels)def forward(self, X):# self.bn1(...):对卷积层的输出应用第一个批量归一化层,F.relu(...): 对归一化后的输出应用ReLU激活函数,Y: 存储激活后的输出Y = F.relu(self.bn1(self.conv1(X)))# Y: 更新Y为第二个卷积层和归一化后的输出Y = self.bn2(self.conv2(Y))if self.conv3:X = self.conv3(X)Y += X  # Y += X: 将输入X(或经过1x1卷积层的X)加到Y上,实现残差连接。return F.relu(Y)

1. class Residual(nn.Module)::定义了一个名为 Residual 的类,继承自 nn.Module 类,表示这是一个 PyTorch 模型。

2. def __init__(self, input_channels, num_channels, use_1x1conv=False, strides=1)::定义了类的初始化方法,接受输入通道数 input_channels、输出通道数 num_channels、是否使用 1x1 卷积 use_1x1conv 和步幅 strides 作为参数。

3. super().__init__():调用父类的初始化方法。

4. self.conv1 = nn.Conv2d(input_channels, num_channels, kernel_size=3, padding=1, stride=strides): 创建第一个卷积层,使用 3x3 的卷积核,填充为 1,步幅为 strides。

5. self.conv2 = nn.Conv2d(num_channels, num_channels, kernel_size=3, padding=1): 创建第二个卷积层,输入通道数为 num_channels,输出通道数为 num_channels,使用 3x3 的卷积核,填充为 1。

6. if use_1x1conv::检查是否使用 1x1 卷积。

7. self.conv3 = nn.Conv2d(input_channels, num_channels, kernel_size=1, stride=strides): 如果使用 1x1 卷积,创建一个 1x1 的卷积层。

8. self.bn1 = nn.BatchNorm2d(num_channels): 创建第一个批量归一化层。

9. self.bn2 = nn.BatchNorm2d(num_channels): 创建第二个批量归一化层。

10. def forward(self, X)::定义了前向传播方法,接受输入 X。

11. Y = F.relu(self.bn1(self.conv1(X))): 应用第一个卷积层、批量归一化和 ReLU 激活函数。

12. Y = self.bn2(self.conv2(Y)): 应用第二个卷积层和批量归一化。

13. if self.conv3::检查是否存在第三个卷积层。

14. X = self.conv3(X): 如果存在第三个卷积层,应用该卷积层。

15. Y += X: 将输入 X(或经过 1x1 卷积层的 X)加到 Y 上,实现残差连接。

16. return F.relu(Y): 返回经过激活函数处理后的输出 Y。

(2) ResNet-18 网络


# ResNet-18
b1 = nn.Sequential(nn.Conv2d(3, 64, kernel_size=7, stride=2, padding=3),nn.BatchNorm2d(64), nn.ReLU(),  # 批量归一化层,通道数为64, ReLU激活函数nn.MaxPool2d(kernel_size=3, stride=2, padding=1))  # 最大池化层,核大小为3x3,步幅为2,填充为1def resnet_block(input_channels, num_channels, num_residuals,first_block=False):blk = []  # blk = []: 初始化一个空列表 blk,用于存储残差块。for i in range(num_residuals):if i == 0 and not first_block:# blk.append: 将一个新的残差块添加到 blk 列表中。blk.append(Residual(input_channels, num_channels,use_1x1conv=True, strides=2))else:blk.append(Residual(num_channels, num_channels))  # 不使用1x1卷积层,步幅为默认值1。return blk# *: 解包操作符,将 resnet_block 返回的列表解包为单个参数传递给 nn.Sequential。
b2 = nn.Sequential(*resnet_block(64, 64, 2, first_block=True))
b3 = nn.Sequential(*resnet_block(64, 128, 2))
b4 = nn.Sequential(*resnet_block(128, 256, 2))
b5 = nn.Sequential(*resnet_block(256, 512, 2))# nn.AdaptiveAvgPool2d((1, 1)):自适应平均池化层,将每个特征图的空间维度(高度和宽度)缩小到1x1。
# 作用是将不同大小的特征图统一到相同的输出尺寸。
# nn.Flatten():将多维特征图展平成一维向量
# 作用是将特征图转换为全连接层可以处理的输入格式
# nn.Linear(512, 5)):全连接层,输入维度为512,输出维度为5。
# 作用是将展平后的特征向量映射到 5个类别 .(例如,CIFAR-10数据集有10个类别)。# 定义完整的ResNet模型
net = nn.Sequential(b1, b2, b3, b4, b5, nn.AdaptiveAvgPool2d((1, 1)),nn.Flatten(), nn.Linear(512, 5))
# nn.AdaptiveAvgPool2d((1, 1)),  # 自适应平均
# nn.Flatten(),  # 将特征图展平为一维向量
# nn.Linear(512, 5)  # 全连接层,将特征向量映射到 5个类别

(这段的讲解放在了代码里面)

3. 构造损失函数和优化器

lr = 0.001
optimizer = torch.optim.Adam(net.parameters(), lr=lr)
loss = nn.CrossEntropyLoss()

1. lr = 0.001: 定义了学习率为 0.001,即优化器在更新模型参数时的步长大小。

2. optimizer = torch.optim.Adam(net.parameters(), lr=lr): 创建了一个 Adam 优化器,用于更新模型 net 中的参数。Adam 是一种常用的优化算法,通过调整学习率来最小化损失函数。

3. loss = nn.CrossEntropyLoss(): 创建了一个交叉熵损失函数,用于计算模型输出与真实标签之间的损失。交叉熵损失通常用于多分类问题,特别是在输出层使用 softmax 激活函数时。

4.训练

# 定义训练模型
epochs = 100
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
def train(net, train_iter, test_iter, epochs, device):# 初始化模型参数的权重def init_weights(m):if type(m) == nn.Linear or type(m) == nn.Conv2d:nn.init.xavier_uniform_(m.weight)# 对模型应用初始化权重函数net.apply(init_weights)# 打印当前训练使用的设备print(f'Training on: [{device}]')# 将模型移动到指定的设备上进行训练net.to(device)# 创建计时器和获取训练数据迭代器的长度timer, num_batches = d2l.Timer(), len(train_iter)# 检查训练数据迭代器是否为空if num_batches == 0:print("No batches found in the training data.")return# 循环遍历每个训练轮数for epoch in range(epochs):# 训练损失之和,训练准确率之和,样本数metric = d2l.Accumulator(3)# 将模型设置为训练模式net.train()# 遍历训练数据迭代器for i, (X, y) in enumerate(train_iter):timer.start()optimizer.zero_grad()  # 清空优化器的梯度X, y = X.to(device), y.to(device)  # 将输入数据和标签移动到指定的设备上y_hat = net(X)  # 前向传播,获取模型的预测输出l = loss(y_hat, y)  # 计算模型输出与真实标签之间的损失l.backward()  # 反向传播,计算梯度optimizer.step()  # 更新模型参数with torch.no_grad():metric.add(l * X.shape[0], d2l.accuracy(y_hat, y), X.shape[0])  # 累积训练损失、准确率和样本数timer.stop()train_l = metric[0] / metric[2]  # 计算平均训练损失train_acc = metric[1] / metric[2]  # 计算平均训练准确率if (i + 1) % max(1, (num_batches // 30)) == 0 or i == num_batches - 1:print(f'Epoch: {epoch + 1}, Step: {i + 1}, Loss: {train_l:.4f}')  # 打印每个训练步骤的损失test_acc = d2l.evaluate_accuracy_gpu(net, test_iter)  # 在测试集上评估模型的准确率print(f'Epoch {epoch + 1}: Train Accuracy: {train_acc * 100:.2f}%, Test Accuracy: {test_acc * 100:.2f}%')  # 打印每个训练轮数的训练准确率和测试准确率# 确保保存目录存在print(f'{metric[2] * epochs / timer.sum():.1f} examples/sec on: [{str(device)}]')# 确保保存目录存在save_dir = 'D:\\SH2\\result'  # 这里我在SH2文件夹里新建了一个文件夹result,用于存放最后结果os.makedirs(save_dir, exist_ok=True)# 保存模型torch.save(net.state_dict(), os.path.join(save_dir, f"ResNet-18_SHIYAN_Epoch{epochs}_Accuracy{test_acc * 100:.2f}%.pth"))train(net, train_loader, test_loader, epochs, device)

5. 预测结果

def show_predict():# 预测结果图像可视化net.to(device)  # 将模型移动到指定设备loader = DataLoader(dataset=test_dataset, batch_size=1, shuffle=True)  # 创建数据加载器plt.figure(figsize=(12, 8))  # 创建图像窗口name = ('first', 'second', 'third', 'fourth', 'fifth')  # 类别名称for i in range(9):(images, labels) = next(iter(loader))  # 获取图像和标签images = images.to(device)  # 将图像移动到指定设备labels = labels.to(device)  # 将标签移动到指定设备outputs = net(images)  # 获取模型输出_, predicted = torch.max(outputs.data, 1)  # 获取预测结果title = f"Predicted: {name[int(predicted[0])]}, True: {name[int(labels[0])]}"  # 设置标题plt.subplot(3, 3, i + 1)  # 创建子图plt.imshow(images.cpu()[0].permute(1, 2, 0))  # 显示图像plt.title(title, fontsize=10)  # 设置标题plt.xticks([])  # 隐藏x轴刻度plt.yticks([])  # 隐藏y轴刻度plt.show()  # 显示图像show_predict()

三、总代码

import os
import pandas as pd
from PIL import Image
from torch.utils.data import Dataset
from torchvision import transforms
import torch
from d2l.torch import d2l
from torch import nn
from torch.utils.data import DataLoader
from torchvision import transforms
from torch.nn import functional as F
import matplotlib.pyplot as plt
# import pandas as pd
# # 读取原始标签文件
# df_train = pd.read_csv('Training_labels.csv')
# df_test = pd.read_csv('Testing_labels.csv')# # 提取所需字段
# new_df_train = df_train[['image', 'myopic_maculopathy_grade']]
# new_df_test = df_test[['image', 'myopic_maculopathy_grade']]# # 重命名列
# new_df_train.columns = ['filename', 'label']
# new_df_test.columns = ['filename', 'label']
# # 保存新的标签文件
# new_df_train.to_csv('train_labels.csv', index=False)
# new_df_test.to_csv('test_labels.csv', index=False)class CustomDataset(Dataset):def __init__(self, csv_file, root_dir, transform=None):self.labels_df = pd.read_csv(csv_file)self.root_dir = root_dirself.transform = transformdef __len__(self):return len(self.labels_df)def __getitem__(self, idx):img_name = os.path.join(self.root_dir, self.labels_df.iloc[idx, 0])try:image = Image.open(img_name)except FileNotFoundError:print(f"File not found: {img_name}")raiselabel = int(self.labels_df.iloc[idx, 1])  # 使用标签列if self.transform:image = self.transform(image)return image, label# 定义数据转换
trans = transforms.Compose([transforms.Resize((96, 96)), transforms.ToTensor()])# 创建自定义数据集
train_dataset = CustomDataset(csv_file='train_labels.csv', root_dir='training', transform=trans)
test_dataset = CustomDataset(csv_file='test_labels.csv', root_dir='testing', transform=trans)# 配置数据加载器
train_loader = DataLoader(train_dataset, batch_size=64, shuffle=True, num_workers=0)  # 设置 num_workers=0 以避免多线程问题
test_loader = DataLoader(test_dataset, batch_size=64, shuffle=True, num_workers=0)# 这些代码定义了一个残差块(Residual Block),这是ResNet(残差网络)中的基本构建单元。
# 残差块的主要作用是通过引入跳跃连接(skip connection)来缓解深层神经网络中的梯度消失问题,从而使得训练更深层的网络成为可能。
class Residual(nn.Module):# 残差块def __init__(self, input_channels, num_channels,use_1x1conv=False, strides=1):super().__init__()self.conv1 = nn.Conv2d(input_channels, num_channels,kernel_size=3, padding=1, stride=strides)self.conv2 = nn.Conv2d(num_channels, num_channels,kernel_size=3, padding=1)if use_1x1conv:self.conv3 = nn.Conv2d(input_channels, num_channels,kernel_size=1, stride=strides)else:self.conv3 = Noneself.bn1 = nn.BatchNorm2d(num_channels)self.bn2 = nn.BatchNorm2d(num_channels)def forward(self, X):# self.bn1(...):对卷积层的输出应用第一个批量归一化层,F.relu(...): 对归一化后的输出应用ReLU激活函数,Y: 存储激活后的输出Y = F.relu(self.bn1(self.conv1(X)))# Y: 更新Y为第二个卷积层和归一化后的输出Y = self.bn2(self.conv2(Y))if self.conv3:X = self.conv3(X)Y += X  # Y += X: 将输入X(或经过1x1卷积层的X)加到Y上,实现残差连接。return F.relu(Y)# ResNet-18
b1 = nn.Sequential(nn.Conv2d(3, 64, kernel_size=7, stride=2, padding=3),nn.BatchNorm2d(64), nn.ReLU(),  # 批量归一化层,通道数为64, ReLU激活函数nn.MaxPool2d(kernel_size=3, stride=2, padding=1))  # 最大池化层,核大小为3x3,步幅为2,填充为1def resnet_block(input_channels, num_channels, num_residuals,first_block=False):blk = []  # blk = []: 初始化一个空列表 blk,用于存储残差块。for i in range(num_residuals):if i == 0 and not first_block:# blk.append: 将一个新的残差块添加到 blk 列表中。blk.append(Residual(input_channels, num_channels,use_1x1conv=True, strides=2))else:blk.append(Residual(num_channels, num_channels))  # 不使用1x1卷积层,步幅为默认值1。return blk# *: 解包操作符,将 resnet_block 返回的列表解包为单个参数传递给 nn.Sequential。
b2 = nn.Sequential(*resnet_block(64, 64, 2, first_block=True))
b3 = nn.Sequential(*resnet_block(64, 128, 2))
b4 = nn.Sequential(*resnet_block(128, 256, 2))
b5 = nn.Sequential(*resnet_block(256, 512, 2))# nn.AdaptiveAvgPool2d((1, 1)):自适应平均池化层,将每个特征图的空间维度(高度和宽度)缩小到1x1。
# 作用是将不同大小的特征图统一到相同的输出尺寸。
# nn.Flatten():将多维特征图展平成一维向量
# 作用是将特征图转换为全连接层可以处理的输入格式
# nn.Linear(512, 5)):全连接层,输入维度为512,输出维度为5。
# 作用是将展平后的特征向量映射到 5个类别 .(例如,CIFAR-10数据集有10个类别)。# 定义完整的ResNet模型
net = nn.Sequential(b1, b2, b3, b4, b5, nn.AdaptiveAvgPool2d((1, 1)),nn.Flatten(), nn.Linear(512, 5))
# nn.AdaptiveAvgPool2d((1, 1)),  # 自适应平均
# nn.Flatten(),  # 将特征图展平为一维向量
# nn.Linear(512, 5)  # 全连接层,将特征向量映射到 5个类别  lr = 0.001
optimizer = torch.optim.Adam(net.parameters(), lr=lr)
loss = nn.CrossEntropyLoss()# 定义训练模型
epochs = 100
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
def train(net, train_iter, test_iter, epochs, device):# 初始化模型参数的权重def init_weights(m):if type(m) == nn.Linear or type(m) == nn.Conv2d:nn.init.xavier_uniform_(m.weight)# 对模型应用初始化权重函数net.apply(init_weights)# 打印当前训练使用的设备print(f'Training on: [{device}]')# 将模型移动到指定的设备上进行训练net.to(device)# 创建计时器和获取训练数据迭代器的长度timer, num_batches = d2l.Timer(), len(train_iter)# 检查训练数据迭代器是否为空if num_batches == 0:print("No batches found in the training data.")return# 循环遍历每个训练轮数for epoch in range(epochs):# 训练损失之和,训练准确率之和,样本数metric = d2l.Accumulator(3)# 将模型设置为训练模式net.train()# 遍历训练数据迭代器for i, (X, y) in enumerate(train_iter):timer.start()optimizer.zero_grad()  # 清空优化器的梯度X, y = X.to(device), y.to(device)  # 将输入数据和标签移动到指定的设备上y_hat = net(X)  # 前向传播,获取模型的预测输出l = loss(y_hat, y)  # 计算模型输出与真实标签之间的损失l.backward()  # 反向传播,计算梯度optimizer.step()  # 更新模型参数with torch.no_grad():metric.add(l * X.shape[0], d2l.accuracy(y_hat, y), X.shape[0])  # 累积训练损失、准确率和样本数timer.stop()train_l = metric[0] / metric[2]  # 计算平均训练损失train_acc = metric[1] / metric[2]  # 计算平均训练准确率if (i + 1) % max(1, (num_batches // 30)) == 0 or i == num_batches - 1:print(f'Epoch: {epoch + 1}, Step: {i + 1}, Loss: {train_l:.4f}')  # 打印每个训练步骤的损失test_acc = d2l.evaluate_accuracy_gpu(net, test_iter)  # 在测试集上评估模型的准确率print(f'Epoch {epoch + 1}: Train Accuracy: {train_acc * 100:.2f}%, Test Accuracy: {test_acc * 100:.2f}%')  # 打印每个训练轮数的训练准确率和测试准确率# 确保保存目录存在print(f'{metric[2] * epochs / timer.sum():.1f} examples/sec on: [{str(device)}]')# 确保保存目录存在save_dir = 'D:\\SH2\\result'os.makedirs(save_dir, exist_ok=True)# 保存模型torch.save(net.state_dict(), os.path.join(save_dir, f"ResNet-18_CIFAR-10_Epoch{epochs}_Accuracy{test_acc * 100:.2f}%.pth"))train(net, train_loader, test_loader, epochs, device)def show_predict():# 预测结果图像可视化net.to(device)  # 将模型移动到指定设备loader = DataLoader(dataset=test_dataset, batch_size=1, shuffle=True)  # 创建数据加载器plt.figure(figsize=(12, 8))  # 创建图像窗口name = ('first', 'second', 'third', 'fourth', 'fifth')  # 类别名称for i in range(9):(images, labels) = next(iter(loader))  # 获取图像和标签images = images.to(device)  # 将图像移动到指定设备labels = labels.to(device)  # 将标签移动到指定设备outputs = net(images)  # 获取模型输出_, predicted = torch.max(outputs.data, 1)  # 获取预测结果title = f"Predicted: {name[int(predicted[0])]}, True: {name[int(labels[0])]}"  # 设置标题plt.subplot(3, 3, i + 1)  # 创建子图plt.imshow(images.cpu()[0].permute(1, 2, 0))  # 显示图像plt.title(title, fontsize=10)  # 设置标题plt.xticks([])  # 隐藏x轴刻度plt.yticks([])  # 隐藏y轴刻度plt.show()  # 显示图像show_predict()

附赠:用CIFAR-10数据集操作的代码(20轮,准确率大概在80%左右)

代码1和代码2都差不多,代码1和今天讲的差不多就改了一下数据集,代码2删减了一部分更改了一些,更为简单一点

代码1:

import os
import torch
from torch import nn
from torch.nn import functional as F
from torch.utils.data import DataLoader
from torchvision import datasets, transforms
import matplotlib.pyplot as plt
from d2l import torch as d2l# 下载并配置数据集
trans = transforms.Compose([transforms.Resize((96, 96)), transforms.ToTensor()])
train_dataset = datasets.CIFAR10(root=r'D:\SH1\CIFAR', train=True, transform=trans)
test_dataset = datasets.CIFAR10(root=r'D:\SH1\CIFAR', train=False, transform=trans)# 配置数据加载器
batch_size = 64
train_loader = DataLoader(dataset=train_dataset,batch_size=batch_size, shuffle=True)
test_loader = DataLoader(dataset=test_dataset,batch_size=batch_size, shuffle=True)# 这些代码定义了一个残差块(Residual Block),这是ResNet(残差网络)中的基本构建单元。
# 残差块的主要作用是通过引入跳跃连接(skip connection)来缓解深层神经网络中的梯度消失问题,从而使得训练更深层的网络成为可能。
class Residual(nn.Module):# 残差块def __init__(self, input_channels, num_channels,use_1x1conv=False, strides=1):super().__init__()self.conv1 = nn.Conv2d(input_channels, num_channels,kernel_size=3, padding=1, stride=strides)self.conv2 = nn.Conv2d(num_channels, num_channels,kernel_size=3, padding=1)if use_1x1conv:self.conv3 = nn.Conv2d(input_channels, num_channels,kernel_size=1, stride=strides)else:self.conv3 = Noneself.bn1 = nn.BatchNorm2d(num_channels)self.bn2 = nn.BatchNorm2d(num_channels)def forward(self, X):# self.bn1(...):对卷积层的输出应用第一个批量归一化层,F.relu(...): 对归一化后的输出应用ReLU激活函数,Y: 存储激活后的输出Y = F.relu(self.bn1(self.conv1(X)))# Y: 更新Y为第二个卷积层和归一化后的输出Y = self.bn2(self.conv2(Y))if self.conv3:X = self.conv3(X)Y += X  # Y += X: 将输入X(或经过1x1卷积层的X)加到Y上,实现残差连接。return F.relu(Y)# ResNet-18
b1 = nn.Sequential(nn.Conv2d(3, 64, kernel_size=7, stride=2, padding=3),nn.BatchNorm2d(64), nn.ReLU(),  # 批量归一化层,通道数为64, ReLU激活函数nn.MaxPool2d(kernel_size=3, stride=2, padding=1))  # 最大池化层,核大小为3x3,步幅为2,填充为1def resnet_block(input_channels, num_channels, num_residuals,first_block=False):blk = []  # blk = []: 初始化一个空列表 blk,用于存储残差块。for i in range(num_residuals):if i == 0 and not first_block:# blk.append: 将一个新的残差块添加到 blk 列表中。blk.append(Residual(input_channels, num_channels,use_1x1conv=True, strides=2))else:blk.append(Residual(num_channels, num_channels))  # 不使用1x1卷积层,步幅为默认值1。return blk# *: 解包操作符,将 resnet_block 返回的列表解包为单个参数传递给 nn.Sequential。
b2 = nn.Sequential(*resnet_block(64, 64, 2, first_block=True))
b3 = nn.Sequential(*resnet_block(64, 128, 2))
b4 = nn.Sequential(*resnet_block(128, 256, 2))
b5 = nn.Sequential(*resnet_block(256, 512, 2))# nn.AdaptiveAvgPool2d((1, 1)):自适应平均池化层,将每个特征图的空间维度(高度和宽度)缩小到1x1。
# 作用是将不同大小的特征图统一到相同的输出尺寸。
# nn.Flatten():将多维特征图展平成一维向量
# 作用是将特征图转换为全连接层可以处理的输入格式
# nn.Linear(512, 5)):全连接层,输入维度为512,输出维度为5。
# 作用是将展平后的特征向量映射到 5个类别 .(例如,CIFAR-10数据集有10个类别)。# 定义完整的ResNet模型
net = nn.Sequential(b1, b2, b3, b4, b5, nn.AdaptiveAvgPool2d((1, 1)),nn.Flatten(), nn.Linear(512, 10))
# nn.AdaptiveAvgPool2d((1, 1)),  # 自适应平均
# nn.Flatten(),  # 将特征图展平为一维向量
# nn.Linear(512, 5)  # 全连接层,将特征向量映射到 5个类别  lr = 0.001
optimizer = torch.optim.Adam(net.parameters(), lr=lr)
loss = nn.CrossEntropyLoss()# 定义训练模型
epochs = 20
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
def train(net, train_iter, test_iter, epochs, device):# 初始化模型参数的权重def init_weights(m):if type(m) == nn.Linear or type(m) == nn.Conv2d:nn.init.xavier_uniform_(m.weight)# 对模型应用初始化权重函数net.apply(init_weights)# 打印当前训练使用的设备print(f'Training on: [{device}]')# 将模型移动到指定的设备上进行训练net.to(device)# 创建计时器和获取训练数据迭代器的长度timer, num_batches = d2l.Timer(), len(train_iter)# 检查训练数据迭代器是否为空if num_batches == 0:print("No batches found in the training data.")return# 循环遍历每个训练轮数for epoch in range(epochs):# 训练损失之和,训练准确率之和,样本数metric = d2l.Accumulator(3)# 将模型设置为训练模式net.train()# 遍历训练数据迭代器for i, (X, y) in enumerate(train_iter):timer.start()optimizer.zero_grad()  # 清空优化器的梯度X, y = X.to(device), y.to(device)  # 将输入数据和标签移动到指定的设备上y_hat = net(X)  # 前向传播,获取模型的预测输出l = loss(y_hat, y)  # 计算模型输出与真实标签之间的损失l.backward()  # 反向传播,计算梯度optimizer.step()  # 更新模型参数with torch.no_grad():metric.add(l * X.shape[0], d2l.accuracy(y_hat, y), X.shape[0])  # 累积训练损失、准确率和样本数timer.stop()train_l = metric[0] / metric[2]  # 计算平均训练损失train_acc = metric[1] / metric[2]  # 计算平均训练准确率if (i + 1) % max(1, (num_batches // 30)) == 0 or i == num_batches - 1:print(f'Epoch: {epoch + 1}, Step: {i + 1}, Loss: {train_l:.4f}')  # 打印每个训练步骤的损失test_acc = d2l.evaluate_accuracy_gpu(net, test_iter)  # 在测试集上评估模型的准确率print(f'Epoch {epoch + 1}: Train Accuracy: {train_acc * 100:.2f}%, Test Accuracy: {test_acc * 100:.2f}%')  # 打印每个训练轮数的训练准确率和测试准确率# 确保保存目录存在print(f'{metric[2] * epochs / timer.sum():.1f} examples/sec on: [{str(device)}]')# 确保保存目录存在save_dir = 'D:\\SH1\\result-1'os.makedirs(save_dir, exist_ok=True)# 保存模型torch.save(net.state_dict(), os.path.join(save_dir, f"ResNet-18_SHIYAN_Epoch{epochs}_Accuracy{test_acc * 100:.2f}%.pth"))train(net, train_loader, test_loader, epochs, device)def show_predict():# 预测结果图像可视化net.to(device)  # 将模型移动到指定设备loader = DataLoader(dataset=test_dataset, batch_size=1, shuffle=True)  # 创建数据加载器plt.figure(figsize=(12, 8))  # 创建图像窗口name = ('airplane', 'automobile', 'bird', 'cat','deer', 'dog', 'frog', 'horse', 'ship', 'truck')for i in range(9):(images, labels) = next(iter(loader))  # 获取图像和标签images = images.to(device)  # 将图像移动到指定设备labels = labels.to(device)  # 将标签移动到指定设备outputs = net(images)  # 获取模型输出_, predicted = torch.max(outputs.data, 1)  # 获取预测结果title = f"Predicted: {name[int(predicted[0])]}, True: {name[int(labels[0])]}"  # 设置标题plt.subplot(3, 3, i + 1)  # 创建子图plt.imshow(images.cpu()[0].permute(1, 2, 0))  # 显示图像plt.title(title, fontsize=10)  # 设置标题plt.xticks([])  # 隐藏x轴刻度plt.yticks([])  # 隐藏y轴刻度plt.show()  # 显示图像show_predict()

代码2:

import torch
from torch import nn
from torch.nn import functional as F
from torch.utils.data import DataLoader
from torchvision import datasets, transforms
import matplotlib.pyplot as plt
from d2l import torch as d2l# 下载并配置数据集
trans = transforms.Compose([transforms.Resize((96, 96)), transforms.ToTensor()])
train_dataset = datasets.CIFAR10(root=r'D:\SH1\CIFAR', train=True, transform=trans)
test_dataset = datasets.CIFAR10(root=r'D:\SH1\CIFAR', train=False, transform=trans)# 配置数据加载器
batch_size = 64
train_loader = DataLoader(dataset=train_dataset,batch_size=batch_size, shuffle=True)
test_loader = DataLoader(dataset=test_dataset,batch_size=batch_size, shuffle=True)class Residual(nn.Module):# 残差块def __init__(self, input_channels, num_channels,use_1x1conv=False, strides=1):super().__init__()self.conv1 = nn.Conv2d(input_channels, num_channels,kernel_size=3, padding=1, stride=strides)self.conv2 = nn.Conv2d(num_channels, num_channels,kernel_size=3, padding=1)if use_1x1conv:self.conv3 = nn.Conv2d(input_channels, num_channels,kernel_size=1, stride=strides)else:self.conv3 = Noneself.bn1 = nn.BatchNorm2d(num_channels)self.bn2 = nn.BatchNorm2d(num_channels)def forward(self, X):Y = F.relu(self.bn1(self.conv1(X)))Y = self.bn2(self.conv2(Y))if self.conv3:X = self.conv3(X)Y += Xreturn F.relu(Y)# ResNet-18
b1 = nn.Sequential(nn.Conv2d(3, 64, kernel_size=7, stride=2, padding=3),nn.BatchNorm2d(64), nn.ReLU(),nn.MaxPool2d(kernel_size=3, stride=2, padding=1))def resnet_block(input_channels, num_channels, num_residuals,first_block=False):blk = []for i in range(num_residuals):if i == 0 and not first_block:blk.append(Residual(input_channels, num_channels,use_1x1conv=True, strides=2))else:blk.append(Residual(num_channels, num_channels))return blkb2 = nn.Sequential(*resnet_block(64, 64, 2, first_block=True))
b3 = nn.Sequential(*resnet_block(64, 128, 2))
b4 = nn.Sequential(*resnet_block(128, 256, 2))
b5 = nn.Sequential(*resnet_block(256, 512, 2))net = nn.Sequential(b1, b2, b3, b4, b5,nn.AdaptiveAvgPool2d((1, 1)),nn.Flatten(), nn.Linear(512, 10))def train(net, train_iter, test_iter, epochs, lr, device):def init_weights(m):if type(m) == nn.Linear or type(m) == nn.Conv2d:nn.init.xavier_uniform_(m.weight)net.apply(init_weights)print(f'Training on:[{device}]')net.to(device)optimizer = torch.optim.Adam(net.parameters(), lr=lr)loss = nn.CrossEntropyLoss()timer, num_batches = d2l.Timer(), len(train_iter)for epoch in range(epochs):# 训练损失之和,训练准确率之和,样本数metric = d2l.Accumulator(3)net.train()for i, (X, y) in enumerate(train_iter):timer.start()optimizer.zero_grad()X, y = X.to(device), y.to(device)y_hat = net(X)l = loss(y_hat, y)l.backward()optimizer.step()with torch.no_grad():metric.add(l * X.shape[0], d2l.accuracy(y_hat, y), X.shape[0])timer.stop()train_l = metric[0] / metric[2]train_acc = metric[1] / metric[2]if (i + 1) % (num_batches // 30) == 0 or i == num_batches - 1:print(f'Epoch: {epoch+1}, Step: {i+1}, Loss: {train_l:.4f}')test_acc = d2l.evaluate_accuracy_gpu(net, test_iter)print(f'Epoch {epoch + 1}: Train Accuracy: {train_acc*100:.2f}%, Test Accuracy: {test_acc*100:.2f}%')print(f'{metric[2] * epochs / timer.sum():.1f} examples/sec 'f'on: [{str(device)}]')torch.save(net.state_dict(),f"D:\\SH1\\result-2\\ResNet-18_CIFAR-10_Epoch{epochs}_Accuracy{test_acc*100:.2f}%.pth")epochs, lr = 20, 0.001
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
train(net, train_loader, test_loader, epochs, lr, device)
# 加载保存的模型def show_predict():# 预测结果图像可视化net.to(device)loader = DataLoader(dataset=test_dataset, batch_size=1, shuffle=True)plt.figure(figsize=(12, 8))name = ('airplane', 'automobile', 'bird', 'cat','deer', 'dog', 'frog', 'horse', 'ship', 'truck')for i in range(9):(images, labels) = next(iter(loader))images = images.to(device)labels = labels.to(device)outputs = net(images)_, predicted = torch.max(outputs.data, 1)title = f"Predicted: {name[int(predicted[0])]}, True: {name[int(labels[0])]}"plt.subplot(3, 3, i + 1)plt.imshow(images.cpu()[0].permute(1, 2, 0))plt.title(title, fontsize=10)plt.xticks([])plt.yticks([])plt.show()show_predict()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/27511.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

目前市面上DIY高端空心耳机壳使用的透明原材料是什么?

目前市面上DIY高端空心耳机壳使用的透明原材料是什么? DIY制作耳机壳的UV树脂胶是一种单组份、通过紫外线光固化的胶粘剂,具有低能量固化、收缩低、发热量低、高透明、耐盐酸、耐黄变好、高硬度、韧性好、成型好等特点。这种胶粘剂非常适合用于制作耳机壳…

手机IP地址距离多远会变:解析移动设备的网络定位奥秘

在移动互联网时代,手机IP地址扮演着至关重要的角色,它不仅是我们访问网络的基础,还常常与网络定位、地理位置服务等相关联。那么,手机IP地址在距离多远时会发生变化呢?手机IP地址距离多远会变?下面跟着虎观…

LVS_Director + KeepAlived + 邮件报警

目录 一. 环境准备 二. 对master和backup操作 三. 配置master主机 四. 配置backup主机 六. 验证虚拟IP 七. 配置后端两个web服务器 对web1和web2主机都进行如下操作: 单独修改web1主机 单独修改web2主机 验证 八. 设置邮件报警 一. 环境准备 KeepAlive…

Internet地址

要求和目的 深入理解java InetAddress类的基本用法,并且可以掌握Java程序的编写和调试。 实验环境 Java语言,PC平台 实验具体内容 设计和编写以下程序: 程序1: 1)编写可以获得本机地址的Java程序,然…

【CS.AL】算法核心之贪心算法:从入门到进阶

文章目录 1. 概述2. 适用场景3. 设计步骤4. 优缺点5. 典型应用6. 题目和代码示例6.1 简单题目:找零问题6.2 中等题目:区间调度问题6.3 困难题目:分数背包问题 7. 题目和思路表格8. 总结References 1000.1.CS.AL.1.4-核心-GreedyAlgorithm-Cre…

utm投影

一 概述 UTM (Universal Transverse Mercator)坐标系是由美国军方在1947提出的。虽然我们仍然将其看作与“高斯-克吕格”相似的坐标系统,但实际上UTM采用了网格的分带(或分块)。除在美国本土采用Clarke 1866椭球体以外&#xff0c…

【AI基础】第六步:纯天然保姆喂饭级-安装并运行qwen2-7b

整体步骤类似于 【AI基础】第五步:纯天然保姆喂饭级-安装并运行chatglm3-6b-CSDN博客。 此系列文章列表: 【AI基础】概览 【AI基础】第一步:安装python开发环境-windows篇_下载安装ai环境python 【AI基础】第一步:安装python开发环…

搭建个人智能家居 6 -SGP30 CO₂与TVOC测量

搭建个人智能家居 6 -SGP30 CO₂与TVOC测量 前言说明ESPHomeHomeAssistant 前言 上一篇文章我们给这个智能家居系统添加了第三个外设,温湿度传感器。今天添加第四个外设,用于测量环境中CO₂与TVOC的传感器“SGP30”。 前问回顾: 搭建个人智能…

自然语言处理:第三十五章Embedding 测评榜单MTEB

文章链接: [2210.07316] MTEB: Massive Text Embedding Benchmark (arxiv.org) 项目地址: mteb:MTEB: Massive Text Embedding Benchmark - GitCode github地址: FlagEmbedding/C_MTEB at master FlagOpen/FlagEmbedding (github.com) Hugging Face Leadboard: MTEB Leader…

移动端超超超详细知识点总结(Part3)

flex布局体验 1. 传统布局与flex布局 传统布局: 兼容性好布局繁琐局限性,不能再移动端很好的布局flex 弹性布局: 操作方便,布局极为简单,移动端应用很广泛PC 端浏览器支持情况较差IE 11或更低版本,不支持…

Android开发AndroidStudio中创建Activity两种方法

本文讲解Android Studio中如何创建Activity。 目录 一、手动创建 二、自动创建 创建Activity分为手动和自动创建两种方法。 一、手动创建 创建步骤 1、在Layout目录下创建XML文件 Layout-New-Layout Resource file 打开对话框,编辑布局文件的名字&#xff0c…

Capto2024软件怎么下载安装? 【详细安装图文教程】

Capto 2024是一款专为Mac用户设计的屏幕录制编辑软件。无论是想要制作教育视频、工作演示、游戏录制,还是进行简单的屏幕捕捉,Capto 2024都能满足您的需求。接下来,我将详细介绍其主要功能、特点以及使用场景,并为您评价这款软件。…

安装multisim14.0

前言 文件准备 软件安装 1、 2、 3、 4、 5、 6、 7、 8、 9、 10、 11、 12、 13、 14、汉化 15、在软件安装路径下打开”stringfiles“文件夹, Circuit Design Suite 14.0\stringfiles 16、 17、 18、 19、 20、运行multisim14.0

Java多线程面试重点-2

16.Synchronized关键字加在静态方法和实例方法的区别? 修饰静态方法,是对类进行加锁(Class对象),如果该类中有methodA和methodB都是被Synch修饰的静态方法,此时有两个线程T1、T2分别调用methodA()和methodB()&#x…

热门开源项目推荐:智谱GLM-4-9B和ChatGLM3-6B

目录 热门开源项目推荐:智谱GLM-4-9B和ChatGLM3-6B 1.引言 1.1 开源文化简介 1.2 开源项目的重要性 1.3 博客目的和读者价值 2.什么是开源项目? 2.1 开源定义 2.2 开源许可证类型 2.3 开源社区的作用 3.为什么程序员应该关注开源项目&#xff…

整蛊软件/插件使用方法与配置步骤~

今天出一期整蛊软件的使用方法与配置步骤 很多人在使用整蛊软件的时候 想自己添加更多的玩法内容 但是还不知道如何去配置 这期给大家出一下图文教程步骤 基本上也是软件的功能介绍使用方式~ 案例可扫码查看 第一步:打开软件输入卡密登录: 卡密费用&…

最经济实惠的通配符SSL证书是哪款?

网络安全已成为企业和个人网站运营者关注的焦点。SSL证书作为确保数据传输安全的关键工具,其重要性不言而喻。特别是通配符SSL证书,因其能够为一个主域名及其所有子域名提供统一的安全保护,而受到广泛欢迎。但面对市场上众多的SSL证书品牌和价…

[大模型]Qwen2-7B-Instruct 接入 LangChain 搭建知识库助手

环境准备 在 autodl 平台中租赁一个 3090 等 24G 显存的显卡机器,如下图所示镜像选择 PyTorch–>2.1.0–>3.10(ubuntu20.04)–>12.1 接下来打开刚刚租用服务器的 JupyterLab,并且打开其中的终端开始环境配置、模型下载和运行 demo。 pip 换源…

One能聊天接入百度千帆AppBuilder

One能聊天介绍:基于ChatGPT实现的微信小程序,适配H5和WEB端。包含前后端,支持打字效果输出流式输出,支持AI聊天次数限制,支持分享增加次数等功能One能聊天开源地址:https://github.com/oldinaction/ChatGPT-MPOne能聊天演示环境:可关注【阿壹族】公众号,并回复【One能聊…

12_YouOnlyLookOnce(YOLOv3)新一代实时目标检测技术

1.1 回顾V1和V2 V1:05_YouOnlyLookOnce(YOLOV1)目标检测领域的革命性突破-CSDN博客 V2:07_YouOnlyLookOnce(YOLOv2)Better,Faster,Stronger-CSDN博客 1.2 简介 YOLOv3(You Only Look Once version 3)是…