从零开始构建CNN模型

猫狗分类问题——从零开始构建CNN

        我们将使用相同的体系结构,并进行一些小的更改,如下所示。

  • 第一个线性层的输入尺寸发生变化,因为猫和狗的图像尺寸是(256,256)。
  • 添加了另一个线性层来为模型学习提供更多的灵活性。

        让我们来看看实现网络架构的代码:

class Net(nn.Module):def _init_(self):super_()._init_()self.conv1 = nn.Conv2d(3, 10, kernel_size=5)self.conv2 = nn.Conv2d(10, 20, kernel_size=5)self.conv2_drop = nn.Dropout2d()self.fc1 = nn.Linear(56180, 500)self.fc2 = nn.Linear(500, 0)self.fc3 = nn.Linear(50, 2)def forward(self, x):x = F.relu(F.max_pool2d(self.conv1(x), 2))x = F.relu(F.max_pool2d(self.conv2_drop(self.conv2(x)), 2))x = x.view(x.size(0), -1)x = F.relu(self.fc1(x))x = F.dropout(x, training = self.training)x = F.relu(self.fc2(x))x = F.dropout(x, training = self.training)x = self.fc3(x)return F.log_softmax(x, dim=1)

        我们将使用与 MNIST示例相同的training函数。所以,这里不再包含代码。但是让我们看一下模型训练20次迭代后生成的结果图。
        训练和验证数据集的损失值如图5.16所示。

        训练和验证数据集的准确率如图5.17所示。

        从图中可以清楚地看出,对于每次迭代,训练集的损失都在减少,而验证集的损失却变得更糟。在训练过程中,准确率也增加,但在75%时几乎饱和。显而易见,这是一个模型没有泛化的例子。我们将研究另一种称为迁移学习的技术,它可以帮助我们训练更准确的模型,以及加快训练的速度。

利用迁移学习对猫狗分类

        迁移学习是指在类似的数据集上使用训练好的算法,而无须从头开始训练。人类并不是通过分析数千个相似的图像来识别新的图像。作为人类,我们只是通过了解不同特征来区分特定动物的,比如狐狸和狗。我们不需要了解线条、眼睛和其他较小的特征来识别狐狸。因此,我们将学习如何使用预训练好的模型来构建只需要很少数据的最先进的图像分类器。
        CNN 架构的前几层专注于较小的特征,例如线条或曲线的外观。CNN架构的随后几层中的滤波器识别更高级别的特征,例如眼睛和手指,最后几层学习识别确切的类别。预训练模型是在相似的数据集上训练的算法。大多数流行的算法都在流行的ImageNet数据集上进行了预训练,以识别1000种不同的类别。这样的预训练模型具有可以识别多种模式的调整好的滤波器权重。所以来了解一下如何利用这些预先训练的权重。我们将研究一种名为 VGG16 的算法,它是在ImageNet竞赛中获得成功的最早的算法之一。虽然有更多的现代算法,但该算法仍然很受欢迎,因为它简单易懂并可用于迁移学习。下面来看看 VGG16模型的架构(见图5.18),然后尝试理解架构以及使用它来训练我们的图像分类器。

        VGG16架构包含5个VGG块。每个VGG块是一组卷积层、一个非线性激活函数和一个最大池化函数。所有算法参数都是调整好的,可以达到识别1,000个类别的最先进的结果。该算法以批量的形式获取输入数据,这些数据通过ImageNet数据集的均值和标准差进行归一化。在迁移学习中,我们尝试通过冻结架构的大部分层的学习参数来捕获算法的学习内容。通用实践是仅微调网络的最后几层。在这个例子中,我们只训练最后几个线性层并保持卷积层不变,因为卷积学习的特征主要用于具有类似属性的各种图像相关的问题。下面使用迁移学习训练VGG16模型来对狗和猫进行分类。我们看看实现这一目的所需要的不同步骤。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/34806.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java中的函数式编程指南

Java中的函数式编程指南 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿! 随着Java 8的发布,Java引入了函数式编程的概念,使得代码更简洁…

Unity资源加密方案

在 Unity 项目中,为了保护资源(如纹理、音频、模型和脚本等)免受未经授权的访问和盗用,可以采用多种加密和保护方案。以下是几种常见的 Unity 资源加密方案: 一. 加密和解密资源文件 常见的加密算法有 AES、RSA 等。…

CesiumJS【Basic】- #012添加点线面(entity方式)

文章目录 添加点线面(entity方式)1 目标2 实现2.1 GeometryManager.ts2.2 main.ts添加点线面(entity方式) 1 目标 使用实体方式添加点线面 2 实现 2.1 GeometryManager.ts // src/GeometryManager.tsimport * as Cesium from cesium;export class GeometryManager {pr…

带你学习PID控制算法

#PID涉及相关知识 开环控制系统:开环系统,无反馈系统,即系统的输入不受输出的影响,在受到外界干扰输出效果减小,此时输入也不会增加,因为输出不会对输入施加影响,像是断开的环一样称为开环&…

二自由度机械臂软件系统(一)urdf和moveit2

一、urdf模型 参考链接:https://blog.csdn.net/weixin_45168199/article/details/105755388 这部分直接看参考链接就可以,主要思路如下 1、把sw中的零散零件按照机器人中连杆的分类整合成几个大零件 2、把几个大零件整合成装配体,并设置若干…

eNSP中静态NAT和动态NAT的配置和使用

一、静态NAT 1.拓扑图 a.新建拓扑图 b.PC端配置 PC1: PC2&#xff1a; c.路由器配置 AR1: <Huawei>system-view [Huawei]sysname R1 [R1]interface GigabitEthernet 0/0/0 [R1-GigabitEthernet0/0/0]ip address 192.168.1.254 24 [R1-GigabitEthernet0/0/0]quit…

Redis数据结构—跳跃表 skiplist

一、引言 在数据库和缓存系统的世界中&#xff0c;Redis以其高性能、高可用性、丰富的数据结构以及简洁的API而备受青睐。Redis支持多种数据结构&#xff0c;包括字符串、列表、集合、有序集合等&#xff0c;每种数据结构都对应着一种或多种内部实现。其中&#xff0c;跳跃表&…

TDengine 签约精诚瑞宝,开拓更智能的 IT 服务和管理平台

在当今的数字化时代&#xff0c;数据不仅是企业运营的核心资产&#xff0c;更是推动业务创新和服务优化的关键驱动力。随着数据量的激增&#xff0c;企业面临的挑战也随之增加&#xff0c;尤其是在数据处理和分析的效率上。作为台湾信息服务产业领导厂商精诚集团的核心成员&…

昇思25天学习打卡营第2天|linchenfengxue

传统的计算机视觉方法通常包括图像预处理、特征提取、特征筛选、图像识别等几个步骤。 对于给定的数字图像&#xff0c;计算机在处理时要先执行二次采样、平滑去噪、对比度提升和尺度调整等预处理操作&#xff0c;再对图像中的线条、边缘等全局特征和边角、斑点等局部特征&…

嵌入式信号处理面试题及参考答案(持续更新)

什么是离散时间信号?与连续时间信号的主要区别是什么? 离散时间信号是一种仅在离散时间点上有定义的信号,它不连续存在于所有时间点上,而是只在特定的、通常是均匀间隔的时间点取值。这种信号的表示通常通过序列来完成,比如在数字信号处理中广泛应用的各种音频、视频或控…

MySQL 性能优化全面指南

MySQL 性能优化全面指南 优化MySQL性能是提升数据库响应速度、降低延迟和提高系统整体性能的关键。以下是一些常用的MySQL性能优化方法&#xff0c;涵盖了硬件、配置、查询、索引、架构等多个方面。 1. 硬件优化 1.1. 增加内存 确保有足够的内存来缓存索引和数据&#xff0…

全网最全图书管理后台系统 ---前端项目简介文档

仅供参考&#xff0c;请勿抄袭 图书管理后台系统 ---前端项目简介 Vue2基础脚手架Request http请求封装(src/utils/request.js)Axios--前端和后端的通信工具前端向后端发送请求&#xff0c;可以把数据传给后端&#xff0c;从后端提取数据 前端跨域解决方案 vue使用request.…

游戏心理学Day24

游戏与文化 1989年,哈佛大学政治学教授约瑟夫奈(Joseph Nye)创造出了“软实力”这个概念&#xff0c;指的是事物产生吸引力和说服力的一种影响力&#xff0c;而不是一种威胁力或强制力。2004年4月,约瑟夫的著作《软实力&#xff1a;世界政治中的制胜之道》引起世界热议。此后&…

录音怎么转文字更高效?5款软件带你轻松拿捏文本转换~

临近大学生们最难熬的期末考试周&#xff0c;如何在短时间内复习完所有必考的科目也就成为大家迫在眉睫的首要任务。 想要在复习的过程中&#xff0c;更加高效地捕捉和整理关键信息、提高学习效率&#xff0c;那么录音转文字免费应用无疑是你的一大好帮手&#xff01; 倘若你…

【因式分解】12000的因数有多少个?

1. 题目2. 枚举法求解2.1 分解质因数2.2 枚举2.3 整理分析 3. 公式求解4. 扩展4.1 因式分解4.2 因数个数 1. 题目 12000的因数有多少个&#xff1f; 2. 枚举法求解 2.1 分解质因数 2 ∣ 12000 ‾ 2 ∣ 6000 ‾ 2 ∣ 3000 ‾ 2 ∣ 1500 ‾ 2 ∣ 750 ‾ 3 ∣ 375 ‾ 5 ∣ 125 …

关于docker存储overlay2相关问题

报错如下&#xff1a; 报错原因&#xff1a;使用rm -rf 清理overlay2导致的&#xff0c;非正常清理。 正常清理命令如下&#xff1a; # 清理Docker的所有构建缓存 docker builder prune# 删除旧于24小时的所有构建缓存 docker builder prune --filter "until24h"#删…

堆中的路径

作者 陈越 单位 浙江大学 将一系列给定数字插入一个初始为空的最小堆 h。随后对任意给定的下标 i&#xff0c;打印从第 i 个结点到根结点的路径。 输入格式: 每组测试第 1 行包含 2 个正整数 n 和 m (≤103)&#xff0c;分别是插入元素的个数、以及需要打印的路径条数。下一…

20240624(周一)欧美股市总结:AI股再熄火!标普纳指连跌三日,英伟达市值跌穿3万亿美元,芯片股指跌3%

市场等待周五的美国PCE重磅通胀数据&#xff0c;今年票委、旧金山联储主席戴利称降息之前“还有更多工作要做”&#xff0c;纳指尾盘加速跳水并收跌1%&#xff0c;但道指五连涨至五周高位。谷歌、微软脱离最高&#xff0c;英伟达跌6.7%为近两个月最差&#xff0c;三天累跌近13%…

vue封装一个简单的权限管理功能, 控制页面的按钮显示与隐藏

vue封装一个简单的权限管理功能, 控制页面的按钮显示与隐藏 1、在项目入口html文件创建全局变量 <head><script>// 创建全局变量window.SITE_CONFIG {};// 登录成功后获取到的按钮权限数据存储到这里window.SITE_CONFIG[purview] [];</script> </head…

vue3-openlayers 点击多边形弹框,高亮多边形,自定义属性传递,鼠标悬浮多边形上动态修改鼠标样式

本篇介绍一下使用vue3-openlayers点击多边形弹框&#xff0c;高亮多边形&#xff0c;自定义属性传递&#xff0c;鼠标悬浮多边形上动态修改鼠标样式 1 需求 加载天地图&#xff0c;polygon传递自定义属性标悬浮在polygon上&#xff0c;根据自定义属性&#xff0c;动态修改鼠标…