基于索尼基于索尼Spresense的眼睛跟随平台中两个模型的对比

1.模型一(现在使用的)

请添加图片描述
这个模型是一个简单的神经网络,由三个主要组件组成:输入层、一个全连接层(Affine层)、一个Sigmoid激活函数层和一个Binary Cross Entropy损失层。
以下是每个组件的说明:

  1. Input 层:这是模型的输入层,表示输入数据的形状为1, 28, 28。这通常是表示灰度图像的维度,即单通道图像,宽度为28像素,高度也为28像素。
  2. Affine 层:这是一个全连接层,也被称为线性变换层。在这个层中,每个输入节点都与输出节点有一个权重(w)和偏差(b)。权重和偏差是在训练过程中通过反向传播算法更新的参数。全连接层将所有的输入节点连接到输出节点,形成一个线性的关系。在这个例子中,输入和输出的维度都是1,所以这是一个单输出的线性层。
  3. Sigmoid激活函数层:Sigmoid函数是一个常见的激活函数,它将任何实数值压缩到0到1之间。这个函数常用于二分类问题,因为它可以将输出映射到概率区间。在 Affine 层之后使用 Sigmoid 函数可以帮助我们得到一个接近于0或1的概率值,这对于二分类任务非常有用。
  4. Binary Cross Entropy Loss 层:这是损失函数层,用于衡量模型预测的结果与真实标签之间的差距。
    它测量的是模型预测的概率分布与真实类别分布之间的距离。在训练过程中,我们会最小化这个损失函数来优化模型的权重和偏差。这个模型适用于二分类问题,例如识别手写数字等任务。输入图像经过全连接层和Sigmoid激活函数后,得到一个0到1之间的概率值,表示属于某一类别的可能性。然后,Binary Cross Entropy Loss 层用来比较模型预测的概率与实际标签,以便在训练过程中调整模型参数以提高准确性。

模型二我们改进后(将在下个版本使用的)

请添加图片描述
它由几个不同的层组成,包括输入层、图像增强层、卷积层、最大池化层、双曲正切激活函数层、全连接层和sigmoid激活函数层,以及二元交叉熵损失层。
以下是对各个层及其功能的详细解释:

  1. 输入层(Dataset: x):这是模型的起始点,表示输入数据的形状为1, 28, 28,通常对应着灰度图像的尺寸。
  2. 图像增强层:这一层负责对输入图像进行增强,例如随机平移,以增加数据的多样性和泛化能力。
  3. 卷积层(核形状:7, 7):卷积层用于提取图像特征,它使用7x7的卷积核对输入图像进行滑动窗口操作,生成新的特征图。
  4. 最大池化层(形状:4, 4):最大池化层用于减小特征图的尺寸,提高计算效率,同时保留最重要的特征。
  5. 双曲正切激活函数层(Tanh):这是一种非线性激活函数,用于给模型引入非线性特性。
  6. 全连接层:全连接层将所有输入节点连接到输出节点,权重和偏差会在训练过程中被优化。
  7. Sigmoid激活函数层:Sigmoid函数将输出映射到0到1之间,适合二分类问题。
  8. 二元交叉熵损失层:这是用于训练过程中的损失函数,用于衡量模型预测结果与真实标签之间的差距。

两个模型对比

模型2与模型1相比,模型2增加了图像增强层和卷积层,以及最大池化层和双曲正切激活函数层。
这些额外的层提供了以下优势:
•图像增强层:通过对输入图像进行随机平移,增强了数据集的多样性,提高了模型的泛化能力,使其更能应对各种情况下的输入。
•卷积层:利用卷积核提取图像特征,减少了人工特征工程的需求,自动学习特征,提高了模型的准确性和效率。
•最大池化层:通过下采样降低了特征图的尺寸,减少了计算量,同时也保留了重要特征。
•双曲正切激活函数层:引入了非线性,使得模型能够学习更复杂的模式。总体来说,模型2比之前的模型1更加复杂且专门针对图像处理任务进行了优化。它能够更好地处理图像数据,特别是对于图像分类任务.

当我们将数据输入输入层时两个模型的工作步骤

模型一

  1. 输入层: 图片的原始像素值会作为输入传递给模型。由于模型的输入层接受1x28x28的图像,图片会被直接送入下一个处理层。
  2. 全连接层(Affine Layer): 输入的图像数据将被展平成一个向量,然后传递给全连接层。在这个层中,每个输入像素值都会乘以对应的权重,并加上一个偏差值,产生一个线性组合。这个线性组合的结果将被传递到下一层。
  3. Sigmoid激活函数层: 在全连接层之后,数据会通过Sigmoid激活函数。Sigmoid函数会将每个线性组合的输出值转换到0和1之间,引入非线性变换,使得模型能够拟合更复杂的决策边界。
  4. 二元交叉熵损失层: 在模型的最后一层,输出值会被视为该图像属于特定类别的概率。如果模型正在训练中,二元交叉熵损失函数会根据预测概率与实际标签的对比来计算损失,指导模型权重和偏差的调整,以最小化预测错误。

模型二

1.输入层: 图片首先会被加载到模型的输入层。因为模型期望的输入形状是1x28x28,这意味着图片会被展平成一个一维数组,长度为28x28 = 784。但是,在这个特定的架构中,由于输入层直接连接到了卷积层,所以图像可能会保持其原始的2D形状(28x28),并且深度为1(因为它是灰度图,只有一个通道)。
2. 图像增强层: 在这个阶段,输入的图像可能会被随机平移,这有助于模型学习到更加鲁棒的特征,即使在轻微的位置变化下也能正确分类。
3. 卷积层: 卷积核(7x7大小)会在图像上滑动,执行点积操作以产生特征图。每个卷积核都会检测图像的不同特征,如边缘、纹理或特定的图案。由于输入图像的大小为28x28,卷积后产生的特征图的大小将取决于卷积核的步长和填充方式。
4. 最大池化层: 最大池化操作会从特征图的每个4x4区域内抽取最大值,从而降低空间维度,减少计算量,并帮助模型对位置变化具有一定的不变性。
5. 双曲正切激活函数层: 激活函数如双曲正切(tanh)会对前一层的输出应用非线性变换,允许模型学习和表示复杂的非线性关系。
6. 全连接层: 在这一步,所有特征图会被展平成一个一维向量,然后输入到一个或多个全连接层中。全连接层中的每一个神经元都与前一层的所有输出相连,这样模型就能整合所有特征图的信息,形成更高层次的抽象表示。
7. Sigmoid激活函数层: 最后一层使用sigmoid函数,将输出压缩到0和1之间,这适用于二分类问题。输出值可以被解释为输入图像属于某个类别的概率。
8. 二元交叉熵损失层: 如果是在训练阶段,损失函数(这里是二元交叉熵)会评估模型的预测与实际标签之间的差异,以便更新权重和偏置,优化模型性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/39456.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

问题集锦1

01.inner中使用JwtTokenUtil.getUserCode() 前端调用上传(java),上传使用加购 Overridepublic Boolean insertShoppingCart(InsertShoppingCartParamsDto dto) {// 通过userCode,itemCode和supplierCode来判断当前加购人添加到购物车的商品是…

51单片机第23步_定时器1工作在模式0(13位定时器)

重点学习51单片机定时器1工作在模式0的应用。 在51单片机中,定时器1工作在模式0,它和定时器0一样,TL1占低5位,TH1占高8位,合计13位,也是向上计数。 1、定时器1工作在模式0 1)、定时器1工作在模式0的框图…

前端知识点

HTML、CSS 相关 1、 BFC 1、BFC 是什么? BFC(Block Formatting Context) 格式化上下文; 指一个独立的渲染区域,或者说是一个隔离的独立容器;可以理解为一个独立的封闭空间。无论如何不会影响到它的外面 …

贪心+后缀和,CF 1903C - Theofanis‘ Nightmare

一、题目 1、题目描述 2、输入输出 2.1输入 2.2输出 3、原题链接 1903C - Theofanis Nightmare 二、解题报告 1、思路分析 我们任意一种分组其实都是若干个后缀和相加 比如我们分成了三组,第一组的数被加了一次,第二组的数被加了两次,第…

JDK动态代理-AOP编程

AOPTest.java,相当于main函数,经过代理工厂出来的Hello类对象就不一样了,这是Proxy.newProxyInstance返回的对象,会hello.addUser会替换为invoke函数,比如这里的hello.addUser("sun", "13434");会…

Web3 ETF 的软件开发框架

Web3 ETF 的软件开发框架主要包含以下几个方面,需要说明的是,Web3 ETF 仍处于早期发展阶段,相关技术和标准尚未成熟。在开发 Web3 ETF 时,需要谨慎评估风险,并做好安全防范措施。北京木奇移动技术有限公司,…

基于python的随机森林回归预测+贝叶斯优化超参数前后训练效果对比

目录 1.导入必要的库 2.导入数据与数据预处理 3.查看数据分布 4.特征选择 5.模型建立与训练 6.训练集预测结果 7.模型评估 8.预测新数据 9.贝叶斯优化超参数 1.导入必要的库 # 导入所需的库 from sklearn.model_selection import cross_val_score import pandas as …

【SkiaSharp绘图14】SKCanvas方法详解(三)URL注释、按顶点绘制、 是否裁切区域之外、旋转、缩放、倾斜、平移、保存/恢复画布

文章目录 SKCanvas方法DrawUrlAnnotation 绘制URL注释DrawVertices 按顶点绘制Flush 立即绘制QuickReject 判断区域是否在裁切区域之外ResetMatrix重置矩阵Restore、RestoreToCountRotateDegrees按角度旋转画布RotateRadians按弧度旋转画布SaveLayer保存并新建图层Scale 缩放画…

Python协作运动机器人刚体力学解耦模型

🎯要点 🎯腿式或固定式机器人模型 | 🎯网格、点云和体素网格碰撞检测 | 🎯正反向运动学和动力学 | 🎯机器人刚体力学计算 | 🎯编辑参考系姿势和路径 | 🎯软件接口实体机器人模拟 | &#x1f3a…

分子AI预测赛Task2笔记

下面所述比较官方的内容都来自官方文档 ‍‌⁠‌‍​​​‌​​⁠​​​​​​​​‍‬​​‍⁠‍‍​​‬​‌​​​‌‍‬​​​​​​‍‌Task2:赛题深入解析 - 飞书云文档 (feishu.cn) 赛题背景 强调了人工智能在科研领域&…

苹果电脑废纸篓数据被清空了,有什么方法可以恢复吗?

使用电脑的用户都知道,被删除的文件一般都会经过回收站,想要恢复它直接点击“还原”就可以恢复到原始位置。mac电脑同理也是这样,但是“回收站”在mac电脑显示为“废纸篓”。 苹果电脑废纸篓数据被清空了,有什么方法可以恢复吗&am…

java反射和注解

反射 获取class对象的三种方法 ①:Class.forName("全类名"); ②:类名.class ③:对象.getclass(); 代码样例 package com.ithema;public class Main {public static void main(String[] args) throws ClassNotFoundException {//第…

基于Canvas的Html5多时区动态时钟实战

目录 前言 一、关于Canvas技术 1、Canvas是什么 2、Canvas的属性及渲染特性 二、Canvas动态多时区展示 1、新建html页面 2、创建Canvas对象 3、绘制所有的时钟 总结 前言 出差旅行相信大家一定会住酒店,大家在酒店的前台进行预订的时候,是不是都…

centos执行yum相关命令报错的可能原因

文章目录 1. 执行yum命令是报下面一大帕拉2. 安装某个包报错,找不到这个包 1. 执行yum命令是报下面一大帕拉 最后一行报错,在repo文件中找不到空baseurl:xxx / x86_64 执行这行命令把这个找不到的 xxx 禁掉即可sudo yum-config-manager --di…

【项目日记(三)】搜索引擎-搜索模块

❣博主主页: 33的博客❣ ▶️文章专栏分类:项目日记◀️ 🚚我的代码仓库: 33的代码仓库🚚 🫵🫵🫵关注我带你了解更多项目内容 目录 1.前言2.项目回顾3.搜索流程3.1分词3.2触发3.3去重3.4排序3.5包装 4.总结 1.前言 在前…

虚拟机USB——解决每次插U盘都得选择连接到主机还是虚拟机问题

虚拟机USB——解决每次插U盘都得选择连接到主机还是虚拟机问题 1.编辑–>首选项–> 2.如果想每次插U盘都连接到主机就选“将设备连接到主机” 如果想每次插U盘都进行选择,就选择“询问要执行的操作”

在 Mac 上使用 本地 LLM 文本终结

我们可使用本地大型语言模型,如Mistral、Llama等,来给文本做总结,相比在线的 Kimi ,ChatGPT, 我们不用担心数据泄露,因为整个操作都是在本地电脑完成的。 我们用 ollama 举例 首先安装 ollama https://ol…

数组-二分查找

二分查找 leetcode704 /*** param {number[]} nums* param {number} target* return {number}*/ var search function(nums, target) {let left 0, right nums.length - 1;while (left < right) {const mid Math.floor((right - left) / 2) left;const num nums[mid]…

SpringSecurity中文文档(体系结构).md

体系结构&#xff08;Architecture&#xff09; 本节讨论基于 Servlet 的应用程序中 Spring Security 的高级体系结构。我们将在参考文献的身份验证、授权和防止利用部分中构建这种高层次的理解。 过滤器的综述 &#xff08;A Review of Filters&#xff09; Spring Securit…

实现WebSocket聊天室功能

实现WebSocket聊天室功能 什么是WebSocket&#xff1f;WebSocket的工作原理服务器端实现客户端实现 在现代Web开发中&#xff0c;实时通信已经变得越来越重要。传统的HTTP协议由于其无状态和单向通信的特点&#xff0c;无法很好地满足实时通信的需求。而WebSocket协议则应运而生…