水面垃圾清理机器人的视觉算法研究

       卷积神经网络是一种分层的数据表示模型,通常由数据输入层、卷积层、池化层、 非线性激活函数、全连接层以及输出结果预测层等组成,其中卷积层、池化层和非线 性激活函数是卷积神经网络中的重要组成部分。此外,有些模型会增加其他的层(归一 化层等)以满足系统特定功能需求。卷积网络以各个单层为基础,按照一定的规律,一 层一层堆叠,卷积神经网络就可以逼近各种复杂函数的空间分布。

  1. 卷积层

滤波器(也称为卷 积核),滤波器的数量越多,卷积神经网络的深度越深。卷积 层的设计和参数设置,对于卷积神经网络的性能具有重大影响。

卷积核多大,输出就多大。

2.非线性激活函数

       设计卷积神经网络时,以激活函数作为卷积层下一步的运算,可以兼顾计算的 简单性和网络的灵活性。卷积层计算是所有前一层输入的线性组合,这里的激活函数 则是计算所有输入值与非线性激活函数的乘积,这样的安排能够降低网络的运算复杂 度,兼容非线性组合运算。

       要激活函数中包含充分的梯度信息,以便于能从输入的数据中 捕获更多的信息。

       常用的激活函数是 Sigmoid 函 数、ReLU(Rectified Linear Unit,ReLU)函数以SiLU(Sigmoid Linear Unit, SiLU) 函数等,这些函数有更好的光滑性,被广泛应用于卷积神经网络。

3.池化层

池化层的工作原理是定 义多个池化核进行池化运算,池化核的主要参数也包含池化核大小等。

最大池化突出局部区域中最重要的信息,而平均池化 更关注于局部区域的平均效果。

4.卷积神经网络的训练

卷积神经网络工作流程,可分为训练阶段和预测阶段两个阶段。卷积神经网络的 工作流程可分为训练阶段和预测阶段。以图像分类为例,在预测阶段,网络通过卷积 层、激活函数、池化层等操作对数据进行前向计算,从而获取不同的特征图,如相对 简单的纹理特征和更加丰富、抽象的语义信息,最后整合这些特征信息,并执行推理 以获取结果;在训练阶段,利用反向传播算法、损失函数、优化算法,使网络有效学 习图像相关特征及相应映射关系。网络的训练和预测阶段涉及不同的操作和方法,但 都是卷积神经网络的重要组成部分。

5.反向传播算法

误差反向传播算法(Backpropagation,BP)是训练人工神经网络最主要的方法。

6.损失函数

       常见的损失函数有均方误差损失函数、交叉熵损失函数和基于 IOU(Intersection over Union, IOU)的系列损失函数,网络中为更新损失函数(Loss Function)的相关参数, 需要进行偏导计算,通过计算损失函数得到损失值,该值将衡量预测值与真实值之间 的差距。

7.优化算法

       常见的优化算法有 SGD 算法[48]、Momentum 算法[49]以及 Nesterov 算法等,梯度下 降法是深度学习模型最常用的优化算法。

8.基于卷积神经网络的目标检测

目标检测是一种应用广泛的计算机视觉技术,能够对图片、视频中的目标进行分 类和定位,基于卷积神经网络的目标检测算法主要分为 Two-stage 和 One-stage 两种类 型。 Two-stage 算法会先生成一些候选框,再对每个候选框进行分类和定位优化。虽然 它们的准确率通常较高,但需要更多时间和计算资源。而 One-stage 算法则能在特征解码时,一并生成目标所属的种类和区域信息,在执行速度上更具优势,近年来已不断 优化,在检测精度比肩甚至超过了 Two-stage 算法。常见的 Two-stage 算法有 RCNN 系 列,如 R-CNN、Fast-RCNN、Faster-RCN等;常见的 One-stage算法有 YOLO系 列,如 YOLOv1~v8 和 YOLOX 等

9.基于卷积神经网络的图像分割

       采用卷积神经网络进行特征提取,使用反卷积层进行特征恢复,从而实现对图像深层语 义的理解和精确的像素级别分割。其中,三种常见的语义分割模型包括:FCN、UNet 和 DeepLab。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/8509.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

白话机器3:PCA与SVM详细数学原理

一、PCA数学原理 1.数据标准化 首先,需要对原始数据进行标准化处理,使得每个特征的均值为0,方差为1。假设有一个的数据矩阵X,其中每一列是一个样本,每一行是一个特征。 标准化公式如下: 其中,…

TCP四次挥手中为什么 TIME_WAIT 等待的时间是 2MSL?

TCP 连接断开 1、TCP 四次挥手过程是怎样的?如下图 2、为什么 TIME_WAIT 等待的时间是 2MSL? MSL 是 Maximum Segment Lifetime,报文最大生存时间,它是任何报文在网络上存在的最长时间,超过这个时间报文将被丢弃。因…

C中将其他类型转换为字符类型

函数sprintf 头文件#include <stdio.h> 函数原型如下&#xff1a; int sprintf(char *str, const char *format, ...);参数说明&#xff1a; str: 指向一个字符数组的指针&#xff0c;该数组将接收格式化后的字符串。format: 一个格式字符串&#xff0c;用于指定如何…

CMakeLists.txt语法规则:改变行为的变量说明一

一. 简介 前面一篇文章学习了 CMakeLists.txt语法中的 部分常量变量&#xff0c;具体学习提供信息的变量&#xff0c;文章如下&#xff1a; CMakeLists.txt语法规则&#xff1a;提供信息的变量说明一-CSDN博客 CMakeLists.txt语法规则&#xff1a;提供信息的变量说明二-CSD…

文件加密软件排行榜前四名|好用的四款文件加密软件分享

在数据泄露事件频发的今天&#xff0c;文件加密软件成为了保护个人隐私与企业信息安全的必备工具。 选择一款高效、可靠且易用的加密软件至关重要。 本文精选了当前市场上备受好评的十款文件加密软件&#xff0c;旨在为您在数据保护之旅中提供方向。 1.域智盾 域智盾软件是一…

[报错解决]Communications link failure

报错 主机IDEA项目连接虚拟机的数据库报错。 主要报错信息有&#xff1a; com.mysql.cj.jdbc.exceptions.CommunicationsException: Communications link failure The last packet sent successfully to the server was 0 milliseconds ago. The driver has not received a…

论文阅读】 ICCV-2021-3D Local Convolutional Neural Networks for Gait Recognition

motivation :现有方法方法无法准确定位身体部位&#xff0c;不同的身体部位可以出现在同一个条纹(如手臂和躯干)&#xff0c;一个部分可以出现在不同帧(如手)的不同条纹上。其次&#xff0c;不同的身体部位具有不同的尺度&#xff0c;即使是不同帧中的同一部分也可以出现在不同…

web后端——netbeans ide +jsp+servlet开发学习总结

目录 jsp基础 netbeans开发工具问题HTTP Status 405 - HTTP method POST is not supported......netbeans 提示无法启动GlassFish Server 4.1.1:服务器未运行时, HTTP 或 HTTPS 监听程序端口已被占用404 问题netbeans中项目中有多个html文件,如何单独运行某个文件&#xff1f;n…

O2O:Uni-O4

ICLR 2024 paper Intro 以往O2O方式普遍将离线与在线过程分开看待&#xff0c;为了避免过渡时容易出现performance drop&#xff0c;引入了各式正则化或者保守价值估计。本文启发于BPPO&#xff0c;提出on-policy的算法Uni-O4将离线与在线阶段的策略优化目标统一&#xff0c;…

【网络】滑动窗口和拥塞窗口

滑动窗口和拥塞窗口是TCP协议中两个重要的窗口概念&#xff0c;它们分别用于流量控制和拥塞控制&#xff0c;在功能和作用上有所不同。 滑动窗口&#xff08;Sliding Window&#xff09; 滑动窗口是用于流量控制的机制&#xff0c;它定义了发送方和接收方之间的数据传输量。T…

制造业为什么需要质量管理系统

质量管理是一个企业最重要的核心竞争力之一。为了确保产品和服务的高质量&#xff0c;企业需要建立一个完善的质量管理体系。而质量管理系统&#xff08;QMS&#xff09;正是指导企业如何规范、组织和管理质量相关活动的框架和流程。 在智能制造时代&#xff0c;广大企业如何结…

react状态管理之state

第三章 - 状态管理 随着你的应用不断变大&#xff0c;更有意识的去关注应用状态如何组织&#xff0c;以及数据如何在组件之间流动会对你很有帮助。冗余或重复的状态往往是缺陷的根源。在本节中&#xff0c;你将学习如何组织好状态&#xff0c;如何保持状态更新逻辑的可维护性&…

《编译原理》阅读笔记:p1-p3

《编译原理》学习第 1 天&#xff0c;p1-p3总结&#xff0c;总计 3 页。 一、技术总结 1.compiler(编译器) p1, But, before a program can be run, it first must be translated into a form in which it can be executed by a computer. The software systems that do thi…

2023年谷歌拒了228万应用,禁了33.3万账号,开发者们应如何应对2024的挑战?

谷歌在上周一公布了去年如何应对恶意应用和恶意行为。 报告指出&#xff0c;去年谷歌在Google Play平台上&#xff0c;通过不断升级安全系统、更新政策规定、运用先进的机器学习技术&#xff0c;以及严格把关应用审核流程&#xff0c;成功阻止了高达228万个不合规的应用程序上架…

【算法】动态规划之DP问题(5.10更新完)

前言&#xff1a; 本系列是看的B站董晓老师所讲的知识点做的笔记 董晓算法的个人空间-董晓算法个人主页-哔哩哔哩视频 (bilibili.com) 树塔-记忆化搜索 特点&#xff08;前提&#xff09;&#xff1a;从上向下的累加和是不能重复使用的&#xff0c;从下向上的累加和是可以重…

力扣41. 缺失的第一个正数

Problem: 41. 缺失的第一个正数 文章目录 题目描述思路复杂度Code 题目描述 思路 1.将nums看作为一个哈希表&#xff0c;每次我们将数字n移动到nums[n - 1]的位置(例如数字1应该存在nums[0]处…),则在实际的代码操作中应该判断nums[i]与nums[nums[i] - 1]是否相等&#xff0c;若…

Rancher Deployment (Helm)

文章目录 Rancher Deployment (Helm)前期准备创建stl证书 Rancher 部署登录 Rancher Deployment (Helm) 前期准备 创建stl证书 # 模拟域名&#xff0c;公司可以申请内部域名 # VIP bigdata.harbor.com # 10.83.195.250 bigdata.rancher.com# 一般使用公司证书&#xff0c;模…

【管理咨询宝藏96】企业数字化转型的中台战略培训方案

本报告首发于公号“管理咨询宝藏”&#xff0c;如需阅读完整版报告内容&#xff0c;请查阅公号“管理咨询宝藏”。 【管理咨询宝藏96】企业数字化转型的中台战略培训方案 【格式】PDF版本 【关键词】SRM采购、制造型企业转型、数字化转型 【核心观点】 - 数字化转型是指&…

Web3 ETF软件开发

开发Web3 ETF软件涉及到金融、法律和技术等多个领域的专业知识&#xff0c;因此存在以下技术难点&#xff0c;开发Web3 ETF软件是一项复杂的技术挑战&#xff0c;需要综合考虑各种因素。开发人员需要具备较强的技术能力和跨学科知识才能成功开发Web3 ETF软件。北京木奇移动技术…

WEB基础--JDBC基础

JDBC简介 JDBC概述 数据库持久化介绍 jdbc是java做数据库持久化的规范&#xff0c;持久化(persistence)&#xff1a;把数据保存到可掉电式存储设备(断电之后&#xff0c;数据还在&#xff0c;比如硬盘&#xff0c;U盘)中以供之后使用。大多数情况下&#xff0c;特别是企业级…