【AI】卷积神经网络CNN

不定期更新,建议关注收藏点赞。


目录

  • 零碎小组件
  • 经验总结
  • 早期的CNN

零碎小组件

  • 全连接神经网络
    目前已经被替代。
    每个神经元都有参与,但由于数据中的特征点变化大,全连接神经网络把所有数据特征都学习了,故效果不好。
  • 感受野:影响CNN特征的输入图像的区域
  1. 感受野并非越大越好。CNN就是获取局部信息,达到提高特征有效性。
  2. 实际感受野远小于理论感受野。因为感受野中的每个元素(像素)对输出单元的贡献不相同,实际上符合高斯分布,越边缘的贡献越小。
    比如,可视化以下算法的感受野
    在这里插入图片描述
    • 如何增大感受野?CNN中可以堆叠卷积层,这个结论通过VGG得到,2个33的卷积=1个55的卷积;改变初始权重,使得卷积核中心的权值更小,边缘的权值更大,但不能改变本质是高斯分布;使用可变形卷积+扩张卷积,改变之前CNN每个单元连接到局部矩形卷积窗口,使用相同数量的连接将每个单元稀疏连接到更大的底层区域。
  • 全局特征 v.s. 局部特征 ,低级特征v.s. 高级特征 在DL中都指代什么
  • vision transormer理论上比cnn好在哪里?在所有的任务上都好吗?

经验总结

  1. 代码不一定都要重写,东西不变故事变也是可以的
  2. 深度学习中 特色的形状 不同的样子很重要,而不是纠结几个卷积几个池化,从VGG之后开始转向这一点
  3. 要知道之前历史中的工作成果是哪些,弄清楚figure out

早期的CNN

  • LeNet5
    在这里插入图片描述
    输入(HWC):灰度图 32321
    模型组成:conv+pooling+FC(激活函数)
    应用场景:手写字符的识别与分类
    特点:用conv替代MLP(Multilayer Perceptron)极大降低参数量;通过池化进一步降低参数量,max和avg两种;同时提高了识别率

目前pooling用的比较少,因为丢失信息多

扩展:池化的反向传播是怎么处理的?

  • VGG16
    在这里插入图片描述

特点:

  1. 结构非常简洁,整个网络都使用了相同大小的卷积核33,和最大池化尺寸22
  2. 几个小滤波器33卷积层比一个大滤波器55或77卷积层好。因为2个33的卷积是有多个非线形层的多次整合,肯定比一次单次的好
  3. 验证适度加深网络结构可以提升性能。(不是越深越好,见后面Resnet)
  4. 耗费大量计算资源,使用更多的参数,占用140M内存,绝大多数参数来自FC
  • ResNet
    特点:
  1. 验证了模型深到一定程度效果不升反降,称为degradation;但这并不能用过拟合(训练误差小、测试误差大)来解释,因为这个模型训练误差和测试误差都很大;原因也不是梯度消失->0或爆炸,不会消失是因为模型中加上Batch Normalization BN归一化层控制每层输入的模值,不会爆炸是因为容易切割减小;由于非线性激活函数Relu使得输入到输出过程是不可逆的存在信息损失,每一层都会改变学习分布,对于通道数少的特征层需要扩张到5~30倍再Relu压缩才能保持信息。
  2. 在原有的上进行查漏补缺比重新学简单,进行跳接shortcut connection,通过跳接在激活函数前,将上几层之前的输出与本层计算输出相加,结果输入到激活函数中作为本层输出。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/68176.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微信小程序~电器维修系统小程序

博主介绍:✌程序猿徐师兄、8年大厂程序员经历。全网粉丝15w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇…

LLAMA-Factory安装教程(解决报错cannot allocate memory in static TLS block的问题)

步骤一: 下载基础镜像 # 配置docker DNS vi /etc/docker/daemon.json # daemon.json文件中 { "insecure-registries": ["https://swr.cn-east-317.qdrgznjszx.com"], "registry-mirrors": ["https://docker.mirrors.ustc.edu.c…

Java高频面试之SE-18

hello啊,各位观众姥爷们!!!本baby今天又来了!哈哈哈哈哈嗝🐶 BIO NIO AIO的区别? 在 Java 网络编程中,BIO、NIO 和 AIO 是三种不同的 I/O 模型,它们的核心区别在于 阻塞…

蓝桥杯刷题DAY3:Horner 法则 前缀和+差分数组 贪心

所谓刷题,最重要的就是细心 📌 题目描述 在 X 进制 中,每一数位的进制不固定。例如: 最低位 采用 2 进制,第二位 采用 10 进制,第三位 采用 8 进制, 则 X 进制数 321 的十进制值为&#xff…

BUU24 [GXYCTF2019]BabyUpload 1

开局上传文件 上传muma.php 上传.htaccess文件也被打回 再次求助互联网,才发现这提示给的多么明显,上传.htaccess文件是检查文件类型(Contnet-Type),上传muma.php是检查后缀里头有没有ph ,检查文件类型那…

RabbitMQ 从入门到精通:从工作模式到集群部署实战(三)

文章目录 使用CLI管理RabbitMQrabbitmqctlrabbitmq-queuesrabbitmq-diagnosticsrabbitmq-pluginsrabbitmq-streamsrabbitmq-upgraderabbitmqadmin 使用CLI管理RabbitMQ RabbitMQ CLI 工具需要安装兼容的 Erlang/OTP版本。 这些工具假定系统区域设置为 UTF-8(例如en…

3.攻防世界 weak_auth

题目描述提示 是一个登录界面,需要密码登录 进入题目页面如下 弱口令密码爆破 用1 or 1 #试试 提示用admin登录 则尝试 用户名admin密码:123456 直接得到flag 常用弱口令密码(可复制) 用户名 admin admin-- admin or -- admin…

优化深度神经网络

训练集、开发集(验证集)、测试集 偏差与方差 正则化 L2正则 Dropout 随机丢弃部分神经元输入,经常用于计算机视觉的神经网络内,因为通常没有足够的训练数据,很容易出现过拟合的问题 数据增强 训练集规一化 可以使其图像更均匀,…

【玩转 Postman 接口测试与开发2_018】第14章:利用 Postman 初探 API 安全测试

《API Testing and Development with Postman》最新第二版封面 文章目录 第十四章 API 安全测试1 OWASP API 安全清单1.1 相关背景1.2 OWASP API 安全清单1.3 认证与授权1.4 破防的对象级授权(Broken object-level authorization)1.5 破防的属性级授权&a…

Spring @PropertySource:让你的应用配置更加模块化和可维护

PropertySource注解在Spring中的作用,就像是给Spring应用配了一个“外部配置箱”。 想象一下,你在开发一个Spring应用时,有很多配置信息需要设置,比如数据库的连接信息、应用的某些功能开关等。如果这些信息都硬编码在代码中&…

RK3576——USB3.2 OTG无法识别到USB设备

问题:使用硬盘接入到OTG接口无热插拔信息,接入DP显示屏无法正常识别到显示设备,但是能通过RKDdevTool工具烧录系统。 问题分析:由于热插拔功能实现是靠HUSB311芯片完成的,因此需要先确保HUSB311芯片驱动正常工作。 1. …

docker-compose 配置nginx

前言 前端打包的dist文件在宿主机,nginx运行在docker-compose 问题 nginx.conf 在本地配置可以生效,但是链接到容器就报错 基于本地的nginx运行,本地nginx.conf 如下 server {listen 8081;location / {root /usr/local/software/testweb/…

基于SpringBoot+ Vue的家教管理系统

随着互联网技术的发展,信息化管理已经深入到各个行业中。在教育领域,家教管理系统的需求日益增长。传统的手工管理方式在面对大量信息时,容易出现管理效率低下、数据错误率高、修改困难等问题。本文将介绍基于Spring Boot框架、MySQL数据库开…

【数据结构】树哈希

目录 一、树的同构1. 定义2. 具体理解(1) 结点对应(2) 孩子相同(3) 递归性质 3. 示例 二、树哈希1.定义2.哈希过程(1)叶节点哈希(2)非叶节点哈希(3)组合哈希值 3.性质(1) 唯一性 \re…

使用DeepSeek的技巧笔记

来源:新年逼自己一把,学会使用DeepSeek R1_哔哩哔哩_bilibili 前言 对于DeepSeek而言,我们不再需要那么多的提示词技巧,但还是要有两个注意点:你需要理解大语言模型的工作原理与局限,这能帮助你更好的知道AI可完成任务…

【工具篇】ChatGPT:开启人工智能新纪元

一、ChatGPT 是什么 最近,ChatGPT 可是火得一塌糊涂,不管是在科技圈、媒体界,还是咱们普通人的日常聊天里,都能听到它的大名。好多人都在讨论,这 ChatGPT 到底是个啥 “神器”,能让大家这么着迷?今天咱就好好唠唠。 ChatGPT,全称是 Chat Generative Pre-trained Trans…

【centOS】搭建公司内网git环境-GitLab 社区版(GitLab CE)

1. 安装必要的依赖 以 CentOS 7 系统为例,安装必要的依赖包: sudo yum install -y curl policycoreutils openssh-server openssh-clients postfix sudo systemctl start postfix sudo systemctl enable postfix2. 添加 GitLab 仓库 curl -sS https:/…

开源 GPU 集群管理器 GPUStack 轻松拉起deepseek各版本模型

GPUStack 是一个用于运行 AI 模型的开源 GPU 集群管理器。 项目地址:gpustack/gpustack: Manage GPU clusters for running AI modelshttps://github.com/gpustack/gpustackhttps://github.com/gpustack/gpustackhttps://github.com/gpustack/gpustackhttps://githu…

ESP32开发学习记录---》GPIO

she 2025年2月5日,新年后决定开始充电提升自己,故作此记,以前没有使用过IDF开发ESP32因此新年学习一下ESP32。 ESPIDF开发环境配置网上已经有很多的资料了,我就不再赘述,我这里只是对我的学习经历的一些记录。 首先学习一个…

3-kafka服务端之控制器

文章目录 概述控制器的选举与故障恢复控制器的选举故障恢复 优雅关闭分区leader的选举 概述 在Kafka集群中会有一个或多个broker,其中有一个broker会被选举为控制器(Kafka Controler),它负责管理整个集群中所有分区和副本的状态。…