【动手学深度学习】6.4 多输入多输出通道

  • 彩色图像具有标准的RBG通道来代表红绿蓝,但是到目前位置我们仅展示了单个输入和单个通道的简化例子。这使得我们可以将输入,卷积核和输出看作二维张量
  • 而当我们添加通道时,输入和隐藏表示都变成了三维张量。例如每个RGB输入图像都具有 3 × h × w 3×h×w 3×h×w 的形状,我们将这个大小为 3 的轴称为通道维度

1. 多输入通道

  • 当输入包含多个通道时,需要构造一个与输入数据具有相同输入通道数的卷积核,以便与输入数据进行互相关运算
  • 我们对不同的通道之间分别进行互相关运算如下所示
    在这里插入图片描述
  • 我们下面尝试用代码来进行实现
    在这里插入图片描述
  • 下面进行验证
    在这里插入图片描述

2. 多输出通道

  • 到目位置,不论有多少输入通道,我们都只有一个输出通道,但是每一层有多个输出通道是很重要的

  • 在最流行的神经网络架构中,随着层数的加深,我们常会增加输出通道的维数,通过减少空间分辨率以获得更大的通道深度

  • 直观解释就是:我们将每个通道看作对不同特征的响应,而现实可能更复杂一些,因为每个通道不是独立学习的,而是为了共同使用而优化的。因此多输出通道并不仅仅是学习多个单通道的检测器

  • c i c_i ci c 0 c_0 c0 分别表示输入和输出的通道数目,并让 k h k_h kh k w k_w kw 为卷积核的高度和宽度。为了获得多通道的输出,我们可以为每一个输出通道创建一个形状为 c i × k h × k w c_i×k_h×k_w ci×kh×kw 的卷积核张量,这样卷积核的形状就变成了 c 0 × c i × k h × k w c_0×c_i×k_h×k_w c0×ci×kh×kw,即每个输出通道都有 c i × k h × k w c_i×k_h×k_w ci×kh×kw 的卷积核

  • 每个输出通道先获取所有输入通道,再以对应该输出通道的卷积核计算出结果

  • 下面我们实现一个计算多个通道的输出的互相关函数
    在这里插入图片描述

  • 下面介绍torch.stack
    在这里插入图片描述
    在这里插入图片描述

  • 我们对 K 进行堆叠来制造多个输出
    在这里插入图片描述

  • 对输入张量 X 和 卷积核张量 K 进行互相关运算。现在的输出包含三个通道,第一个通道的结果与先前输入张量 X 和多输出单通道结果一致
    在这里插入图片描述


3. 1 × 1 1×1 1×1 卷积层

  • 1 × 1 1×1 1×1 卷积看起来似乎没多大意义。毕竟,卷积的本质是有效提取相邻像素间的相关特征,而 1 × 1 1×1 1×1 卷积显然没有此作用。
  • 但是, 1 × 1 1×1 1×1 仍然十分流行,经常包含在复杂深层网络的设计中,下面我们来解读它的实际作用
    在这里插入图片描述
  • 下图展示了使用 1 × 1 1×1 1×1 卷积层与三个输出通道和两个输入通道的互相关计算。这里的输入和输出具有相同的宽度和高度,输出中的每个元素都是从输入图像中同一位置元素的线性组合
  • c i c_i ci 个输出值转换为 c 0 c_0 c0 个输出值。因为这仍然是一个卷积层,所以跨像素的权重是一致的。此时卷积层的权重为 c 0 × c i c_0×c_i c0×ci 再加上一个偏置,这一点有点像MLP
    在这里插入图片描述
  • 我们尝试用全连接层实现 1 × 1 1×1 1×1 卷积
    在这里插入图片描述
  • 当执行 1 × 1 1×1 1×1 运算时,上述函数相当于先前实现的互相关函数 corr2d_multi_in_out,验证如下在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/56181.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

QD1-P5 HTML 段落标签(p)换行标签(br)

本节视频 www.bilibili.com/video/BV1n64y1U7oj?p5 ‍ 本节学习 HTML 标签&#xff1a; p标签 段落br标签 换行 ‍ 一、p 标签-段落 1.1 使用 p 标签划分段落 <p>段落文本</p>示例 <!DOCTYPE html> <html><head><meta charset"…

Windows11系统下Sentinel环境搭建教程

目录 前言Sentinel简介Sentinel下载安装Sentinel配置与启动总结 前言 本文为博主在项目环境搭建时记录的Sentinel安装流程&#xff0c;希望对大家能够有所帮助&#xff0c;不足之处欢迎批评指正&#x1f91d;&#x1f91d;&#x1f91d; Sentinel简介 github主页地址 &#x…

电脑查不到IP地址是什么原因?怎么解决

在日常使用电脑的过程中&#xff0c;有时会遇到无法查询到电脑IP地址的情况&#xff0c;这可能会影响到网络的正常使用。本文将探讨电脑查不到IP地址的可能原因&#xff0c;并提供相应的解决方案。 一、原因分析 ‌网络连接问题‌&#xff1a;首先&#xff0c;网络连接不稳定或…

中间件:SpringBoot集成Redis

一、Redis简介 Redis是一个开源的、基于内存的数据结构存储系统&#xff0c;它可以用作数据库、缓存和消息中间件。Redis支持多种类型的数据结构&#xff0c;如字符串&#xff08;strings&#xff09;、哈希&#xff08;hashes&#xff09;、列表&#xff08;lists&#xff09…

服务器数据恢复—EMC存储RAID5磁盘阵列数据恢复案例

服务器数据恢复环境&#xff1a; 一台EMC某型号存储设备&#xff0c;该存储中有一组由12块&#xff08;包括2块热备盘&#xff09;STAT硬盘组建的raid5阵列。 服务器故障&#xff1a; 该存储在运行过程中突然崩溃&#xff0c;raid瘫痪。数据恢复工程师到达现场对故障存储设备进…

点云数据与多相机图像融合实现3D场景的彩色可视化

引言 在现代3D计算机视觉和机器人感知领域&#xff0c;点云数据和图像信息的融合正变得越来越重要。点云数据提供了精确的几何结构&#xff0c;而图像则包含了丰富的颜色和纹理细节。将这两种数据源结合起来&#xff0c;我们能够创建更加逼真和信息丰富的3D场景表示。本文将深…

Django学习笔记之Django基础学习

Django笔记 提示&#xff1a;这里可以添加系列文章的所有文章的目录&#xff0c;目录需要自己手动添加 例如&#xff1a;第一章 Python 机器学习入门之pandas的使用 提示&#xff1a;写完文章后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录…

剧场的客户端形式区别,APP,小程序,H5的不同优势以及推广方案

剧场的客户端形式区别与推广策略 在数字化时代&#xff0c;剧场的线上化成为大势所趋。不同的线上平台如APP、小程序和H5各有千秋&#xff0c;如何选择最适合自己的平台&#xff0c;并制定有效的推广方案&#xff0c;成为了剧场管理者需要考虑的重要问题。 APP&#xff1a;深度…

nn.functional.softmax(X, dim=-1)

dim-1表示在最后一个维度&#xff08;大概率是一行&#xff09;应用Softmax函数&#xff0c;将值标准化为概率分布。 实例 假设我们有一个张量X&#xff0c;形状为&#xff08;2&#xff0c;3&#xff09;&#xff0c;内容如下&#xff1a; import torch import torch.nn.…

vite 打包前请求接口和打包后的不一致

在使用 Vite 进行项目打包时&#xff0c;如果发现打包前请求接口和打包后的行为不一致&#xff0c;这可能是由于多种原因导致的。以下是一些可能的原因和相应的解决方案&#xff1a; 1. 代理配置问题 开发环境&#xff1a;在开发环境中&#xff0c;Vite 通常使用 vite.config…

【AIGC】OpenAI API在快速开发中的实践与应用:优化ChatGPT提示词Prompt加速工程

博客主页&#xff1a; [小ᶻZ࿆] 本文专栏: AIGC | ChatGPT 文章目录 &#x1f4af;前言&#x1f4af;使用最新型号确保最佳实践利用最新模型进行高效任务处理为什么要选择最新模型&#xff1f;结论 &#x1f4af;指令与上下文的分隔最佳实践分隔指令和上下文的重要性使用符…

univer实现excel协同

快速入门 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document</title><script src&q…

【分布式微服务云原生】 探索SOAP协议:简单对象访问协议的深度解析与实践

探索SOAP协议&#xff1a;简单对象访问协议的深度解析与实践 摘要&#xff1a; 在现代分布式系统中&#xff0c;SOAP&#xff08;简单对象访问协议&#xff09;扮演着至关重要的角色&#xff0c;提供了一种标准化的方式来实现不同系统间的通信。本文深入探讨了SOAP的工作原理、…

无线费控智能水表:智能生活的守护者

在当今智能化日益普及的时代&#xff0c;无线费控智能水表作为一项重要的技术创新&#xff0c;正在逐步改变我们的生活方式。它不仅能够实现远程抄表&#xff0c;自动计费&#xff0c;还能有效监控用水情况&#xff0c;促进水资源的合理利用&#xff0c;是现代城市智慧化管理不…

如何在 cPanel 中使用 PHP-FPM

PHP性能一直是影响网站托管的一个重要问题。PHP是当前网络上使用最广泛的服务器编程语言&#xff0c;远远领先于其他语言。最受欢迎的内容管理系统和电子商务应用程序&#xff0c;如WordPress、Joomla、Drupal、Magento等&#xff0c;都是用PHP编写的。 PHP-FPM加速了在繁忙服务…

【微信小程序_10_wxss模板中的内边距与外边距】

摘要:本文介绍了微信小程序开发中内边距(padding)和外边距(margin)的概念及作用。内边距是元素内容与边框间的距离,可调整文字与边框的间隔;外边距是元素边框与相邻元素间的距离,用于控制元素间隔及实现水平居中。合理运用这两个属性可实现美观、合理的页面设计。 微信…

计算机毕设选题推荐【基础功能+创新点】【Python方向】

以下是50条精选Python方向的毕业设计选题&#xff0c;每个选题包含基础功能和创新功能&#xff0c;涵盖多样化的应用场景&#xff0c;以帮助计算机专业学生完成毕业设计。 1. 基于Python的个人理财管理系统 基础功能&#xff1a;用户注册与登录、支出记录管理、收入记录管理、…

Debezium系列之:实时从TDengine数据库采集数据到Kafka Topic

Debezium系列之:实时从TDengine数据库采集数据到Kafka Topic 一、认识TDengine二、TDengine Kafka Connector三、什么是 Kafka Connect?四、前置条件五、安装 TDengine Connector 插件六、启动 Kafka七、验证 kafka Connect 是否启动成功八、TDengine Source Connector 的使用…

24/10/12 算法笔记 NiN

LeNet、AlexNet和VGG都有一个共同的设计模式&#xff1a;通过一系列的卷积层与汇聚层来提取空间结构特征&#xff1b;然后通过全连接层对特征的表征进行处理。 AlexNet和VGG对LeNet的改进主要在于如何扩大和加深这两个模块。 或者&#xff0c;可以想象在这个过程的早期使用全连…

用java来编写web界面

一、ssm框架整体目录架构 二、编写后端代码 1、编写实体层代码 实体层代码就是你的对象 entity package com.cv.entity;public class Apple {private Integer id;private String name;private Integer quantity;private Integer price;private Integer categoryId;public…