【深度学习】张量的广播专题

一、说明

张量广播(tensor broadcasting)是一种将低维张量自动转化为高维张量的技术,使得张量之间可以进行基于元素的运算(如加、减、乘等)。在进行张量广播时,会将维度数较少的张量沿着长度为1的轴进行复制,在匹配维度后,两个张量就可以进行运算。

二、张量的基本概念

        当较小的张量被“拉伸”以具有与较大张量的兼容形状以执行操作时,就会发生广播。

 

广播可以成为执行张量运算而不创建重复数据的有效方法。

根据 PyTorch 的说法,在以下情况下,张量是“可广播的”:

每个张量至少有一个维度

循环访问维度大小时,从尾随维度开始,维度大小必须相等、其中一个为 1,或者其中一个不存在

比较形状时,尾随维度是最右边的数字。

在上图中,可以看到通用过程:

1. 确定最右侧的尺寸是否兼容

  • 每个张量是否至少有一个维度?
  • 大小相等吗?其中之一吗?一个不存在吗?

2. 将尺寸拉伸到适当的尺寸

3. 对下一个维度重复上述步骤

这些步骤可以在下面的示例中看到。

三、元素级操作

        所有元素级运算都要求张量具有相同的形状。

3.1 矢量和标量示例

import torch
a = torch.tensor([1, 2, 3])
b = 2 # becomes ([2, 2, 2])a * b
tensor([2, 4, 6])

        在此示例中,标量的形状为 (1,),矢量的形状为 (3,)。如图所示,b被广播为(3,)的形状,并且Hadamard乘积按预期执行。

3.2 矩阵和矢量示例 1

 

        在此示例中,A 的形状为 (3, 3),的形状为 (3,)。

发生乘法时,向量被逐行拉伸以创建一个矩阵,如上图所示。现在,A 和 b 的形状均为 (3, 3)。

        这可以在下面看到。


A = torch.tensor([[1, 2, 3],[4, 5, 6],[7, 8, 9]])b = torch.tensor([1, 2, 3])A * b
tensor([[ 1,  4,  9],[ 4, 10, 18],[ 7, 16, 27]])

3.3 矩阵和矢量示例 2

 

        在此示例中,的形状为 (3, 3),的形状为 (3, 1)。

        发生乘法时,向量将逐列拉伸以创建两个额外的列,如上图所示。现在,A 和 b 的形状均为 (3, 3)。

A = torch.tensor([[1, 2, 3],[4, 5, 6],[7, 8, 9]])b = torch.tensor([[1], [2], [3]])
A * b
tensor([[ 1,  2,  3],[ 8, 10, 12],[21, 24, 27]])

Tensor and Vector Example

         在此示例中,是形状为 (2, 3, 3) 的张量,是形状为 (3, 1) 的列向量。

A = (2, 3, 3)
b = ( , 3, 1)

        从最右边的维度开始,每个元素按列拉伸以生成 (3, 3) 矩阵。中间维度相等。在这一点上,b只是一个矩阵。最左侧的维度不存在,因此必须添加一个维度。然后,必须广播矩阵以创建 (2, 3, 3) 的大小。现在有两个 (3, 3) 个矩阵,可以在上图中看到。

        这允许计算 Hadamard 乘积并生成 (2, 3, 3) 矩阵:

A = torch.tensor([[[1, 2, 3],[4, 5, 6],[7, 8, 9]],[[1, 2, 3],[4, 5, 6],[7, 8, 9]]])b = torch.tensor([[1], [2], [3]])A * b
tensor([[[ 1,  2,  3],[ 8, 10, 12],[21, 24, 27]],[[ 1,  2,  3],[ 8, 10, 12],[21, 24, 27]]])

3.4 张量和矩阵示例

        在此示例中,是形状为 (2, 3, 3) 的张量,是形状为 (3, 3) 的矩阵。

A = (2, 3, 3)
B = ( , 3, 3)

        此示例比上一个示例更容易,因为最右侧的两个维度是相同的。这意味着矩阵只需在最左侧的维度上广播即可创建 (2, 3, 3) 的形状。这只是意味着需要一个额外的矩阵。

        计算哈达玛乘积时,结果为 (2, 3, 3)。

A = torch.tensor([[[1, 2, 3],[4, 5, 6],[7, 8, 9]],[[1, 2, 3],[4, 5, 6],[7, 8, 9]]])B = torch.tensor([[1, 2, 3], [1, 2, 3], [1, 2, 3]])A * B
tensor([[[ 1,  4,  9],[ 4, 10, 18],[ 7, 16, 27]],[[ 1,  4,  9],[ 4, 10, 18],[ 7, 16, 27]]])

四、矩阵和张量乘法与点积

        对于前面的所有示例,目标是以相同的形状结束,以允许逐元素乘法。此示例的目标是通过点积实现矩阵和张量乘法,这需要第一个矩阵或张量的最后一个维度与第二个矩阵或张量的倒数第二个维度匹配。

        对于矩阵乘法:

  • (m, n) x (n, r) = (c, m, r)

        对于 3D 张量乘法:

  • (c, m, n) x (c, n, r) = (c, m, r)

对于 4D 张量乘法:

  • (z, c, m, n) x (z, c, n, r) = (z, c, m, r)

        对于此示例,A 的形状为 (2, 3, 3),的形状为 (3, 2)。截至目前,最后两个维度符合点积乘法的条件。需要将维度添加到 B,并且需要跨此维度广播 (3, 2) 矩阵以创建 (2, 3, 2) 的形状。

        此张量乘法的结果将是 (2, 3, 3) x (2, 3, 2) = (2, 3, 2)。

A = torch.tensor([[[1, 2, 3],[4, 5, 6],[7, 8, 9]],[[1, 2, 3],[4, 5, 6],[7, 8, 9]]])B = torch.tensor([[1, 2], [1, 2], [1, 2]])A @ B # A.matmul(B)
tensor([[[ 6, 12],[15, 30],[24, 48]],[[ 6, 12],[15, 30],[24, 48]]])

        有关广播的其他信息可以在下面的链接中找到。有关张量及其操作的更多信息可以在此处找到。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/2266.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

YOLOv5图像和视频对象生成边界框的目标检测实践(GPU版本PyTorch错误处理)

识别图像和视频里面的对象,在计算机视觉中是一个很重要的应用,比如无人驾驶,这个就需要实时的检测到周边环境的各种对象,并及时做出处理。目标检测在以往的文章中有重点讲解过几种,其中Faster R-CNN的源码解读&#xf…

7.kafka+ELK连接

文章目录 kafkaELK连接部署Kafkakafka操作命令kafka架构深入FilebeatKafkaELK连接 kafkaELK连接 部署Kafka ###关闭防火墙systemctl stop firewalld systemctl disable firewalldsetenforce 0vim /etc/selinux/configSELINUXdisabled###下载安装包官方下载地址:ht…

Vue自定义指令

需求1:定义一个v-big指令,和v-text功能类似,但会把绑定的数值放大10倍。 需求2:定义一个v-fbind指令,和v-bind功能类似,但可以让其所绑定的input元素默认获取焦点。 自定义指令函数式v-big: &l…

java设计模式之 - 建造者模式

建造者模式(Builder Pattern)是一种创建型设计模式,它通过将对象的构建过程分离出来,使得同样的构建过程可以创建不同的表示形式。 简单来说,建造者模式允许你按步骤创建复杂的对象,同时将对象的构建与其表…

Python爬虫相关案例汇总

一、简述 将之前所做的爬虫案例放出,方便查阅,对代码整合函数内容并不进行说明。 二、代码 import time from concurrent.futures import ThreadPoolExecutorimport requests import re import csv from bs4 import BeautifulSoup import os from lxm…

Go新手速成-string

1string类型 byte就是unit8 rune就是int32 都可以代表字符型,但是必须格式化打印,要不然打印出来就是ASC码,参考c语言 //字符处理的细节,如果是英文意味着比较短,可以用byte来实现,//如果是汉字就可以用…

2023最新版本Activiti7系列-事件篇

事件篇 事件(event)通常用于为流程生命周期中发生的事情建模。事件总是图形化为圆圈。在BPMN 2.0中,有两种主要的事件分类:*捕获(catching)与抛出(throwing)*事件。 捕获: 当流程执…

文件共享服务器

文章目录 一、共享服务器概述二、创建共享三、访问共享四、创建隐藏的共享五、访问隐藏共享的方法六、共享相关命令七、屏蔽系统隐藏共享自动产生1. 打开注册表2. 定位共享注册表位置 八、查看本地网络连接状态(查看开放端口)九、关闭445服务 一、共享服…

数据结构问答1

1. 当数据采用链式存储结构时,要求————? 答:每个节点占用一片连续的存储区域 2. 简述数据与数据元素的关系与区别? 答: 关系: 凡是能输入到计算机并被计算机识别和处理的对象集合都称为数据,数据是一个集合。数据元素是数据的基本单位,在计算机程序中通常作为…

List迭代器是如何实现的

我们知道当我们使用vector的迭代器时,它的操作可以让它指向下一个位置,解引用操作就可以找到这个位置的值,因为vector底层时用的一个顺序表,可以支持随机访问。对比list来说vector底层的迭代器是十分的简便可观的。虽然我们使用list的迭代器外观上和vector是大同小异的&#xf…

怎么使用PHP实现Memcached数据库负载均衡

一、什么是Memcached Memcached是一种高速缓存系统,通常用于缓存常用的查询结果、对象、页面数据等,以避免重复查询数据库,加快数据读取速度。Memcached支持分布式架构,通过多个节点共同协作来提高读写性能,可用于实现…

uniapp离线引入阿里巴巴图标

阿里巴巴图标地址 1.添加图标到购物车 2.点击购物车进入项目 3.下载到本地 4.解压后文件目录 5.放入项目目录中(比如说我经常放在common或者static下icon中) 6.在main.ts或者main.js中引入(注意路径,用相对的也行) import /static/iconfon…

超细,设计一个“完美“的测试用例,用户登录模块实例...

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 好的测试用例一定…

Postman接口测试之POST、GET请求方法

http://t.csdn.cn/h4A3u 记录一下教程 接口测试之Postman使用全图文指南(原来使用Postman测试API接口如此简单)_postman怎么测接口_软测小生的博客-CSDN博客

java项目之足球赛会管理系统(ssm+mysql+jsp)

风定落花生,歌声逐流水,大家好我是风歌,混迹在java圈的辛苦码农。今天要和大家聊的是一款基于ssm的足球赛会管理系统。技术交流和部署相关看文章末尾! 项目地址: https://download.csdn.net/download/sinat_26552841…

react组件多次渲染问题

问题背景 在数据没有发生变化的情况下React组件会进行数次重复渲染,绘制出来完全相同的两个图 排查思路 寻找子组件重渲染原因实验 测试一:在子组件的props未发生任何变更的情况下是否会发生重新渲染 import React, { useState } from "react&…

C++中重载下标运算符[]

C中重载下标运算符[] 表示容器的类通常可以通过元素在容器中的位置访问元素,这些类一般会定义下标运算符 operator[]。 下标运算符必须是成员函数为了与下标的原始定义兼容,下标运算符通常以所访问元素的引用作为返回值,这样做的好处是下标…

C#安装.Net平台科学计算库Math.Net Numerics

工作的时候需要使用到C#的Math.Net库来进行计算。 Math.Net库涵盖的主题包括特殊函数,线性代数,概率模型,随机数,插值,积分,回归,优化问题等。 这里记录一下,安装Math.Net库的过程…

Vim的常用指令

起因 在很早以前,大家想在windows里面使用linux大多都是通过装双系统或者virtual box还是vmware的虚拟机搞起来的,但是随着docker和k8s这些容器技术的发展和windows自己提供的wsl2,接下去,已经很少有人使用虚拟机了。但是容器机器…

Hugging Face开源库accelerate详解

官网:https://huggingface.co/docs/accelerate/package_reference/accelerator Accelerate使用步骤 初始化accelerate对象accelerator Accelerator()调用prepare方法对model、dataloader、optimizer、lr_schedluer进行预处理删除掉代码中关于gpu的操作&#xff0…