【python深度学习】——torch.expand()广播机制|torch.norm()

【python深度学习】——torch.expand广播机制|torch.norm

  • 1. torch.expand()与广播机制
  • 2. torch.norm()计算范数
  • 3. 结合使用的完整示例代码

1. torch.expand()与广播机制

在处理3D点云时, 有时需要对两帧点云进行逐点的三维坐标相加减、做点积等运算, 但是读入的PCD文件中,点云数量并不一定是相等的

那么首要的一个问题就是, 如何将两帧点云处理成大小相同的矩阵然后进行计算?

torch 中一个常用的方法是expand函数, 例如下面这段函数:

def expand_matrix(ori_A, ori_B):point_num_A = ori_A.size()[0] #原始点云A的点数point_dim = ori_A.size()[1]   #原始点云A的坐标维度,一般为3维point_num_B = ori_B.size()[0]assert point_dim == ori_B.size()[1] #保障都是3维点云# 假定expand目标为(point_num_A, point_num_B, point_dim)# 对A进行广播A_expanded = ori_A.unsqueeze(1)print(f"expand A,shape= {A_expanded.shape}, target = {point_num_A, point_num_B, point_dim}")A_expanded = A_expanded.expand(point_num_A, point_num_B, point_dim)# 对B进行广播B_expanded = ori_B.unsqueeze(0)print(f"expand B,shape= {B_expanded.shape}, target = {point_num_A, point_num_B, point_dim}")B_expanded = B_expanded.expand(point_num_A, point_num_B, point_dim)return A_expanded, B_expanded

代码解释:

expand函数只能在原始 维度为1 的情况下进行扩展。如果尝试在一个不是 1 的维度上进行扩展,会引发错误。因此我们先用unsqueeze函数在目标位置上进行dim=1的扩充, 再进行expand。

注意事项

  • expand 方法不会实际分配新的内存,而是通过引用的方式实现扩展。
  • 使用 expand 后的张量仍然与原始张量共享底层数据。

2. torch.norm()计算范数

torch.norm()是 PyTorch 中用于计算张量范数的函数,
基本用法如下:

torch.norm(input, p='fro', dim=None, keepdim=False, out=None, dtype=None)

这里的参数说明:

  • input: 输入张量。
  • p: 范数类型,默认为 ‘fro’(弗罗贝尼乌斯范数)。可以是以下值之一:
    ‘fro’ 或 None:弗罗贝尼乌斯范数(适用于矩阵)。
    2:默认的 L2 范数(适用于向量)。
    1:L1 范数。
    float(‘inf’) 或 ‘inf’:无穷范数。
    -float(‘inf’) 或 ‘-inf’:负无穷范数。
    其他正整数或浮点数:计算相应的 p-范数。
  • dim: 要计算范数的维度。如果为 None,则计算整个张量的范数。
  • keepdim: 是否保持输出张量的维度。如果为 True,则结果会保留被计算范数的维度。
  • out: 输出张量。
  • dtype: 返回张量的期望数据类型。如果为 None,则与输入数据类型相同。

3. 结合使用的完整示例代码

import torch
import open3d as o3d
import numpy as npdef expand_matrix(ori_A, ori_B):point_num_A = ori_A.size()[0]point_dim = ori_A.size()[1]    point_num_B = ori_B.size()[0]assert point_dim == ori_B.size()[1]# expand目标为(point_num_A, point_num_B, point_dim)# 对A进行广播A_expanded = ori_A.unsqueeze(1)print(f"expand A,shape= {A_expanded.shape}, target = {point_num_A, point_num_B, point_dim}")A_expanded = A_expanded.expand(point_num_A, point_num_B, point_dim)# 对B进行广播B_expanded = ori_B.unsqueeze(0)print(f"expand B,shape= {B_expanded.shape}, target = {point_num_A, point_num_B, point_dim}")B_expanded = B_expanded.expand(point_num_A, point_num_B, point_dim)return A_expanded, B_expandeddef calculate_distance(point_cloud_A, point_cloud_B):point_cloud_A = torch.tensor(point_cloud_A, dtype=torch.float32)point_cloud_B = torch.tensor(point_cloud_B, dtype=torch.float32)point_cloud_A = point_cloud_A.cuda()point_cloud_B = point_cloud_B.cuda()print("输入的A shape = ",point_cloud_A.shape)print("输入的B shape = ",point_cloud_B.shape)# 对A和B分别进行广播A_expanded, B_expanded = expand_matrix(point_cloud_A, point_cloud_B)# 计算每个点到另一个点云中所有点的距离, 结果的shape是(M,N)diff = torch.norm(A_expanded - B_expanded, dim=2, keepdim=False)for i in range(point_cloud_A.shape[0]):print(f"A<{i}>到B集合中所有点的距离: ",diff[i])for i in range(point_cloud_B.shape[0]):print(f"B<{i}>到A集合中所有点的距离: ",diff[:,i])# 读取pcd点云
def read_pcd(file_path, main_pcd=False):pcd_data = o3d.io.read_point_cloud(file_path)# 进行下采样,避免点数过多,显存不够pcd_data = pcd_data.voxel_down_sample(voxel_size=1)point_cloud = np.asarray(pcd_data.points)if not main_pcd:transform = np.loadtxt('data/ndt.txt')R = transform[:3, :3]T = transform[:3, 3]T= np.expand_dims(T, axis=1) # print("==== R is ", R)# print("==== T is ", T)# apply to point cloudpoint_cloud = np.transpose((R @ np.array(point_cloud).T) + np.tile(T,(1, point_cloud.shape[0])))return point_cloudif __name__ == "__main__":##! 读取目标点云# tgt = read_pcd('data/left_nonground.pcd',main_pcd=True)##! 读取待转换的点云,并且进行RT变换# src = read_pcd('data/right_nonground.pcd')##! 也可以使用测试数据,更为直观 tgt =  np.array([[1, 2, 3], [4,5,6], [1, 2, 3], [4,5,6],[1, 2, 3], [4,5,6] ])src = np.array([[0, 0,0],[1,1,1],[2,2,2],[3,3,3]])chamfer_dist_A, chamfer_dist_B = calculate_distance(tgt, src)print(f"Chamfer Distance from A to B: {chamfer_dist_A}")print(f"Chamfer Distance from B to A: {chamfer_dist_B}")

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/842643.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

硬盘的分区

目录 概念 硬盘的分区 实操 创建分区 fdisk&#xff08;<2T&#xff09; 创建文件系统 挂载 自动挂载&#xff08;永久挂载&#xff09; gpt区分 swap 交换分区 如何删除已挂载的分区 概念 硬盘&#xff1a;计算机的存储设备。&#xff08;如无特殊说明&#xff0…

sklearn线性回归--岭回归

sklearn线性回归--岭回归 岭回归也是一种用于回归的线性模型&#xff0c;因此它的预测公式与普通最小二乘法相同。但在岭回归中&#xff0c;对系数&#xff08;w&#xff09;的选择不仅要在训练数据上得到好的预测结果&#xff0c;而且还要拟合附加约束&#xff0c;使系数尽量小…

基于springboot+vue的班级综合测评管理系统

开发语言&#xff1a;Java框架&#xff1a;springbootJDK版本&#xff1a;JDK1.8服务器&#xff1a;tomcat7数据库&#xff1a;mysql 5.7&#xff08;一定要5.7版本&#xff09;数据库工具&#xff1a;Navicat11开发软件&#xff1a;eclipse/myeclipse/ideaMaven包&#xff1a;…

操作系统 实验18 批处理操作接口8:函数

1、建立文件func2.sh&#xff0c;输出文件内容各行及行数 脚本&#xff1a; #!/bin/bash echo -n "请输入一个文件名及路径&#xff1a;" read FILE statisfile(){local i0while read linedo let iecho "$i $line"done < $FILEecho "$FILE有$i行…

高德地图之获取经纬度并且根据获取经纬度渲染到路线规划

话不多说&#xff0c;直接给兄弟们上干货&#xff0c;修改了好多次&#xff0c;之前都是获取到路线但是无法删除&#xff0c;这次是根据点击的单双判断开始和结束 <!DOCTYPE html> <html><head><meta charset"utf-8"><meta http-equiv&q…

解读 MySQL 容器信息:`docker inspect` 字段详解

前言 在使用 Docker 时&#xff0c;docker inspect 命令是一个非常有用的工具&#xff0c;它能够返回容器或镜像的详细配置信息和状态。以下是对 docker inspect mysql 命令输出的字段的详细解释&#xff0c;这些信息可以帮助您更好地了解容器的内部工作机制。 容器基础信息 …

回顾Java中的算术运算符、关系运算符和逻辑运算符,并解释下和的区别

一、在Java中&#xff0c;存在多种类型的运算符&#xff0c;包括算术运算符、关系运算符和逻辑运算符。以下是这些运算符的列表和简要说明&#xff1a; 算术运算符 加法运算符 (): 用于将两个操作数相加。减法运算符 (-): 用于从一个操作数中减去另一个操作数。乘法运算符 (*…

【前端】CSS弹性布局 display-flex

一、display-flex弹性布局 Flex&#xff0c;用来为盒装模型提供最大的灵活性。任何一个容器都可以指定为Flex布局。 在父DIV中使用 display: -webkit-flex; /*在webkit内核的浏览器上使用要加前缀*/ display: flex; //将对象作为弹性伸缩盒显示// 沿水平主轴让元素从左向右排…

git中忽略文件的配置

git中忽略文件的配置 一、在项目根目录下创建.gitignore文件二、配置规则如果在配置之前已经提交过文件了&#xff0c;要删除提交过的&#xff0c;如何修改&#xff0c;参考下面的 一、在项目根目录下创建.gitignore文件 .DS_Store node_modules/ /dist# local env files .env…

找一个区间内两个数最大公约数的最大值(24年gdcpc省赛G题)

题目大意就是t组数据,每组一个左右边界l,r,问区间内的两个是xi,yi是区间内max(gcd(xi,yi)),数据范围是1e12. 答案就是找到第一个a*x<b*x(a<b),他们两在l到r之间且x最大,那么x就是答案,可以知道,要使两个数在区间内,那么他们之间的差值要小于min(R-L,[R/2]),[]表示向下取…

【安装】VMware虚拟机安装windows操作系统,VM的相关操作

目录 引出报错&#xff1a;press any key to boot form cd激活调整显示 在VMware上新建虚拟机&#xff0c;并安装Windows1、新建虚拟机2、装载 ISO 镜像3、安装Windows server 20164、开机初始化 虚拟机操作1、虚拟机基本操作2、虚拟机快照3、虚拟机克隆4、VMware Tools 总结 引…

消费增值:国家支持的消费新零售模型

在当下的消费时代&#xff0c;一个全新的概念——消费增值&#xff0c;正逐渐走进大众视野。它不仅仅是一种消费模式&#xff0c;更是一种全新的财富增长途径。那么&#xff0c;消费增值究竟是什么&#xff1f; 首先&#xff0c;消费增值的本质在于将消费行为与投资行为相结合…

大模型日报2024-05-27

大模型日报 2024-05-27 大模型资讯 芝加哥大学研究AI在金融分析中的应用 摘要: 芝加哥大学的研究探索了大型语言模型&#xff08;LLMs&#xff09;在金融分析中的能力。GPT-4等大型语言模型在文本分析、解释和生成方面表现出色。 AI帮助揭示海洋和肠道中病毒的动态 摘要: 病毒在…

无人机技术:倾转旋翼飞行器的关键技术详解

一、总体设计 倾转旋翼飞行器作为一种独特的垂直起降与水平巡航的航空器&#xff0c;其总体设计是关键技术之一。总体设计涵盖了飞行器的整体布局、重量分配、气动性能、机械结构设计等多个方面。在总体设计中&#xff0c;需要充分考虑飞行器的垂直起降、悬停、过渡飞行和水平…

Docker 安装与管理

Docker 是一个开源的应用容器引擎,主要用于在 Linux 和 Windows 中创建、部署和运行应用程序。在本文中,我们将详细介绍如何在 CentOS 7 上安装和管理 Docker。 前提条件 Docker 运行在 CentOS 7 上,需要满足以下条件: 系统为 64 位系统内核版本 3.10 及以上下面是一个示例环…

二分例题(D.负重越野,I.路径规划)

这两天的训练赛都有一道二分的题&#xff0c;但是都没往二分上面想&#xff0c;同样不知道怎么二分。 D. Fast and Fat 思路 二分的关键也就是check函数怎么写了&#xff0c;求队伍最大速度&#xff0c;可以分为速度>mid和<mid两部分&#xff0c;再判断&#xff0c;能不…

流量分析入门

什么是流量分析 通过捕捉网络中流动的数据包&#xff0c;查看里面的数据和协议&#xff0c;流量分析和各种数据的统计来发现网络运行中的问题&#xff0c;在ctf中一般是一个包含流量数据的 PCAP 文件。 [陇剑杯 2021]签到 1.题目问我们正在进行的事什么协议的攻击 2.打开wire…

【ARMv7-A】——WFI(wait for interrupt)

文章目录 WFI基本原理使用场景多任务模型注意事项代码实例linux 内核中的 WFI 指令不使用 WFI 指令使用 WFI 指令WFI WFI 即 Wait for interrupt,常用于低功耗。 WFI (Wait for interrupt) 和 WFE (Wait for event) 是两个让 ARM 核进入 low-power standby 模式的指令,由 A…

【vue与iframe通讯】

vue 与 iframe 通讯 发送数据vue 向 iframe 发送数据iframe 向 vue 发送数据接收信息( vue & iframe 通用) 实现相互通讯通讯流程图实现代码vue 页面iframe页面iframe 内部重定向访问地址,更新 vue 路由 访问跨域代码下载 前言&#xff1a;vue嵌套iframe实现步骤 发送数据…

基于Pytorch框架的深度学习ShufflenetV2神经网络十七种猴子动物识别分类系统源码

第一步&#xff1a;准备数据 17种猴子动物数据&#xff1a; self.class_indict ["白头卷尾猴", "弥猴", "山魈", "松鼠猴", "叶猴", "银色绒猴", "印度乌叶猴", "疣猴", "侏绒"…