np.eye()函数的使用

背景:今天在复现一篇3D图像分割论文的时候,思考了一个问题,我们的数据集一般由原始数据和对应的Ground Truth组成,一般的3D数据都是(Height,Width,Depth)的形状,而对应的Ground Truth也是(Height,Width,Depth)的形状。这个时候就会产生一个疑问,比如我们的分割类别加上背景总共有4类,这个时候(Height,Width,Depth)形状的Ground Truth里面的每一个元素的是都是0、1、2、3其中的一个,分别代表着背景、类别1、类别2、类别3。这样看似十分合理,但是跑过深度学习模型的uu们都知道,我们的模型最后都会经过一个softmax()函数,将模型输出转换为类别的预测概率(其实分割也是“分类”,不过是在更加细粒度层面、像素级的分类而已),概率一般都是0~1之间,但是我们的Ground Truth此时却是0、1、2、3,这样一来就需要我们对Ground Truth进行预处理,也就是将类别0、1、2、3转换为4种类别所属的概率,一种比较简单的思路是在原始的Ground Truth的形状(Height,Width,Depth)的基础上面再添加一个维度,变为

(4,Height,Width,Depth),这里的4代表着4种类别,可以简单的理解为:后面的Height,Width,Depth是3D数据中的某一个像素块,而4就是这个像素块属于每一个类别的概率。这样以来,我们就解决了上面的问题,此时Ground Truth是类别概率,模型的训练输出也是预测的类别概率,从而可以顺利计算loss。

(上面的这段叙述由于笔者不善描述,比较抽象,可以略过论述直接看下面的np.eye()函数的使用介绍)

用法一:创建数组

#创建数组 np.eye(N, M=None, k=0, dtype=<class 'float'>, order='C')
#创建一个N*N的单位矩阵,对角线值为1,其余为0
ar1 = np.eye(3,dtype=np.int)
print('ar1:')
print(ar1)
ar2 = np.eye(3,2)
print('ar2:')
print(ar2)
ar3 = np.eye(3,4,k=2)
print('ar3:')
print(ar3)

输出:

ar1:
[[1. 0. 0.][0. 1. 0.][0. 0. 1.]]
ar2:
[[1. 0.][0. 1.][0. 0.]]
ar3:
[[0. 0. 1. 0.][0. 0. 0. 1.][0. 0. 0. 0.]]

用法二:生成one-hot形式数组(也就是解决上面论述中的问题)

labels=np.array([[1],[2],[0],[1]]) #一共三类
print(labels)
print(labels.reshape(-1))
res=np.eye(3)[labels.reshape(-1)]
print("labels转成one-hot形式的结果:\n",res,"\n")
print("labels转化成one-hot后的大小:",res.shape)

输出:

[[1][2][0][1]]
[1 2 0 1]
labels转成one-hot形式的结果:[[0. 1. 0.][0. 0. 1.][1. 0. 0.][0. 1. 0.]]labels转化成one-hot后的大小: (4, 3)

总结:np.eye()这个函数还是挺有意思的,之前也没有感觉到,但是今天在3D视觉分割任务上面遇到了问题,并且这个问题还被np.eye()这个函数巧妙的解决的时候,感觉这个函数还真的是非常的巧妙。同时也能看出一个学习技巧:很多时候没有目的性的学习是很低效的,尤其对于计算机视觉领域,多动手,多在实践中遇到问题解决问题才能学到更多的东西。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/602264.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

WeNet语音识别+Qwen-72B-Chat Bot+Sambert-Hifigan语音合成

WeNet语音识别Qwen-72B-Chat Bot&#x1f47e;Sambert-Hifigan语音合成 简介 利用 WeNet 进行语音识别&#xff0c;使用户能够通过语音输入与系统进行交互。接着&#xff0c;Qwen-72B-Chat Bot作为聊天机器人接收用户的语音输入或文本输入&#xff0c;提供响应并与用户进行对话…

RPC基础知识总结

RPC 是什么? RPC&#xff08;Remote Procedure Call&#xff09; 即远程过程调用&#xff0c;通过名字我们就能看出 RPC 关注的是远程调用而非本地调用。 为什么要 RPC &#xff1f; 因为&#xff0c;两个不同的服务器上的服务提供的方法不在一个内存空间&#xff0c;所以&am…

k8s安装hostPath方式存储的PostgreSQL15

1.配置 PostgreSQL 的 ConfigMap cat > postgres-configmap.yaml << EOF apiVersion: v1 kind: ConfigMap metadata:name: postgres-configlabels:app: postgresnamespace: dev data:POSTGRES_DB: postgresdbPOSTGRES_USER: postgresadminPOSTGRES_PASSWORD: admin12…

软件测试/测试开发丨Vuetify框架的使用

介绍 Vuetify 是一个基于 Vue.js 精心打造 UI 组件库&#xff0c;整套 UI 设计为 Material 风格。能够让没有任何设计技能的开发者创造出时尚的 Material 风格界面。 为什么要使用Vuetify框架 所有组件遵从 Material Design 设计规范&#xff0c;UI 体验非常优秀&#xff0c…

09-C++ STL-适配器、算法

c STL-适配器、算法 1. 函数对象 1.1 概念 重载函数调用操作符的类&#xff0c;其对象常称为函数对象&#xff08;function object&#xff09;&#xff0c;即它们是行为类似函数的对象&#xff0c;也叫仿函数(functor)&#xff0c; 其实就是 重载“()”操作符&#xff0c;使…

JSON的一些资源

以下是一些推荐的学习资源&#xff1a; 1. **官方网站**: - JSON.org: 这是一个很好的起点&#xff0c;它提供了JSON的基本介绍和语法规则。 2. **在线教程和课程**: - CSDN全方面学习各种资源。 - W3Schools (w3schools.com): 提供了一个关于JSON的教程&#xff0c;涵…

zookeeper经典应用场景之分布式锁

1. 什么是分布式锁 在单体的应用开发场景中涉及并发同步的时候&#xff0c;大家往往采用Synchronized&#xff08;同步&#xff09;或者其他同一个JVM内Lock机制来解决多线程间的同步问题。在分布式集群工作的开发场景中&#xff0c;就需要一种更加高级的锁机制来处理跨机器的进…

MiniTab的宏基础知识

什么是宏&#xff1f; 宏是包含一系列 Minitab 会话命令的文本文件。可以使用宏自动执行重复性任务&#xff08;例如&#xff0c;生成月度报表&#xff09;或扩展 Minitab 的功能&#xff08;例如&#xff0c;计算特殊检验统计量&#xff09;。 Minitab 提供以下类型的宏&…

MongoDB索引详解

概述 索引是一种用来快速查询数据的数据结构。BTree 就是一种常用的数据库索引数据结构&#xff0c;MongoDB 采用 BTree 做索引&#xff0c;索引创建 colletions 上。MongoDB 不使用索引的查询&#xff0c;先扫描所有的文档&#xff0c;再匹配符合条件的文档。使用索引的查询&…

axios post YII2无法接收post参数问题解决

axios post YII2无法接收post参数问题解决 在yii 配置文件中增加 ‘parsers’ > [“application/json” > “yii\web\JsonParser”] 如下所示&#xff1a; $config [id > basic,language > zh-CN,timeZone > env(TIME_ZONE, PRC),basePath > $basePath,bo…

Spring IOC的四种手动注入方法

手动注入 1.Set方法注入-五种类型的注入1.1 业务对象JavaBean第一步&#xff1a;创建dao包下的UserDao类第二步&#xff1a;属性字段提供set⽅法第三步&#xff1a;配置⽂件的bean标签设置property标签第四步&#xff1a;测试 1.2 常用对象String&#xff08;日期类型&#xff…

Adobe Photoshop 快捷键

PS快捷键 图层 选择图层 Ctrl T&#xff1a;可以对图层的大小和位置进行调整 填充图层 MAC: AltBackspace (前景) or CtrlBackspace (背景) WINDOWS: AltDelete (前景) or CtrlDelete (背景) 快速将图层填充为前景色或背景色 平面化图层&#xff08;盖印图层&#xff09…

每日一题——LeetCode1089.复写0

方法一 splice&#xff1a; 通过数组的slice方法&#xff0c;碰到 0就在后面加一个0&#xff0c;最后截取原数组的长度&#xff0c;舍弃后面部分。 但这样做是违反了题目的要求&#xff0c;不要在超过该数组长度的位置写入元素。 var duplicateZeros function(arr) {var le…

软件测试|全面解析Docker Start/Stop/Restart命令:管理容器生命周期的必备工具

简介 Docker是一种流行的容器化平台&#xff0c;用于构建、分发和运行应用程序。在使用Docker时&#xff0c;经常需要管理容器的生命周期&#xff0c;包括启动、停止和重启容器。本文将详细介绍Docker中的docker start、docker stop和docker restart命令&#xff0c;帮助您全面…

Python条形图热图直方图可视化精神健康状态(医学数据集)

目标是比开源精神疾病提供的基本报告更深入地挖掘&#xff0c;并了解更多属性之间的相互作用&#xff0c;这可以为所描述的决策者提供信息。 考虑的问题点&#xff1a; 不同性别属性的员工心理健康是否存在显着差异&#xff1f;不同年龄属性的员工心理健康是否存在显着差异&a…

Go语言程序设计-第7章--接口

Go语言程序设计-第7章–接口 接口类型是对其他类型行为的概括与抽象。 Go 语言的接口的独特之处在于它是隐式实现。对于一个具体的类型&#xff0c;无须声明它实现了哪些接口&#xff0c;只要提供接口所必须实现的方法即可。 7.1 接口即约定 7.2 接口类型 package iotype …

计算机组成原理-进位计数制(进制表示 进制转换 真值和机器树)

文章目录 现代计算机的结构总览最古老的计数方法十进制计数法推广&#xff1a;r进制计数法任意进制->十进制二进制<--->八进制&#xff0c;十六进制 各种进制常见的书写方式十进制->任意进制整数部分小数部分 十进制->二进制&#xff08;拼凑法&#xff09;真值…

Oracle OCP怎么样线上考试呢

大家好&#xff01;今天咱们就来聊聊Oracle OCP这个让人又爱又恨的认证。为啥说又爱又恨呢&#xff1f;因为它既是IT界的“金字招牌”&#xff0c;又是一块硬骨头&#xff0c;不是那么容易啃下来的。好了&#xff0c;废话不多说&#xff0c;我们直奔主题&#xff0c;来看看关于…

解决vue3中watch 监听不到旧值的问题,亲测有效!

问题描述 这个问题是我在公司vue3项目的时候发现的一个问题&#xff0c;watch 在监听对象/数组变量的变化时&#xff0c;发现对象的数据变化时 旧数据 获取到的和新数据是一样的 类似于下面这样 const objref({a:我是原来的值,b:6, })obj.a改变值watch(obj,(nel,old)>{ c…

studio3T mongodb 根据查询条件更新字段 或 删除数据

1. mongodb 等于、不等于$ne、不包含 $nin 以及批量更新数据的使用。 业务场景&#xff1a; 在集合中&#xff0c;根据查询条件&#xff0c;更新数据状态。 实现代码&#xff1a; 1. 部门名称为XXX、状态不等于“完好”的、并且不包含这些编码的数据先查询出来2. 再把状态更…