mmseg报错ValueError: size shape must match input shape. Input is 2D,size is 3

运行mmsegmentation碰到报错:size shape must match input shape. Input is 2D, size is 3
这个问题比较坑。有时候我们的标签size是[512,512,3],然而mmsegmentation需要的标签输入应该是8位的图片,即[512,512]。这点得怪mmsegmentation写的不好,没有考虑到输入标签是三通道灰度图的情况。

解决方案:进入mmseg/datasets/pipelines/loading.py,找到LoadAnnotations类的__call__函数,将gt_semantic_seg = mmcv.imfrombytes(img_bytes, flag=’unchanged’,backend=self.imdecode_backend).squeeze().astype(np.uint8)语句中的flag值改为grayscale,即gt_semantic_seg = mmcv.imfrombytes( img_bytes, flag='grayscale', backend=self.imdecode_backend).squeeze().astype(np.uint8)。

Btw,也可以在local_configs/base/datasets/ade20k.py的dict(type=‘LoadAnnotations’, reduce_zero_label=True),语句中,加上flag=grayscale,但这种方式还是得到mmseg/datasets/pipelines/loading.py文件中在__init__函数里加上self.flag,即将LoadAnnotations类的init改为:

    def __init__(self,reduce_zero_label=False,file_client_args=dict(backend='disk'),imdecode_backend='pillow',flag='grayscale'):self.reduce_zero_label = reduce_zero_labelself.file_client_args = file_client_args.copy()self.file_client = Noneself.imdecode_backend = imdecode_backendself.flag = flag



这个问题我看了半天,主要犯了个大错。我一直检查标签数据,用的是cv2.imread(‘xxx.png’),但这样读取图片,无论是不是单通道的灰度图,都会被读成三通道的彩色图。btw,如果用cv2.imread(‘xxx.png’,0)读取图片,即使是三通道的图,也会被读成单通道的。这点需要注意一下。
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/607043.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OBD汽车

相当于客户端与服务器 诊断设备流程 》》》》诊断服务 OBD很多的定死了 Vme就很灵活 WWH 就是两个的结合 OBD15031 SID PID 可以自己定义一些 一个字节255个 两个有效字节 02 01 0D 5555(随机值)这是请求 两个有效字节 01 OD(请求速…

Python(31):Python3.7操作DB2数据库工具类

Python(31):Python3.7操作DB2数据库工具类 Python3.7操作DB2数据库 要在Python中操作DB2数据库,你可以使用IBM提供的 ibm_db 或 ibm_db_sa 包。以下是基本的步骤: 1、安装 ibm_db 包 pip install ibm_db 2、连接到DB2数据库 import ibm_db conn_str = "DATABASE=…

L1-009 N个数求和(Java)

题目 本题的要求很简单,就是求N个数字的和。麻烦的是,这些数字是以有理数分子/分母的形式给出的,你输出的和也必须是有理数的形式。 输入格式: 输入第一行给出一个正整数N(≤100)。随后一行按格式a1/b1 a…

51单片机之按键和数码管

51单片机之按键和数码管 ✍前言:♐独立按键😀独立按键的原理😀软件实现按键控制LED灯的亮灭 ♐数码管😊数码管显示数字或者字母的原理🐉共阳极数码管🐉共阴极极数码管🐉4位1体数码管 &#x1f6…

Go 语言为什么不支持并发读写 map

Go语言的map类型不支持并发读写的主要原因是并发读写会导致数据竞态(data race),这意味着多个 goroutine 可能同时访问并修改同一个 map,从而引发不确定的结果。 在Go语言的设计中,为了防止数据竞态,不同于…

大数据StarRocks(六) :Catalog

StarRocks 自 2.3 版本起支持 Catalog(数据目录)功能,实现在一套系统内同时维护内、外部数据,方便您轻松访问并查询存储在各类外部源的数据。 1. 基本概念 内部数据:指保存在 StarRocks 中的数据。 外部数据&#xf…

分布式系统架构设计之分布式消息队列架构解析

分布式消息队列架构是构建在分布式系统之上的消息队列架构,旨在提高高性能、高可用性和可伸缩性。它包括以下架构相关部分: 1、架构优势 分布式消息队列架构的优势主要体现在以下几个方面: 01 高可用性 在分布式消息队列架构中&#xff0…

uni-app顶部下拉舒心

下拉刷新实际上是在用户操作下拉交互时重新调用接口,然后将新获取的数据再次渲染到页面中。 操作步骤 基于 scroll-view 组件实现下拉刷新,需要通过以下方式来实现下拉刷新的功能。 配置 refresher-enabled 属性,开启下拉刷新交互监听 ref…

ARM架构—— Cortex-M3与Cortex-M4特点概述

一、Cortex-M3与Cortex-M4异同点 相同点: 基于ARM-v7-M架构。三级流水线设计。哈佛总线架构,统一的存储器空间:指令和地址总线使用相同的地址空间。32位寻址,支持4GB 存储空间。基于ARM AMBA(高级微控制器总线架构&a…

在docker上运行LCM

目录 1.加载镜像并进入容器 2.安装依赖 3.在docker外部git-clone lcm 4.将get-clone的lcm复制到容器中 5.编译库 6.将可执行文件复制到容器中 7.进入可执行文件 8.编译可执行文件 9.再开一个终端运行程序 10.将以上容器打成镜像并导出 1.加载镜像并进入容器 sudo do…

基于多反应堆的高并发服务器【C/C++/Reactor】(中)在TcpConnection 中接收并解析Http请求消息

一、在TcpConnection 中多添加和http协议相关的request和response struct TcpConnection {struct EventLoop* evLoop;struct Channel* channel;struct Buffer* readBuf;struct Buffer* writeBuf;char name[32];// http协议struct HttpRequest* request;struct HttpResponse* r…

Java10:内部类

7 内部类(了解)7.1 成员内部类7.2 静态内部类7.3 局部内部类7.4 匿名内部类 2.3. 静态内部类2.4. Lambda表达式, 7 内部类(了解) 内部类:就是在一个类的内部再定义一个类。 分类: 成员内部类 静…

压力测试对系统研发的作用是什么?

在回答这个问题之前,我们先来看看压力测试到底是什么? 压力测试是一种非功能性的软件测试方法,它通过模拟极端或者异常条件下的负载,来评估系统的性能、稳定性、可靠性和可扩展性。这种测试方法通常会模拟多用户同时访问系统、大数…

LabVIEW在旋转机械故障诊断中的随机共振增强应用

在现代工业自动化领域,准确的故障诊断对于保障机械设备的稳定运行至关重要。传统的故障检测方法往往因噪声干扰而难以捕捉到微弱的故障信号。随着LabVIEW在数据处理和系统集成方面的优势日益凸显,其在旋转机械故障诊断中的应用开始发挥重要作用&#xff…

​油烟净化器电源安全,保障健康餐饮生活

我最近分析了餐饮市场的油烟净化器等产品报告,解决了餐饮业厨房油腻的难题,更加方便了在餐饮业和商业场所有需求的小伙伴们。 随着人们生活水平的提高,餐饮业也得到了快速发展。然而,餐饮油烟污染也成为了人们关注的焦点。 油烟中…

Spring学习 Spring整合MyBatis

6.1.创建工程 6.1.1.pom.xml <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation"http://maven.ap…

20240108移远的4G模块EC20在Firefly的AIO-3399J开发板的Android11下调通的步骤

20240108移远的4G模块EC20在Firefly的AIO-3399J开发板的Android11下调通的步骤 2024/1/8 17:50 缘起&#xff1a;使用友善之臂的Android11可以让EC20上网&#xff0c;但是同样的修改步骤&#xff0c;Toybrick的Android11不能让EC20上网。最后确认是selinux的问题&#xff01; …

Linux文件系统与日志分析

目录 一、Linux文件系统 1、inode与block 2、查看inode号码的命令 3、inode包含文件的元信息 4、Linux系统文件的三个主要时间属性 5、用户通过文件名打开文件时系统内部过程 6、inode的大小 7、inode的特点 二、日志 1、日志的功能 2、日志文件的分类 3、系统日志…

解锁前端新潜能:如何使用 Rust 锈化前端工具链

前言 近年来&#xff0c;Rust的受欢迎程度不断上升。首先&#xff0c;在操作系统领域&#xff0c;Rust 已成为 Linux 内核官方认可的开发语言之一&#xff0c;Windows 也宣布将使用 Rust 来重写内核&#xff0c;并重写部分驱动程序。此外&#xff0c;国内手机厂商 Vivo 也宣布…

语言栏中的半角和全角

语言栏中的半角和全角 1. 语言栏2. Halfwidth and fullwidth forms3. Monospaced fontReferences 1. 语言栏 任务栏设置 时间和语言 输入 高级键盘设置 文本服务和输入语言 2. Halfwidth and fullwidth forms 半角和全角&#xff0c;别名半形和全形。 In CJK (Chinese, Japa…