opencv-利用DeepLabV3+模型进行图像分割去除输入图像的背景

分离图像中的人物和背景通常需要一些先进的图像分割技术。GrabCut是一种常见的方法,但是对于更复杂的场景,可能需要使用深度学习模型。以下是使用深度学习模型(如人像分割模型)的示例代码:

#导入相关的库
import cv2
import numpy as np
import torch
import torchvision.transforms as T
from torchvision.models.segmentation import deeplabv3_resnet101def remove_background_with_deep_learning(image_path):# 读取图像image = cv2.imread(image_path)# 将图像转换为RGB格式image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) #将图像从BGR格式转换为RGB格式,因为深度学习模型通常使用RGB。# 定义图像预处理和转换transform = T.Compose([  #定义了图像的预处理和转换步骤,包括将图像转换为PyTorch张量和标准化。T.ToTensor(),  # 将图像转换为PyTorch张量T.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),  # 标准化图像])# 对图像进行预处理和转换input_tensor = transform(image_rgb)input_batch = input_tensor.unsqueeze(0)  # 添加一个维度,使其成为批处理的一部分# 加载预训练的DeepLabV3模型model = deeplabv3_resnet101(pretrained=True)model.eval()  # 设置为评估模式,不进行梯度更新# 运行模型并获取分割掩模with torch.no_grad(): #上下文管理器,用于关闭梯度计算,以提高推断速度。output = model(input_batch)['out'][0]#运行模型并获取输出。output_predictions = output.argmax(0)  # 获取模型输出中预测类别的索引# 将分割结果转换为二进制掩模mask = (output_predictions == 15).numpy()  # 在DeepLabV3模型中,15是人物的标签# 将原始图像与二进制掩模相乘,去除背景result = image * mask[:, :, np.newaxis]# 显示结果cv2.imshow('Original Image', image)cv2.imshow('Removed Background', result)cv2.waitKey(0)cv2.destroyAllWindows()
# 使用示例
remove_background_with_deep_learning(r"C:\Users\mzd\Desktop\opencv\images.jpg")

在这里插入图片描述
代码解释:
理解代码可能需要一些基本的编程和机器学习知识,以下是逐步解释代码的主要部分:

  1. 导入库: 首先,导入了用于图像处理和深度学习的库,包括OpenCV(cv2)、PyTorch和TorchVision。

  2. 定义函数: remove_background_with_deep_learning 是一个用于去除图像背景的函数。它接受一个图像路径作为参数。

  3. 读取和转换图像: 使用OpenCV读取图像,然后将图像转换为RGB格式。机器学习模型通常使用RGB格式。

  4. 图像预处理和转换: 定义了一系列图像预处理和转换步骤,将图像转换为PyTorch张量并进行标准化。

  5. 加载预训练模型: 使用deeplabv3_resnet101 模型,它是一个预训练的深度学习模型,专门用于图像分割任务。

  6. 运行模型并获取分割掩模: 将预处理后的图像输入到模型中,获取模型输出中的分割掩模。在这里,15是代表人物的类别标签。

  7. 将分割结果转换为二进制掩模: 将模型输出的分割结果转换为二进制掩模,其中值为1的像素表示属于人物的区域。

  8. 去除背景: 将原始图像与二进制掩模相乘,实现去除背景效果。

在这个函数中,将原始图像与二进制掩模相乘的目的是将背景部分置零,从而实现去除背景的效果。这是基于掩模的思想,其中掩模是一个与原始图像大小相同的二维数组,其中元素的值为0或1,用于指示哪些像素应该保留(值为1)或去除(值为0)。
具体流程如下:

  1. mask = (output_predictions == 15).numpy():通过模型的输出,生成一个二进制掩模。在这里,假设标签15对应于人物。掩模中值为1的像素表示人物,值为0的像素表示背景。
  2. result = image * mask[:, :, np.newaxis]:通过将原始图像与二进制掩模相乘,实现了以下效果:
    • 当掩模中对应位置的值为1(人物部分),相乘结果保持原始图像的颜色值;
    • 当掩模中对应位置的值为0(背景部分),相乘结果将对应位置的像素值置零。 这样,通过像素级别的相乘操作,将背景部分的像素值置零,达到了去除背景的效果。最终,result就是去除背景后的图像。

这是一种简单而有效的背景去除方法,尤其在利用深度学习模型进行图像分割的场景中得到了广泛应用。

  1. 显示结果: 使用OpenCV的 imshow 函数显示原始图像和去除背景后的图像。

  2. 使用示例: 调用 remove_background_with_deep_learning 函数,传递图像路径,这里的路径是 'path/to/your/image.jpg'。这是整个程序的入口。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/171898.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[C++]指针与结构体

标题 一.指针1.指针的定义和使用2.指针所占的内存空间3.空指针与野指针4.const修饰指针5.指针和数组6.指针和函数 二.结构体1.结构体的定义与使用2.结构体数组3.结构体指针4.结构体的嵌套使用5.结构体做函数参数6.结构体中const使用场景7.案例练习 一.指针 作用: 可以通过指针…

FPGA驱动CS4344 VHDL例程

CS4344是一款非常简单的I2S立体声24bit D/A芯片,采样率高达192KHz,相对于ADAU1761复杂的寄存器配置来说,CS4344非常友好,无需配置寄存器,只要按I2S时序输入数据,即可实现立体声输出,且10PIN TSS…

SpringBoot 拦截器高级篇

Springboot 拦截器 定义使用场景拦截器与过滤器的区别实现步骤全局拦截器的局限性全局拦截器VS局部拦截器局部拦截器自定义局部拦截器使用多个局部拦截器 定义 拦截器是Spring MVC框架中的一个重要组件,它是一种AOP(面向切面编程)的实现方式&…

探索计算机视觉:深度学习与图像识别的融合

探索计算机视觉:深度学习与图像识别的融合 摘 要: 本文将探讨计算机视觉领域中的深度学习技术,并重点关注图像识别方面的应用。我们将介绍卷积神经网络(CNN)的原理、常用的图像数据集以及图像识别的实际应用场景&…

Leetcode 1727. 具有重排的最大子矩阵

题目要求: 给定一个大小为 m x n 的二进制矩阵,并且允许您以任意顺序重新排列矩阵的列。 对列进行最佳重新排序后,返回矩阵中每个元素都为 1 的最大子矩阵的面积。 输入:矩阵 [[0,0,1],[1,1,1],[1,0,1]] 输出:4 说明…

Java制作“简易王者荣耀”小游戏

第一步是创建项目 项目名自拟 第二部创建个包名 来规范class 然后是创建类 GameFrame 运行类 package com.sxt;import java.awt.Graphics; import java.awt.Image; import java.awt.Toolkit; import java.awt.event.ActionEvent; import java.awt.event.ActionListener; im…

班级管理五步法

亲爱的教师朋友们!今天我要和大家分享一个超级实用的班级管理方法——班级管理五步法!用这个方法,轻松掌握班级秩序,一起来看看吧! 第一步:建立规矩 我们要和孩子们一起建立规矩。规矩要简单明了&#xff…

Go 语言 Printf 函数和格式化动词详解

Printf() 函数可以使用多种格式化动词对输出进行格式化。下面是可以与所有数据类型一起使用的一些通用格式化动词: 通用格式化动词: 以下动词适用于所有数据类型: 动词描述%v以默认格式打印值%#v以 Go 语法格式打印值%T打印值的类型%%打印百…

JAVA小游戏简易版王者荣耀

第一步是创建项目 项目名自拟 第二部创建个包名 来规范class 然后是创建类 GameFrame 运行类 package com.sxt; import java.awt.Graphics; import java.awt.Image; import java.awt.Toolkit; import java.awt.event.ActionEvent; import java.awt.event.ActionListener;…

从0到1建立前端规范

本文适合打算建立前端规范的小伙伴阅读 一、为什么需要规范 规范能给我们带来什么好处,如果没有规范会造成什么后果?这里主要拿代码规范来说。 统一代码规范的好处: 提高代码整体的可读性、可维护性、可复用性、可移植性和可靠性&#xf…

Pytorch项目的文件结构一般都是怎么组织的?

如果是从一些比较典型的论文里弄下来的源码,你会发现它们的论文结构往往都非常复杂。不同的模型、不同的论文,可能代码结构组织的方式都不一样。但它们都不外乎就是经历这几个方面: 1、模型和结构模块定义; 2、数据集获取与处理…

Mybatis反射核心类Reflector

Reflector类负责对一个类进行反射解析&#xff0c;并将解析后的结果在属性中存储起来。 一个类反射解析后都有哪些属性呢&#xff1f;我们可以通过Reflector类定义的属性来查看 public class Reflector {// 要被反射解析的类private final Class<?> type;// 可读属性列…

带你用uniapp从零开发一个仿小米商场_6. 配置uniapp项目底部导航栏tabbar

uniapp底部tabbar介绍 在uni-app中&#xff0c;底部tabbar是一种常见的导航方式&#xff0c;它可以让用户在应用的不同页面之间进行切换。通过tabBar配置项&#xff0c;开发者可以指定一级导航栏和tab切换时显示的对应页。 在底部tabbar中&#xff0c;每个tab都有一个页面路径…

虹科分享 | AR世界揭秘:从二维码的起源到数据识别与位姿技术的奇妙融合!

引言&#xff1a;探索AR的神奇世界&#xff0c;我们将从二维码的诞生谈起。在这个科技的海洋中&#xff0c;二维码是如何帮助AR实现数据获取与位姿识别的呢&#xff1f;让我们一起揭开这层神秘的面纱&#xff01; 一、二维码的由来 二维码是将数据存储在图形中的技术&#xff…

Python | CAP - 累积精度曲线分析案例

CAP通常被称为“累积精度曲线”&#xff0c;用于分类模型的性能评估。它有助于我们理解和总结分类模型的鲁棒性。为了直观地显示这一点&#xff0c;我们在图中绘制了三条不同的曲线&#xff1a; 一个随机的曲线&#xff08;random&#xff09;通过使用随机森林分类器获得的曲线…

Gee教程1.HTTP基础

标准库启动web服务 Go语言内置了 net/http库&#xff0c;封装了HTTP网络编程的基础的接口。这个Web 框架便是基于net/http的。我们先回顾下这个库的使用。 package mainimport ("fmt""log""net/http" )func main() {//可以写成匿名函数(lambda…

【数据结构初阶】树,二叉树

树&#xff0c;二叉树 1.树概念及结构1.1树的概念1.2 树的相关概念1.3 树的表示1.4 树在实际中的运用&#xff08;表示文件系统的目录树结构&#xff09; 2.二叉树概念及结构2.1概念2.2现实中的二叉树2.3 特殊的二叉树2.4 二叉树的性质2.5 二叉树的存储结构 1.树概念及结构 1.…

STM32-SPI3控制MCP3201、MCP3202(Sigma-Delta-ADC芯片)

STM32-SPI3控制MCP3201、MCP3202&#xff08;Sigma-Delta-ADC芯片&#xff09; 原理图手册说明功能方框图引脚功能数字输出编码与实值的转换分辨率设置与LSB最小和最大输出代码&#xff08;注&#xff09; 正负符号寄存器位MSB数字输出编码数据转换的LSB值 将设备输出编码转换为…

SQL JOIN 子句:合并多个表中相关行的完整指南

SQL JOIN JOIN子句用于基于它们之间的相关列合并来自两个或更多表的行。 让我们看一下“Orders”表的一部分选择&#xff1a; OrderIDCustomerIDOrderDate1030821996-09-1810309371996-09-1910310771996-09-20 然后&#xff0c;看一下“Customers”表的一部分选择&#xff…

单片机学习5——外部中断程序

#include<reg52.h>unsigned char a; sbit lcden P3^4;void main() {lcden0;EA1;EX01;IT00;a0xF0; //点亮4位小灯while(1){P1a;} }//中断服务程序 void ext0() interrupt 0 // 0 表示的是外部中断源0 {a0x0f; // 中断处理完&#xff0c;再返回主…