C++编程:使用 CUDA 将 RGB 图像转换为灰度图的实例

文章目录

    • 0. 引言
    • 1. 实现功能概述
    • 2. 完整代码
    • 3. 代码解释
      • 3.1 CUDA 核心逻辑
      • 3.2 主机端逻辑
      • 3.3 OpenCV 图像处理
    • 4. 编译与运行

0. 引言

本文将以一个简单的例子展示如何使用 CUDA 将 RGB 图像转换为灰度图,并结合 OpenCV 完成图像的加载与保存。

1. 实现功能概述

我们要实现以下功能:

  1. 使用 CUDA 内核,将每个像素从 RGBA 格式转换为灰度值。
  2. 灰度化公式为:Gray = 0.299 * R + 0.587 * G + 0.114 * B
  3. 使用 OpenCV 进行图像加载和保存处理。

代码分为三个部分:

  1. CUDA 核心逻辑:负责灰度化转换的 CUDA 内核实现。
  2. 主机端逻辑:完成内存管理、数据传递以及对 CUDA 内核的调用。
  3. OpenCV 图像操作:用于读取和保存图像文件。

2. 完整代码

// rgba_to_greyscale.h
#ifndef RGBA_TO_GREYSCALE_H_
#define RGBA_TO_GREYSCALE_H_#include <cstdint>// Callback function type for handling the output grey image.
typedef void (*CallbackFun)(int32_t height, int32_t width, uint8_t* h_grey_image);// Converts an RGBA image to greyscale using CUDA.
// Parameters:
// - height: Image height.
// - width: Image width.
// - data: Pointer to RGBA image data.
// - callback: Callback function to handle the output grey image.
int32_t RgbaToGreyscale(int32_t height, int32_t width, uint8_t* data, CallbackFun callback = nullptr);#endif  // RGBA_TO_GREYSCALE_H_
// rgba_to_greyscale.cu
#include "rgba_to_greyscale.h"#include <cuda_runtime.h>
#include <cuda_runtime_api.h>
#include <iostream>
#include <cstring>namespace {// CUDA kernel for RGBA to greyscale conversion.
__global__ void RgbaToGreyscaleKernel(const uchar4* rgba_image, uint8_t* grey_image,int32_t num_rows, int32_t num_cols) {const int32_t id = blockIdx.x * blockDim.x * blockDim.y + threadIdx.y * blockDim.x + threadIdx.x;if (id < num_rows * num_cols) {const uint8_t r = rgba_image[id].x;const uint8_t g = rgba_image[id].y;const uint8_t b = rgba_image[id].z;grey_image[id] = static_cast<uint8_t>(0.299f * r + 0.587f * g + 0.114f * b);}
}}  // namespaceint32_t RgbaToGreyscale(int32_t height, int32_t width, uint8_t* data, CallbackFun callback) {if (data == nullptr) {std::cerr << "Input data is null." << std::endl;return -1;}uchar4* h_rgba_image = reinterpret_cast<uchar4*>(data);int32_t num_pixels = width * height;uchar4* d_rgba_image = nullptr;uint8_t* d_grey_image = nullptr;uint8_t* h_grey_image = nullptr;if (cudaMalloc(&d_rgba_image, sizeof(uchar4) * num_pixels) != cudaSuccess) {std::cerr << "Failed to allocate device memory for RGBA image." << std::endl;return -1;}if (cudaMalloc(&d_grey_image, sizeof(uint8_t) * num_pixels) != cudaSuccess) {std::cerr << "Failed to allocate device memory for greyscale image." << std::endl;cudaFree(d_rgba_image);return -1;}if (cudaHostAlloc(&h_grey_image, sizeof(uint8_t) * num_pixels, cudaHostAllocMapped) != cudaSuccess) {std::cerr << "Failed to allocate host memory for greyscale image." << std::endl;cudaFree(d_rgba_image);cudaFree(d_grey_image);return -1;}if (cudaMemcpy(d_rgba_image, h_rgba_image, sizeof(uchar4) * num_pixels, cudaMemcpyHostToDevice) != cudaSuccess) {std::cerr << "Failed to copy RGBA image data to device." << std::endl;cudaFree(d_rgba_image);cudaFree(d_grey_image);cudaFreeHost(h_grey_image);return -1;}const int32_t threads_per_block = 16;const int32_t num_blocks = (num_pixels + threads_per_block * threads_per_block - 1) /(threads_per_block * threads_per_block);const dim3 block_size(threads_per_block, threads_per_block);const dim3 grid_size(num_blocks);RgbaToGreyscaleKernel<<<grid_size, block_size>>>(d_rgba_image, d_grey_image, height, width);if (cudaDeviceSynchronize() != cudaSuccess) {std::cerr << "CUDA kernel execution failed." << std::endl;cudaFree(d_rgba_image);cudaFree(d_grey_image);cudaFreeHost(h_grey_image);return -1;}if (cudaMemcpy(h_grey_image, d_grey_image, sizeof(uint8_t) * num_pixels, cudaMemcpyDeviceToHost) != cudaSuccess) {std::cerr << "Failed to copy greyscale image data to host." << std::endl;cudaFree(d_rgba_image);cudaFree(d_grey_image);cudaFreeHost(h_grey_image);return -1;}if (callback != nullptr) {callback(height, width, h_grey_image);}cudaFree(d_rgba_image);cudaFree(d_grey_image);cudaFreeHost(h_grey_image);return 0;
}
// main.cpp
#include <opencv2/opencv.hpp>
#include <opencv2/core.hpp>
#include <opencv2/highgui/highgui.hpp>
#include <opencv2/imgproc/imgproc.hpp>#include <iostream>
#include <string>
#include <cstdint>#include "rgba_to_greyscale.h"namespace {// Saves the greyscale image to a file.
void SaveGreyscaleImage(int32_t height, int32_t width, uint8_t* h_grey_image) {const std::string output_file = "out.png";cv::Mat out_image(height, width, CV_8UC1, static_cast<void*>(h_grey_image));if (!cv::imwrite(output_file, out_image)) {std::cerr << "Failed to write the output image: " << output_file << std::endl;}
}}  // namespaceint32_t main() {const std::string input_file = "src.png";cv::Mat image = cv::imread(input_file, cv::IMREAD_COLOR);if (image.empty()) {std::cerr << "Failed to read input image: " << input_file << std::endl;return -1;}cv::Mat image_rgba;cv::cvtColor(image, image_rgba, cv::COLOR_BGR2RGBA);if (RgbaToGreyscale(image_rgba.rows, image_rgba.cols, image_rgba.ptr<uint8_t>(), SaveGreyscaleImage) != 0) {std::cerr << "Failed to convert image to greyscale." << std::endl;return -1;}std::cout << "Converted greyscale image saved successfully." << std::endl;return 0;
}

3. 代码解释

3.1 CUDA 核心逻辑

CUDA 内核函数实现每个线程对一个像素的灰度化处理。以下是核心实现代码:

// CUDA kernel for RGBA to greyscale conversion.
__global__ void RgbaToGreyscaleKernel(const uchar4* rgba_image, uint8_t* grey_image,int32_t num_rows, int32_t num_cols) {const int32_t id = blockIdx.x * blockDim.x * blockDim.y + threadIdx.y * blockDim.x + threadIdx.x;if (id < num_rows * num_cols) {const uint8_t r = rgba_image[id].x;const uint8_t g = rgba_image[id].y;const uint8_t b = rgba_image[id].z;grey_image[id] = static_cast<uint8_t>(0.299f * r + 0.587f * g + 0.114f * b);}
}

说明:

  • 每个线程计算图像中的一个像素点,提升了并行处理效率。
  • 输入参数 rgba_image 是 RGBA 格式的像素数据,输出参数 grey_image 是灰度图像数据。

3.2 主机端逻辑

主机端负责完成 CUDA 内存管理、内核调用以及数据传输。以下是代码实现:


int32_t RgbaToGreyscale(int32_t height, int32_t width, uint8_t* data, CallbackFun callback) {if (data == nullptr) {std::cerr << "Input data is null." << std::endl;return -1;}uchar4* h_rgba_image = reinterpret_cast<uchar4*>(data);int32_t num_pixels = width * height;uchar4* d_rgba_image = nullptr;uint8_t* d_grey_image = nullptr;uint8_t* h_grey_image = nullptr;if (cudaMalloc(&d_rgba_image, sizeof(uchar4) * num_pixels) != cudaSuccess) {std::cerr << "Failed to allocate device memory for RGBA image." << std::endl;return -1;}if (cudaMalloc(&d_grey_image, sizeof(uint8_t) * num_pixels) != cudaSuccess) {std::cerr << "Failed to allocate device memory for greyscale image." << std::endl;cudaFree(d_rgba_image);return -1;}if (cudaHostAlloc(&h_grey_image, sizeof(uint8_t) * num_pixels, cudaHostAllocMapped) != cudaSuccess) {std::cerr << "Failed to allocate host memory for greyscale image." << std::endl;cudaFree(d_rgba_image);cudaFree(d_grey_image);return -1;}if (cudaMemcpy(d_rgba_image, h_rgba_image, sizeof(uchar4) * num_pixels, cudaMemcpyHostToDevice) != cudaSuccess) {std::cerr << "Failed to copy RGBA image data to device." << std::endl;cudaFree(d_rgba_image);cudaFree(d_grey_image);cudaFreeHost(h_grey_image);return -1;}const int32_t threads_per_block = 16;const int32_t num_blocks = (num_pixels + threads_per_block * threads_per_block - 1) /(threads_per_block * threads_per_block);const dim3 block_size(threads_per_block, threads_per_block);const dim3 grid_size(num_blocks);RgbaToGreyscaleKernel<<<grid_size, block_size>>>(d_rgba_image, d_grey_image, height, width);if (cudaDeviceSynchronize() != cudaSuccess) {std::cerr << "CUDA kernel execution failed." << std::endl;cudaFree(d_rgba_image);cudaFree(d_grey_image);cudaFreeHost(h_grey_image);return -1;}if (cudaMemcpy(h_grey_image, d_grey_image, sizeof(uint8_t) * num_pixels, cudaMemcpyDeviceToHost) != cudaSuccess) {std::cerr << "Failed to copy greyscale image data to host." << std::endl;cudaFree(d_rgba_image);cudaFree(d_grey_image);cudaFreeHost(h_grey_image);return -1;}if (callback != nullptr) {callback(height, width, h_grey_image);}cudaFree(d_rgba_image);cudaFree(d_grey_image);cudaFreeHost(h_grey_image);return 0;
}

主要功能:

  1. 将图像数据从主机传输到设备。
  2. 调用 CUDA 内核执行灰度化处理。
  3. 将处理结果从设备传回主机,并调用回调函数保存图像。

3.3 OpenCV 图像处理

主程序中使用 OpenCV 加载原始图像,将其转换为 RGBA 格式,随后调用 RgbaToGreyscale 完成灰度化处理,最后保存结果图像:

// Saves the greyscale image to a file.
void SaveGreyscaleImage(int32_t height, int32_t width, uint8_t* h_grey_image) {const std::string output_file = "out.png";cv::Mat out_image(height, width, CV_8UC1, static_cast<void*>(h_grey_image));if (!cv::imwrite(output_file, out_image)) {std::cerr << "Failed to write the output image: " << output_file << std::endl;}
}}  // namespaceint32_t main() {const std::string input_file = "src.png";cv::Mat image = cv::imread(input_file, cv::IMREAD_COLOR);if (image.empty()) {std::cerr << "Failed to read input image: " << input_file << std::endl;return -1;}cv::Mat image_rgba;cv::cvtColor(image, image_rgba, cv::COLOR_BGR2RGBA);if (RgbaToGreyscale(image_rgba.rows, image_rgba.cols, image_rgba.ptr<uint8_t>(), SaveGreyscaleImage) != 0) {std::cerr << "Failed to convert image to greyscale." << std::endl;return -1;}std::cout << "Converted greyscale image saved successfully." << std::endl;return 0;
}

OpenCV 功能说明:

  1. cv::imread:加载输入图像。
  2. cv::cvtColor:将图像从 BGR 转换为 RGBA。
  3. cv::imwrite:保存灰度化处理后的图像。

4. 编译与运行

编译命令:

nvcc -o rgba_to_greyscale main.cpp rgba_to_greyscale.cu -lopencv_core -lopencv_highgui -lopencv_imgproc

运行命令:
将输入图片命名为 src.png,运行程序:

./rgba_to_greyscale

程序执行完成后,灰度图像将保存为 out.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/61892.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

运维Tips:Docker或K8s集群拉取Harbor私有容器镜像仓库配置指南

[ 知识是人生的灯塔,只有不断学习,才能照亮前行的道路 ] Docker与Kubernetes集群拉取Harbor私有容器镜像仓库配置 描述:在现在微服务、云原生的环境下,通常我们会在企业中部署Docker和Kubernetes集群,并且会在企业内部搭建Harbor私有镜像仓库以保证开发源码安全,以及加快…

2022年计算机网络408考研真题解析

第一题&#xff1a; 解析&#xff1a;网络体系结构-数据链路层 在ISO网络参考模型中&#xff0c;运输层&#xff0c;网络层和数据链路层都实现了流量的控制功能&#xff0c;其中运输层实现的是端到端的流量控制&#xff0c;网络层实现的是整个网络的流量控制&#xff0c;数据链…

鸿蒙NEXT开发案例:文字转拼音

【引言】 在鸿蒙NEXT开发中&#xff0c;文字转拼音是一个常见的需求&#xff0c;本文将介绍如何利用鸿蒙系统和pinyin-pro库实现文字转拼音的功能。 【环境准备】 • 操作系统&#xff1a;Windows 10 • 开发工具&#xff1a;DevEco Studio NEXT Beta1 Build Version: 5.0.…

使用sk-learn 理解TF-IDF

TF-IDF&#xff08;Term Frequency-Inverse Document Frequency&#xff09;是一种常用的文本挖掘技术&#xff0c;用于评估一个词语在一组文档中的重要性。它广泛应用于信息检索和文本挖掘中&#xff0c;尤其是在搜索引擎和推荐系统中。 组成部分 TF-IDF 由两个部分组成&…

【漏洞复现】|百易云资产管理运营系统/mobilefront/c/2.php前台文件上传

漏洞描述 湖南众合百易信息技术有限公司&#xff08;简称&#xff1a;百易云&#xff09;成立于2017年是一家专注于不动产领域数字化研发及服务的国家高新技术企业&#xff0c;公司拥有不动产领域的数字化全面解决方案、覆盖住宅、写字楼、商业中心、专业市场、产业园区、公建、…

408数据结构:栈、队列和数组选择题做题笔记

408数据结构 第一章 绪论 第二章 线性表 绪论、线性表选择题做题笔记 第三章 栈、队列和数组 栈、队列和数组选择题做题笔记 文章目录 408数据结构前言 一、队列二、栈和队列的应用总结 前言 本篇文章为针对王道25数据结构课后习题的栈、队列和数组的做题笔记&#xff0c;后续…

临床检验方法与仪器 第四部分作业:细胞及分子生物学检验仪器

临床检验方法与仪器 第四部分作业 调研“细胞及分子生物学检验仪器”中哪些有国产品牌&#xff0c;说明产品类型及名称&#xff0c;并分析我国产品与国际品牌产品的优势和不足。如果只有国外产品&#xff0c;请说明主要品牌名称和产品优势。 细胞及分子生物学检验仪器包括&…

快速排序&Lambda表达式

快速排序 912. 排序数组 #include <iostream> #include <vector> #include <ctime> #include <algorithm> // 用于交换函数swapusing namespace std;class Solution { public:// 函数功能&#xff1a;对给定数组nums的指定区间[l, r]进行划分操作&am…

网络层协议IP

对于网络层我们直接通过IP协议来了解其内容 一.IP协议 首先我们先来了解几个概念&#xff1a; 主机&#xff1a;配有IP地址&#xff0c;但是不进行路由控制的设备 路由器&#xff1a;配有IP地址&#xff0c;同时进行路由控制的设备 节点&#xff1a;主机和路由器的统称 所以现在…

cryptography与zlib系列:数据分块解密与解压

cryptography与zlib系列&#xff1a;数据分块解密与解压 数据分块压缩与加密可以查看我的另外一篇博客&#xff0c;这里与之相对应的是解密与解压的操作。解压之后的数据转为BytesIO对象用于后续读取&#xff0c;适用于大部分数据格式&#xff0c;而不需要从文件中读取。 完整…

react函数式组件中的路由传参方式

React Router 提供了多种方式来传递路由参数&#xff1a; URL 路径参数&#xff1a;通过动态路由和 useParams 获取。查询参数&#xff1a;通过 useLocation 获取 URL 查询字符串。路由状态传递&#xff1a;通过 state 属性在导航时传递数据&#xff0c;不在 URL 中显示&#…

八股文-基础知识-面试题汇总(一)

面向对象和面向过程的区别&#xff1f; 面向对象和面向过程是两种不同的编程范式&#xff0c;它们在设计和实现软件时有着不同的理念和方法。面向对象更适合大型、复杂的项目&#xff0c;尤其是需要维护和扩展的系统&#xff1b;而面向过程更适合小型、线性的任务或对性能要求…

道品智能科技移动式水肥一体机:农业灌溉施肥的革新之选

在现代农业的发展进程中&#xff0c;科技的力量正日益凸显。其中&#xff0c;移动式水肥一体机以其独特的可移动性、智能化以及实现水肥一体化的卓越性能&#xff0c;成为了农业领域的一颗璀璨新星。它不仅改变了传统的农业灌溉施肥方式&#xff0c;更为农业生产带来了高效、精…

数据结构 (10)队列

前言 队列是一种特殊的数据结构&#xff0c;它遵循先进先出&#xff08;FIFO&#xff0c;First In First Out&#xff09;的原则。 一、定义与基本概念 定义&#xff1a;队列是一种只允许在一端&#xff08;队尾&#xff09;进行插入操作&#xff0c;而在另一端&#xff08;队头…

C#中的异步操作

在 C# 中&#xff0c;异步编程主要是通过 async 和 await 关键字实现的&#xff0c;它们使得异步操作变得更加简洁和易于维护。以下是关于异步线程用法的基本介绍&#xff0c;以及如何编写一个异步函数的步骤和示例。在之前的项目中我其实一直在用这些异步的方法&#xff0c;今…

Python3 WebUI自动化总篇:Python3+Selenium+Pytest+Allure+ Jenkins webUI自动化框架

Python3 WebUI自动化总篇: Python3+Selenium+Pytest+Allure+ Jenkins webUI自动化框架 WebUI接口框架使用的工具

【数据分享】2001-2023年我国30米分辨率冬小麦种植分布栅格数据(免费获取)

小麦、玉米、水稻等各类农作物的种植分布数据在农业、环境、国土等很多专业都经常用到&#xff01; 本次给大家分享的是我国2001-2023年逐年的30米分辨率冬小麦种植分布栅格数据&#xff01;数据格式为TIFF格式&#xff0c;数据坐标为GCS_WGS_1984。该数据包括我国11个省份的冬…

Linux和Ubuntu的关系

Linux和Ubuntu的关系&#xff1a; 1. Linux本身是内核&#xff0c;Ubuntu系统是基于Linux内核的操作系统。 2. Linux内核操作系统的构成&#xff1a; 内核、shell、文件系统、应用程序 -应用程序&#xff1a;文本编辑器等 -文件系统&#xff1a;文件存放在存储设备上的组织方…

17.5k Star,ThingsBoard 一款开源、免费、功能全面的物联网 IoT 平台 -慧知开源充电桩平台

项目介绍 ThingsBoard是一个开源、免费、功能全面、灵活易用的物联网&#xff08;IoT&#xff09;平台&#xff0c;专注于数据收集、处理、可视化以及设备管理。它提供了一个全面的解决方案&#xff0c;用于构建和管理物联网应用。支持从各种设备收集数据&#xff0c;通过内置…

力扣面试150 填充每个节点的下一个右侧节点指针 II BFS 逐层构建法

Problem: 117. 填充每个节点的下一个右侧节点指针 II &#x1f37b; BFS 空间优化 &#x1f469;‍&#x1f3eb; 参考题解 ⏰ 时间复杂度: O ( n ) O(n) O(n)&#x1f30e; 空间复杂度: O ( 1 ) O(1) O(1) class Solution {public Node connect(Node root) {if (root …