探索QCS6490目标检测AI应用开发(二):摄像头视频的拉取和解码

作为《探索QCS6490目标检测AI应用开发》文章,紧接上一期,我们介绍如何在应用程序中拉取视频流,并且用硬件解码,得到逐帧的图像画面。我们使用了高通的Intelligent Multimedia SDK(IM SDK)完成视频的拉流和硬件解码的工作,IMSDK 是一套基于GStreamer框架开发的多媒体SDK,里面包含了多媒体应用开发的多个插件,用极少的代码量就能够高效的利用了硬件资源。

有关IMSDK的使用和介绍,参考文档Qualcomm Documentation

1.准备工作

1.1 前置条件

在踏上开发之旅前,我们需要确保开发环境的完备。这不仅包括安装适用于QCS6490的开发工具链,更涉及到根据《高通QCS6490开发(六):连接使用摄像头》完成摄像头的接线工作,确保硬件的无缝对接。

1.2 摄像头测试预览

完成摄像头的连接后,我们执行以下命令用于

gst-launch-1.0 qtiqmmfsrc name=camsrc ! video/x-raw,format=NV12,framerate=30/1,width=1920,height=1080 ! videoconvert ! video/x-raw,framerate=30/1 ! waylandsink fullscreen=true async=true

这个GStreamer的命令,用qtiqmmfsrc拉取一个视频预览 输出的格式为NV12 分辨率是1920x1080的高清分辨率

video/x-raw,format=NV12,framerate=30/1,width=1920,height=1080 

最后通过videoconvert和waylandsink插件,将高清视频流以30fps的帧率流畅地显示在屏幕上

2 视频流处理与硬件解码

2.1 视频解码

视频解码是视频流处理的第一步。在QCS6490上拉取摄像头视频解码后,通过videoconvert转换格式,然后使用appsink将解码后的视频帧传递给应用程序进行进一步处理

gst-launch-1.0 qtiqmmfsrc name=camsrc ! video/x-raw,format=NV12,framerate=30/1,width=1920,height=1080 ! videoconvert ! video/x-raw,framerate=30/1 ! appsink

对应的,C++的代码实现可以参考

sample-apps-for-robotics-platforms/RB5/linux_kernel_5_x/AI-ML-apps/AI_Age_Gender_Emotion_Solution/src/StreamDecode.cpp at 68b77ac20929ae21263f92ed7bfda58641c11227 · quic/sample-apps-for-robotics-platforms · GitHub

2.2 应用程序中的推理

在应用程序中,我们将在appsink中获取用解码后的视频帧画面,把图像进行目标检测的推理。涉及到推理的具体实现我们放在下一期的文章讲解

​​​​​​​2.3 结果展示

推理完成后,我们需要将检测结果(如物体框)绘制到视频帧上,并显示给用户。这可以通过修改GStreamer Pipeline来实现:

appsrc stream-type=0 is-live=true caps=video/x-raw,format=BGR,width=1920,height=1080! videoconvert ! video/x-raw,width=1920,height=1080 ! waylandsink

这个Pipeline从应用程序接收处理后的视频帧,通过videoconvert转换格式,然后使用waylandsink显示在屏幕上,实现代码参考

sample-apps-for-robotics-platforms/RB5/linux_kernel_5_x/AI-ML-apps/AI_Tracker_Solution/src/StreamEncode.cpp at 68b77ac20929ae21263f92ed7bfda58641c11227 · quic/sample-apps-for-robotics-platforms · GitHub

作者:Ricky Li

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/34578.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux杀僵尸进程

ps -A -o stat,ppid,pid,cmd | grep -e ^[Zz] | awk {print $2}1、查看系统是否有僵尸进程 使用Top命令查找,当zombie前的数量不为0时,即系统内存在相应数量的僵尸进程。 2、定位僵尸进程 使用命令 ps -A -ostat,ppid,pid,cmd |grep -e [Zz]定位僵尸…

Kafka入门-分区及压缩

一、生产者消息分区 Kafka的消息组织方式实际上是三级结构:主题-分区-消息。主题下的每条消息只会保存在某一个分区中,而不会在多个分区中被保存多份。 分区的作用就是提供负载均衡的能力,或者说对数据进行分区的主要原因,就是为…

数据库与表的基本操作:构建数据世界的基石(三)

引言:从零构建数据结构的艺术 在上一章节《安装与配置》中,我们成功地在不同的操作系统上安装并配置了MySQL,为实战数据库管理奠定了坚实的基础。本章节,我们将深入探索数据库与表的基本操作,包括如何创建、删除数据库…

RandLA-Net语义分割

项⽬地址: GitHub - tsunghan-wu/RandLA-Net-pytorch: :four_leaf_clover: Pytorch Implementation of RandLA-Net (https://arxiv.org/abs/1911.11236) 搭建环境并配置RandLA-Net 根据Environment Setup 搭建环境(除了requirements.txt中的库&#xf…

畅谈GPT-5

前言 ChatGBT(Chat Generative Bidirectional Transformer)是一种基于自然语言处理技术的对话系统,它的出现是人工智能和自然语言处理技术发展的必然趋势。随着技术的更新和进步,GPT也迎来了一代代的更新迭代。 1.GPT的回顾 1.1 GPT-3的介绍 GPT-3(Gen…

门店客流统计)

门店客流统计 代码部分效果 代码部分 import cv2 import numpy as np from tracker import * import cvzone import timebg_subtractor cv2.createBackgroundSubtractorMOG2(history200, varThreshold140)# Open a video capture video_capture cv2.VideoCapture(r"sto…

昇思25天学习打卡营第3天|数据集与数据变换

数据集 数据集(Dataset)操作shufflemapbatch 数据变换(Transforms)Vision TransformsText TransformsLambda Transforms 总结 数据集(Dataset) 数据是深度学习的基础,深度神经网络的效果对数据…

力扣377 组合总和Ⅳ Java版本

文章目录 题目描述代码 题目描述 给你一个由 不同 整数组成的数组 nums ,和一个目标整数 target 。请你从 nums 中找出并返回总和为 target 的元素组合的个数。 题目数据保证答案符合 32 位整数范围。 示例 1: 输入:nums [1,2,3], targe…

algorithm中常见算法

1、前言 C的<algorithm>库是C标准库中的一个重要组成部分&#xff0c;它提供了一系列的函数&#xff0c;用于执行各种常见的算法操作&#xff0c;比如排序、查找、替换、合并等。这些算法函数通常以模板函数的形式提供&#xff0c;可以用于任何符合特定条件的容器类型。 …

玩个游戏 找以下2个wordpress外贸主题的不同 你几找到几处

Aitken艾特肯wordpress外贸主题 适合中国产品出海的蓝色风格wordpress外贸主题&#xff0c;产品多图展示、可自定义显示产品详细参数。 https://www.jianzhanpress.com/?p7060 Ultra奥创工业装备公司wordpress主题 蓝色风格wordpress主题&#xff0c;适合装备制造、工业设备…

用友U8 Cloud smartweb2.showRPCLoadingTip.d XXE漏洞复现

0x01 产品简介 用友U8 Cloud 提供企业级云ERP整体解决方案,全面支持多组织业务协同,实现企业互联网资源连接。 U8 Cloud 亦是亚太地区成长型企业最广泛采用的云解决方案。 0x02 漏洞概述 用友U8 Cloud smartweb2.showRPCLoadingTip.d 接口处存在XML实体,攻击者可通过该漏…

Origin做聚类分析并利用聚类插件绘制热力图

1.聚类分析 1.1 K均值聚类 step1、首先进行归一化&#xff0c;具体步骤如图1-1所示&#xff1a; 图1-1 操作后得到归一化值如图1-2所示&#xff1a; 图1-2 step2、执行K均值聚类分析&#xff0c;如图1-3所示&#xff0c;选中聚类列&#xff0c;接着点击“统计”—“多变量分析…

webrtc-m120编译

WebRTC实时互动入门 环境 lsb_release -a No LSB modules are available. Distributor ID: Ubuntu Description: Ubuntu 22.04.4 LTS Release: 22.04 Codename: jammyuname -a Linux yqw-Lenovo-XiaoXinPro-13ARE-2020

手把手从零开始搭建远程访问服务

远程访问服务工具——FRP frp 是一个能够实现内网穿透的高性能的反向代理应用&#xff0c;支持 TCP、UDP、HTTP、HTTPS 等多种协议。可以将内网服务以安全、便捷的方式通过具有公网的服务器来转发。 资源链接 根据自己服务型号和操作系统来选取对应的文件&#xff0c;不知道的…

VS2019中解决方案里的所有项目都是 <不同选项> 的解决方案

以上等等&#xff0c;全部是 <不同选项>。。。 这样的话&#xff0c;如何还原和查看原有的值呢&#xff0c;就这么丢失掉了吗&#xff1f; 不会&#xff0c;需要解决方案里配置一下。 解决&#xff1a; 解决方案右键属性 -> 配置属性 -> 配置 -> 将所有配置改…

三大办公软件实用小技巧 沈阳办公软件白领必修班

Word 学好办公软件能大大的提升我们的工作效率。下面让我们一起学习一下Word办公软件时几个实用小技巧&#xff01; 01.快速插入当前日期或时间 在使用Word办公软件进行文档的编辑处理时&#xff0c;如果需要在文章的末尾插入系统的当前日期或时间。通常情况下&#xff0c;我…

如何编写时区源文件

0、背景 ① 修改TZ环境变量改变时区不能立即生效。要求设置时区后立即生效&#xff0c;只能用修改/etc/localtime方式。 ② 原文作者 Bill Seymour&#xff0c;想要查看原文&#xff0c;点击官网地址https://www.iana.org/time-zones下载 zic 源码&#xff0c;源码目录中的 tz…

【TB作品】MSP430,G2533单片机,红外发射,红外接收,红外通信,IR发射

文章目录 题目红外NEC协议介绍基本概述数据帧结构位表示数据传输示例重复码&#xff08;Repeat Code&#xff09;实现细节发送端接收端 典型应用结论 最终效果代码 题目 遥控器 硬件&#xff1a;msp430g2553、oled显示器、ds18b20温度传感器、红外发射器、按键 软件功能&#…

Elasticsearch 使用问题记录

文章目录 Elasticsearch 使用问题记录Text类型的字段&#xff0c;无法进行聚合和排序高亮查询匹配过多&#xff0c;超出高亮默认限制 Elasticsearch 使用问题记录 Text类型的字段&#xff0c;无法进行聚合和排序 问题背景&#xff1a;在使用Elasticsearch的过程中&#xff0c;…

【深度学习】基础数据结构+访问

目录 深度学习中的基础数据结构1. N维数组定义特点访问元素 2. 机器学习中常用的数据结构N维数组示例 3. 数学中的访问操作带跳转的子区域访问示例 4. 数学中的访问操作4.1 一维数组&#xff08;向量&#xff09;访问一个区间带步长的区间访问 4.2 二维数组&#xff08;矩阵&am…