实战OpenCV之物体跟踪

基础入门

        物体跟踪技术是一种计算机视觉领域的重要技术,用于连续地检测和定位视频序列中的一个或多个目标物体。物体跟踪技术在众多领域都有广泛的应用,比如:自动驾驶、安防监控、增强现实等。物体跟踪的基本流程包含以下几个主要步骤。

        1、初始化:确定跟踪的目标物体及其初始位置。

        2、特征提取:提取目标物体的特征,这些特征可以是颜色、纹理、形状或其他描述符。

        3、建模:根据提取的特征建立一个模型,用来描述目标物体。

        4、跟踪:在后续帧中寻找与模型相匹配的目标物体,并更新其位置。

        5、更新模型:根据新的观测结果更新模型,以适应目标物体的变化(比如:旋转、尺度变化等)。

        6、评估:评估跟踪的效果,并采取措施应对丢失的情况(比如:重新初始化等)。

        物体跟踪的方法可以分为以下几个大类。

        1、基于特征的方法

        (1)颜色直方图:通过统计目标物体的颜色分布来建立模型。

        (2)光流:利用像素点之间的运动矢量来跟踪物体。

        (3)特征点:使用特征点(比如:SIFT、SURF、ORB等)进行跟踪。

        2、基于外观模型的方法

        (1)粒子滤波:使用一组粒子表示概率分布,通过重采样更新粒子状态。

        (2)均值漂移:通过迭代更新目标位置,使得目标中心的特征与模板特征最接近。

        (3)卡尔曼滤波:使用线性动态系统模型预测目标状态,并通过观测进行校正。

        3、基于深度学习的方法

        (1)卷积神经网络:使用CNN提取目标特征,并通过回归或分类的方式定位目标。

        (2)视觉Transformer:利用Transformer架构处理图像数据,进行物体检测和跟踪。

        (3)端到端学习:直接从数据中学习整个跟踪过程,无需手动设计特征。

        在以上这些物体跟踪方法中,基于深度学习的方法因其强大的表现力和鲁棒性而成为最常用且效果最好的方法之一。特别是近年来,随着深度学习技术的发展,基于深度学习的物体跟踪方法已经取得了显著的进步,并在许多实际应用中取得了非常好的效果。

        在OpenCV 4.X版本中,新引入了TrackerVit类,以在视频流中有效地跟踪目标物体。

TrackerVit

        TrackerVit是一个基于深度学习的物体跟踪器,它利用Transformer模型的强大表征能力和序列建模能力,可以在视频序列中持续跟踪一个或多个目标物体。与传统的跟踪方法相比,基于Transformer的跟踪器可以在复杂的场景下保持较高的跟踪精度,并且对遮挡、光照变化和尺度变化等情况具有更好的鲁棒性。

        Transformer模型最初是在自然语言处理(NLP)领域提出的,后来被广泛应用于计算机视觉领域。TrackerVit 利用Transformer模型的特点,可以有效地处理图像中的长距离依赖关系,并且能够通过自注意力机制捕捉全局上下文信息。具体来说,TrackerVit包含以下几个组件。

        编码器:用于提取图像中的特征。

        解码器:用于从编码器的输出中,重建目标物体的位置信息。

        自注意力机制:允许模型关注输入序列中的不同部分,并捕捉全局上下文信息。

        位置编码:为序列中的元素添加位置信息,使模型能够区分不同位置的信息。

        TrackerVit的接口比较简单,主要有:create、init、update等,下面分别进行介绍。

        create静态函数用于创建跟踪器,返回一个TrackerVIT类的指针。参数parameters中最重要的是net成员,用于指定物体跟踪的模型文件。

static Ptr<TrackerVit> create(const TrackerVit::Params& parameters = TrackerVit::Params());

        init函数用于初始化跟踪器。参数image为输入的图像,参数boundingBox为目标物体的初始位置和大小。

void init(InputArray image, const Rect& boundingBox);

        update函数用于更新跟踪器。参数image为输入的图像,参数boundingBox为目标物体的位置和大小,跟踪后会被更新。如果跟踪成功,则返回true;否则返回false。

bool update(InputArray image, CV_OUT Rect& boundingBox);

实战解析

        下面的实战代码实现了一个基于TrackerVit的物体跟踪应用,可以选择从视频文件或摄像头实时捕获视频流,并对选定的目标进行跟踪。

        首先,根据宏定义的值来确定视频源。如果设置为0,则打开指定路径的视频文件;否则,打开摄像头设备。接着,我们创建TrackerVit实例并设置参数,包括指定ONNX模型文件路径、模型的后端、目标设备。随后,获取视频帧率并读取第一帧,根据宏定义的值决定是手动选择ROI还是使用固定的 ROI。如果是手动选择,则提示用户在第一帧上选择一个 ROI;否则,使用预先定义的 ROI。

        接下来,我们初始化跟踪器,设置显示窗口,并进入主循环。在主循环中,我们不断从视频流中读取帧,并使用update方法更新跟踪器以获取跟踪结果。如果跟踪成功,则在帧上绘制跟踪到的边界框,并通过imshow函数显示出来。

#include <iostream>
#include <string>
using namespace std;#include <opencv2/opencv.hpp>
#include <opencv2/tracking.hpp>
using namespace cv;
using namespace cv::tracking;#define OBJECT_TRACKING_CAPTURE_MODE           0
#define OBJECT_TRACKING_FIX                    trueint main(int argc, char **argv)
{
#if OBJECT_TRACKING_CAPTURE_MODE == 0// 打开视频文件VideoCapture cap("ObjectTracking.mp4");if (!cap.isOpened()){cout << "Can not open or find the video file" << endl;return -1;}
#else// 打开摄像头VideoCapture cap(0);if (!cap.isOpened()){cout << "Can not open or find the camera" << endl;return -1;}
#endif// 创建TrackerVit实例TrackerVit::Params params;params.net = "object_tracking_vittrack_2023sep.onnx";params.backend = 0;params.target = 0;Ptr<TrackerVit> tracker = TrackerVit::create(params);// 获取视频的帧率int nFPS = (int)cap.get(CAP_PROP_FPS);// 读取第一帧Mat frame;cap >> frame;if (frame.empty()){cout << "Failed to read frame from video stream" << endl;return -1;}#if OBJECT_TRACKING_FIX// 固定某个目标Rect rectRoi(1180, 109, 116, 248);
#else// 画框选择某个目标Mat frame_bak = frame.clone();putText(frame_bak, "1. Drag a bounding box to track.", Point(50, 80), FONT_HERSHEY_SIMPLEX, 1, Scalar(0, 0, 255), 2);putText(frame_bak, "2. Press ENTER to confirm", Point(50, 120), FONT_HERSHEY_SIMPLEX, 1, Scalar(0, 0, 255), 2);Rect rectRoi = selectROI("VitTrack Demo", frame_bak);if (rectRoi.area() == 0){cout << "No ROI is selected" << endl;return -1;}
#endif// 初始化跟踪器tracker->init(frame, rectRoi);namedWindow("Object Tracking", WINDOW_NORMAL);resizeWindow("Object Tracking", 960, 540);while (true){cap >> frame;if (frame.empty()){break;}// 更新跟踪器bool updateOK = tracker->update(frame, rectRoi);if (updateOK){rectangle(frame, rectRoi, Scalar(0, 0, 255), 2);}else{// 跟踪失败cout << "Tracking failure detected" << endl;}imshow("Object Tracking", frame);// 按q键可以退出if (waitKey(1000 / nFPS) == 'q'){break;}}// 释放资源cap.release();destroyAllWindows();return 0;
}

        执行上面的代码,运行效果可参考下图。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/60976.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux环境变量(添加环境变量、修改系统环境变量、内建命令和非内建命令)

Linux环境变量&#xff08;添加环境变量、修改系统环境变量、内建命令和非内建命令&#xff09; 1. 环境变量的介绍 环境变量&#xff08;environment variables&#xff09;一般是指在操作系统中用来指定操作系统运行环境的一些参数。环境变量是在操作系统中一个具有特定名字…

排序算法之插入排序篇

插入排序 思路&#xff1a; 就是将没有排序的元素逐步地插入到已经排好序的元素后面&#xff0c;保持元素的有序 视频的实现过程如下&#xff1a; 插入排序全过程 代码实现过程如下&#xff1a; public static void Insertion(int[] arr) { for (int i 1; i < arr.length…

AVL、B树和B+树

AVL树定义 AVL树&#xff08;Adelson-Velsky 和 Landis 树&#xff09;是一种自平衡的二叉搜索树&#xff08;Binary Search Tree, BST&#xff09;&#xff0c;由苏联数学家Georgy Adelson-Velsky和Evgenii Landis在1962年提出。AVL树通过在每个节点上维护一个平衡因子&#…

Unity ShaderLab 实现3D物体描边

实现思路&#xff1a; 给物体添加第二个材质球&#xff0c;在shader的顶点着色器中使顶点的位置变大&#xff0c;然后在片元着色器中输出描边颜色。 shader Graph实现如下&#xff1a; ShaderLab实现如下&#xff1a; Shader "Custom/Outline" {Properties{[HDR]_…

【C++第三方库】Muduo库结合ProtoBuf库搭建服务端和客户端的过程和源码

每日激励&#xff1a;“不设限和自我肯定的心态&#xff1a;I can do all things。 — Stephen Curry” 绪论​&#xff1a; 本章我将结合之前的这俩个第三方库快速上手protobuf序列化和反序列化框架和muduo网络&#xff0c;来去实现muduo库在protocol协议搭建服务端和客户端。…

Jenkins的使用

文章目录 一、Jenkins是什么\有什么用\与GitLab的对比二、Jenkins的安装与配置Jenkins的安装方式在Linux上安装Jenkins&#xff1a;在Windows上安装Jenkins&#xff1a;配置Jenkins&#xff1a; &#xff08;可选&#xff09;配置启动用户为root&#xff08;一定要是root吗??…

Qml-TabBar类使用

Qml-TabBar类使用 TabBar的概述 TabBar继承于Container 由TabButton进行填充&#xff0c;可以与提供currentIndex属性的任何容器或布局控件一起使用&#xff0c;如StackLayout 或 SwipeView&#xff1b;contentHeight : real:TabBar的内容高度&#xff0c;用于计算标签栏的隐…

Cyberchef 辅助网络安全运营-数据格式转换

在网络安全的世界中&#xff0c;经常会遇到各种格式的数据&#xff0c;比如二进制&#xff0c;比如说16进制&#xff0c;URL编码&#xff0c;HTML编码&#xff0c;Unicode编码&#xff0c;Base格式的编码。网络安全运营一个明确的目标就是把这些不同的数据格式换成为可读的字符…

C语言——指针初阶(一)

目录 一.什么是指针&#xff1f;&#xff1f;&#xff1f; 指针是什么&#xff1f; 指针变量&#xff1a; 总结&#xff1a; 总结&#xff1a; 二.指针和指针类型 指针-整数&#xff1a; 总结&#xff1a; 指针的解引用 总结&#xff1a; 三.野指针 如何规避野指针 往期…

Tcon技术和Tconless技术介绍

文章目录 TCON技术&#xff08;传统时序控制器&#xff09;定义&#xff1a;主要功能&#xff1a;优点&#xff1a;缺点&#xff1a; TCONless技术&#xff08;无独立时序控制器&#xff09;定义&#xff1a;工作原理&#xff1a;优点&#xff1a;缺点&#xff1a; TCON与TCONl…

World of Warcraft /script SetRaidTarget(“target“, n, ““) n=8,7,6,5,4,3,2,1,0

魔兽世界执行当前目标标记方法 /script SetRaidTarget("target", n, "") n8,7,6,5,4,3,2,1,0 解析这个lua脚本 D:\Battle.net\World of Warcraft\_classic_\Interface\AddOns\wMarker wMarker.lua /script SetRaidTarget("target", 8, &quo…

学习笔记035——MySQL索引

数据库索引 索引是为了提高数据的查询速度&#xff0c;相当于给数据进行编号&#xff0c;在查找数据的时候就可以通过编号快速找到对应的数据。 索引内部数据结构&#xff1a;B Tree 主键自带索引。 如&#xff1a; insert into user (id, name) values (1,f); insert int…

在Unity中实现物体动画的完整流程

在Unity中&#xff0c;动画是游戏开发中不可或缺的一部分。无论是2D还是3D游戏&#xff0c;动画都能为游戏增添生动的视觉效果。本文将详细介绍如何在Unity中为物体添加动画&#xff0c;包括资源的准备、播放组件的添加、动画控制器的创建以及动画片段的制作与调度。 1. 准备动…

Python数据分析实例五、US 大选捐款数据分析

美国联邦选举委员会 (FEC) 公布了对政治竞选活动的贡献数据。这包括投稿人姓名、职业和雇主、地址和投款金额。2012 年美国总统大选的贡献数据以单个 150 MB 的 CSV 文件P00000001-ALL.csv形式提供,该文件可以通过以下pandas.read_csv加载: import pandas as pdfec = pd.r…

vue3项目搭建-3-Pinia的使用

Pinia 是集中状态管理工具 基本用法 Pinia 是 Vue 的专属的最新状态管理库&#xff0c;是 Vuex 状态管理工具的替代品 官方文档&#xff1a;pinia官方文档 找到开始目录&#xff0c;根据文档安装和入门 pinia&#xff0c;启用一个新的终端&#xff0c;输入指令 npm install…

SAP开发语言ABAP开发入门

1. 了解ABAP开发环境和基础知识 - ABAP简介 - ABAP&#xff08;Advanced Business Application Programming&#xff09;是SAP系统中的编程语言&#xff0c;主要用于开发企业级的业务应用程序&#xff0c;如财务、物流、人力资源等模块的定制开发。 - 开发环境搭建 - 首先需…

修改bag的frame_id的工具srv_tools

在使用数据集导航或者建图时&#xff0c;bag中的点云或者其他话题的frame_id没有和需要的对应 1.创建工作空间 2.cd xxxx/src 3.git clone https://github.com/srv/srv_tools.git cd .. catkin_make source ./devel/setup.bash rosrun bag_tools change_frame_id.py -t /要改…

IDEA2023版本配置项目全局编码

IDEA默认的项目编码是UTF-8&#xff0c;有时候拿到别人的代码使用的编码是GBK&#xff0c;虽然可以在idea右下角进行修改&#xff0c;但是一个一个的修改太慢了。所以需要去进行该项目的编码全局配置。接下来直接讲步骤&#xff0c;以IDEA2023版本为例。 第一步 File>Sett…

大数据学习18之Spark-SQL

1.概述 1.1.简介 Spark SQL 是 Apache Spark 用于处理结构化数据的模块。 1.2.历史 1.2.1.Shark Hadoop诞生初期&#xff0c;Hive是唯一在Hadoop上运行的SQL-on-Hadoop工具&#xff0c;MR的中间计算过程产生了大量的磁盘落地操作&#xff0c;消耗了大量的I/O&#xff0c;降低…

【Android】Service使用方法:本地服务 / 可通信服务 / 前台服务 / 远程服务(AIDL)

1 本地Service 这是最普通、最常用的后台服务Service。 1.1 使用步骤 步骤1&#xff1a;新建子类继承Service类&#xff1a;需重写父类的onCreate()、onStartCommand()、onDestroy()和onBind()方法步骤2&#xff1a;构建用于启动Service的Intent对象步骤3&#xff1a;调用st…