【OpenCV】计算视频的光流并跟踪物体calcOpticalFlowPyrLK

 一、介绍

        计算光流可以使用OpenCV的calcOpticalFlowPyrLK方法,cv2.calcOpticalFlowPyrLK是OpenCV库中的一个函数,用于计算稀疏光流。它实现的是Lucas-Kanade方法,这是一种常用的光流计算方法。

        光流是图像中物体运动的近似表示,它描述了图像中每个像素点在连续两帧之间的移动。Lucas-Kanade方法假设图像中的一个小邻域内的所有像素在运动上是一致的(即具有相同的光流)。

二、原理

        以下是cv2.calcOpticalFlowPyrLK的基本工作原理:

        1. 选择特征点:在第一帧图像中选择一些特征点。这些特征点通常是角点,因为角点具有在所有方向上的变化,更容易被跟踪。

        2. 窗口:对于每一个特征点,定义一个周围的窗口。

        3. 光流:对于每一个窗口,假设所有像素具有相同的光流,然后通过最小化该窗口内像素在第一帧和第二帧之间的亮度差异,来求解光流。

        4. 金字塔:实际上,由于运动可能在不同的尺度上发生,所以cv2.calcOpticalFlowPyrLK实际上在图像的多个尺度(金字塔的每一层)上重复以上步骤。这就是所谓的金字塔Lucas-Kanade方法。

        需要注意的是,由于Lucas-Kanade方法假设一个窗口内的所有像素具有相同的光流,所以它只能处理小的和平滑的运动。对于大的或复杂的运动,需要使用更复杂的方法,如Horn-Schunck方法 

三、代码实现

        下面这段代码实现了识别特征点,并跟踪这些特征点,画出每个点的移动轨迹

import numpy as np
import cv2src_path = r'input.mp4'
target_path = r'output.mp4'fps = 25
cap = cv2.VideoCapture(src_path)# ShiTomasi corner detection的参数
feature_params = dict(maxCorners=300,qualityLevel=0.3,minDistance=7,blockSize=7)
# 光流法参数
# maxLevel 未使用的图像金字塔层数
lk_params = dict(winSize=(10, 10),maxLevel=2,criteria=(cv2.TERM_CRITERIA_EPS | cv2.TERM_CRITERIA_COUNT, 10, 0.03))ret, old_frame = cap.read()                             # 取出视频的第一帧
old_gray = cv2.cvtColor(old_frame, cv2.COLOR_BGR2GRAY)  # 灰度化
p0 = cv2.goodFeaturesToTrack(old_gray, mask=None, **feature_params)
mask = np.zeros_like(old_frame)                         # 为绘制创建掩码图片
h, w, _ = old_frame.shape
target_video = cv2.VideoWriter(target_path,cv2.VideoWriter_fourcc(*"H264"), fps, (w, h))
while True:res, frame = cap.read()if not res:breakframe_gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)# 计算光流以获取点的新位置p1, st, err = cv2.calcOpticalFlowPyrLK(old_gray, frame_gray, p0, None, **lk_params)# 选择good pointsgood_new = p1[st == 1]good_old = p0[st == 1]good_new1 = good_new.copy()for i, (new, old) in enumerate(zip(good_new, good_old)):a, b = new.ravel()c, d = old.ravel()mask = cv2.line(mask, (int(a), int(b)), (int(c), int(d)), (0,255,0), 3)frame = cv2.circle(frame, (int(a), int(b)), 5, (0,255,0), -1)img = cv2.add(frame, mask)target_video.write(img)old_gray = frame_gray.copy()p0 = good_new1.reshape(-1, 1, 2)target_video.release()
cv2.destroyAllWindows()
cap.release()

四、参数解释

1.calcOpticalFlowPyrLK输入参数解释

1. prevImg:上一帧输入图像。

2. nextImg:本轮输入图像。

3. prevPts:从上一帧图像中提取的特征点(2D点向量)。

4. nextPts:从本轮图像中提取的点(2D点向量),包含计算得到的新位置。

5. winSize:每一级金字塔的搜索窗口大小。默认值是Size(21,21)。

        图像金字塔是通过对原始图像进行连续的下采样操作得到的一系列图像,每一层的图像都比上一层的图像小。这就像一个金字塔,底部是原始的大图像,顶部是最小的图像。图像金字塔被用于处理不同尺度的运动。这是因为在实际的图像中,物体的运动可能在不同的尺度上发生。例如,远离摄像头的物体在图像中的运动可能比较小,而靠近摄像头的物体在图像中的运动可能比较大。通过在图像金字塔的每一层上计算光流,可以处理这种不同尺度的运动。

6. maxLevel:基于0的最大金字塔等级数;如果设置为0,则不使用金字塔(单级),如果设置为1,则使用两级等。默认值是3。

        在构建图像金字塔时,从原始图像开始,每一层图像的尺寸都是上一层图像尺寸的一半,maxLevel就是这个金字塔的最大层数。maxLevel=0表示只使用原始图像,maxLevel=1表示原始图像和它的一半尺寸的图像,maxLevel=2表示原始图像、一半尺寸的图像和四分之一尺寸的图像,以此类推。

7. criteria:criteria是一个重要的参数,需要详细说一下,该参数是一个指定迭代搜索算法的终止准则的元组。它包含三个元素:
        (1) cv2.TERM_CRITERIA_EPS 或 cv2.TERM_CRITERIA_COUNT 或两者的组合。这些是终止准则的类型:
- cv2.TERM_CRITERIA_EPS:达到指定的精度epsilon时,迭代就会停止。
- cv2.TERM_CRITERIA_COUNT:达到指定的最大迭代次数时,迭代就会停止。
- cv2.TERM_CRITERIA_EPS | cv2.TERM_CRITERIA_COUNT:当任一上述条件满足时,迭代就会停止。
        (2) 最大迭代次数。在这个例子中,最大迭代次数是10。
        (3)epsilon,即所需的精度。在这个例子中,epsilon是0.03。
例如,criteria=(cv2.TERM_CRITERIA_EPS | cv2.TERM_CRITERIA_COUNT, 10, 0.03)意味着迭代将在达到10次迭代或误差精度达到0.03时停止,以先到达的条件为准 

8. flags:操作标志。可以设置为

        (1)0:没有特殊行为。

        (2)cv2.OPTFLOW_USE_INITIAL_FLOW:如果设置了这个标志,那么函数会使用nextPts参数中的点作为初始近似值,然后进行优化。否则,它会直接使用prevPts参数中的点作为初始值。
         (3)cv2.OPTFLOW_LK_GET_MIN_EIGENVALS:如果设置了这个标志,那么函数会计算每个点的最小特征值并将它们存储在err参数中。

        0,cv2.OPTFLOW_USE_INITIAL_FLOW或cv2.OPTFLOW_LK_GET_MIN_EIGENVALS。

        例如,如果你想使用nextPts中的点作为初始近似值,你可以这样调用函数:

p1, st, err = cv2.calcOpticalFlowPyrLK(old_gray, frame_gray, p0, None, flags=cv2.OPTFLOW_USE_INITIAL_FLOW, **lk_params)

9. minEigThreshold:最小特征值的阈值。默认值是1e-4。

这个函数的主要目的是使用Lucas-Kanade方法在两个图像之间跟踪一些特征点(prevPts)。这些特征点的新位置被存储在nextPts中。如果一个点不能被跟踪(例如,因为它走出了图像),那么status向量的相应元素就会被设置为0 

2.calcOpticalFlowPyrLK输出参数解释

1. nextPts:这是一个数组,包含了在下一帧图像中找到的输入特征点的新位置。

2. status:这是一个数组,和输入的特征点数组大小相同。如果status[i]为1,表示找到了第i个特征点的新位置,如果为0,表示没有找到。

3. err:这是一个数组,和输入的特征点数组大小相同。err[i]表示第i个特征点的新位置和原位置之间的误差,这个误差是基于窗口大小的。

这三个输出参数可以用于理解和评估光流的计算结果。例如,你可以检查status数组来看哪些特征点在下一帧图像中被成功找到,或者查看err数组来评估光流的计算精度 

        calcOpticalFlowPyrLK的用法就简单介绍到这,关注不迷路(#^.^#)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/139658.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

暴力递归转动态规划(十五)

题目 给定一个正数n,求n的裂开方法数, 规定:后面的数不能比前面的数小 比如4的裂开方法有: 1111、112、13、22、04 。 5种,所以返回5 暴力递归 用暴力递归方法进行尝试,整体思路是这样: 暴力递…

边缘分布式机器学习

目录 通信机制同步Synchronous异步Asynchronous半同步/延时同步通信的拓扑结构基于迭代式MapReduce的通信(同步模式)基于MPI之AllReduce的通信(同步模式)AllReduce有很多变种 基于参数服务器的通信(多为异步&#xff0…

傅里叶分析(1)

1 概述 傅里叶分析是信号分析中常用方法之一。傅里叶分析可将信号在时域和频域之间进行转换,从而分析信号在频域上的特点。 傅里叶分析(Fourier analysis)根据信号的时域数据特征,分为 4 个类别: 傅里叶级数&#x…

如何在 Python 中执行 MySQL 结果限制和分页查询

Python MySQL 限制结果 限制结果数量 示例 1: 获取您自己的 Python 服务器 选择 “customers” 表中的前 5 条记录: import mysql.connectormydb mysql.connector.connect(host"localhost",user"您的用户名",password"您的密码"…

基于安卓android微信小程序的物流仓储系统

项目介绍 本文以实际运用为开发背景,运用软件工程原理和开发方法,它主要是采用java语言技术和mysql数据库来完成对系统的设计。整个开发过程首先对物流仓储系统进行需求分析,得出物流仓储系统主要功能。接着对物流仓储系统进行总体设计和详细…

Vue.Draggable 踩坑:add 事件与 change 事件中 newIndex 字段不同之谜

背景 最近在弄自定义表单,需要拖动组件进行表单设计,所以用到了 Vue.Draggable(中文文档)。Vue.Draggable 是一款基于 Sortable.js 实现的 vue 拖拽插件,文档挺简单的,用起来也方便,但没想到接下来给我遇到了灵异事件……

PySide/PYQT如何用Qt Designer和代码来设置文字属性,如何设置文字颜色?

文章目录 📖 介绍 📖🏡 环境 🏡📒 实现方法 📒📝 Qt Designer设置📝 代码📖 介绍 📖 本人介绍如何使用Qt Designer/代码来设置字体属性(包含字体颜色) 🏡 环境 🏡 本文使用Pyside6来进行演示📒 实现方法 📒 📝 Qt Designer设置 首先打开Qt De…

如何在ModelScope社区魔搭下载所需的模型

本篇文章介绍如何在ModelScope社区下载所需的模型。 若您需要在ModelScope平台上有感兴趣的模型并希望能下载至本地,则ModelScope提供了多种下载模型的方式。 使用Library下载模型 若该模型已集成至ModelScope的Library中,则您只需要几行代码即可加载…

PostgreSQL 14.3 源码安装调试

摘要:介绍PostgreSQL 14.3 源码安装,postgresql使用和vscode源码调试。 1. 环境准备 1.1 系统参数修改 systemctl status firewalld.service #查看防火状态 systemctl stop firewalld.service #暂时关闭防火墙 systemctl disable firewalld.service …

爬虫怎么伪装才更安全

随着网络技术的不断发展,爬虫技术也越来越成熟,爬虫伪装技术也随之得到了广泛应用。在爬虫伪装技术中,如何伪装成正常的浏览器行为,让目标网站无法辨别出爬虫的存在,是爬虫伪装技术的核心。下面,我将从以下…

mysql8安装和驱动jar包下载

方式一:基于docker安装 下拉镜像 docker pull mysql:8.0.21 启动镜像 docker run -p 3307:3306 --name mysql -e MYSQL_ROOT_PASSWORDhadoop -d mysql:8.0.21 启动成功后,进入容器内部拷贝配置文件,到宿主主机 docker cp mysql:/etc/mysql…

人工智能基础——图像认知与OpenCV

人工智能的学习之路非常漫长,不少人因为学习路线不对或者学习内容不够专业而举步难行。不过别担心,我为大家整理了一份600多G的学习资源,基本上涵盖了人工智能学习的所有内容。点击下方链接,0元进群领取学习资源,让你的学习之路更加顺畅!记得…

pandas笔记:读写excel

1 读excel read_excel函数能够读取的格式包含:xls, xlsx, xlsm, xlsb, odf, ods 和 odt 文件扩展名。 支持读取单一sheet或几个sheet。 1.0 使用的数据 1.1 主要使用方法 pandas.read_excel(io, sheet_name0, header0, namesNone, index_colNone, usecolsNon…

pyqt环境搭建

创建虚拟环境 # 用管理员身份运行 conda create --prefixE:\Python\envs\pyqt5stu python3.6 # 激活虚拟环境 conda activate E:\Python\envs\pyqt5stu # 退出虚拟环境 conda deactivate安装包 pip install PyQt5 -i https://pypi.douban.com/simple pip install PyQt5-tools…

如何用Excel软件制作最小二乘法①

一、用自带的选项(不推荐),因为感觉只是近似,虽然结果一样 1.在Excel中输入或打开要进行在excel中输入或打开要进行最小二乘法拟合的数据,如图所示。 2.按住“shift”键的同时,用鼠标左键单击以选择数据&a…

【4】Gradle-快速入门使用【Gradle多模块项目详解】

目录 【4】Gradle-快速入门使用【Gradle多模块项目详解】创建多项目构建添加子项目命名建议 项目依赖项项目路径不同模块的build.gradle配置 子项目之间共享构建逻辑公约插件跨项目配置buildSrc开发公约插件 调整多模块项目配置修改项目树的元素 了解Gralde配置时间和执行时间并…

C#开发的OpenRA游戏之游戏设计思路

OpenRA设计思路 在OpenRA有很多部分的内容,比如UI、渲染、单元行为等等。 不过在地图里,所有单元、建筑物、其它物品都是采用Actor来实现。每个Actor包含一系列Trait属性。 Trait属性有info类和同名称操作类构成。有一个信息类实例在同一类型的所有参与者之间共享。每个Act…

【CSS】全局声明引入自定义字体

以下用vue项目为例,其他的也是类似! 在Vue.js中可以使用全局样式表来定义字体。通常,可以在项目中的主样式表中定义全局字体,然后确保该样式表在整个应用程序中被引入。 以下是一般的步骤: 在项目中创建一个全局样式…

CDN是如何减去源机压力的

CDN也叫内容分发网络(Content Delivery Network)。分布在不同地区的节点服务器组成的分布式网络。通过中心平台的各种功能模块,可以使用户直接访问到就近的节点上,更快获取到需要的内容,大大降低了网络拥堵&#xff0c…

红黑树,AVLTree树(平衡二叉树)迭代器原理讲解

红黑树,AVLTree树底层实现逻辑都是平衡二叉树(AVLTree高度平衡,红黑树以某种规则平衡),但终究不像链表的迭代器那样逻辑简单。 简单叙述以下,二叉树上面迭代器的运行逻辑,根据下面的图&#xff…