光流法相关论文-LK光流法,HS光流法,Farneback光流法,FlowNet: 端到端的深度光流估计, RAFT: 结构化的光流估计

目录

 光流法      

1. Lucas-Kanade光流法(稀疏光流法):

2. Horn-Schunck光流法(稠密光流法):

3. Farneback光流法:

4  FlowNet: 端到端的深度光流估计:

5. RAFT: 结构化的光流估计:


 光流法      

         光流法(Optical Flow)是计算机视觉领域中的一种技术,用于描述图像序列中物体点在不同帧之间的运动模式。光流法的基本思想是通过分析图像中像素的亮度变化,推测出相邻图像帧之间物体点的位移或速度。光流法在很多应用中都具有重要意义,如运动分析、目标跟踪、三维重建、虚拟现实等。

光流法的原理建立在一些假设基础上:

  1. 连续性假设: 在短时间内,物体点的运动是连续的,即相邻帧之间的运动不会发生突变。

  2. 亮度一致性假设: 在相邻图像帧中,物体点的亮度保持不变,即一个点在不同帧中的像素值应该是一致的。

        基于这些假设,光流法尝试通过计算每个像素的位移向量(光流向量),来表示物体点在相邻帧中的运动情况。光流向量的大小代表物体点的运动速度,方向表示运动的方向。

在计算光流时,有几种不同的方法:

  1. 基于亮度变化的方法: 这些方法利用相邻帧之间的亮度变化来推断光流。基本思想是最小化两帧之间像素的灰度差异。

  2. 基于相关性的方法: 这类方法通过计算相邻图像中像素的互相关性来确定光流。它们在寻找亮度模式的匹配方面更为强大。

  3. 基于能量优化的方法: 这些方法将光流估计问题转化为能量最小化问题,使用各种优化技术求解,以找到最佳的光流场。

  4. 基于机器学习的方法: 近年来,深度学习技术在光流估计中也取得了重大进展。使用卷积神经网络等技术,可以从图像中学习复杂的光流模式。

        虽然光流法在理论上简单,但在实际应用中面临许多挑战,如遮挡、纹理不连续、光照变化等。因此,根据应用场景的不同,选择合适的光流估计方法非常重要。

以下是光流法的几篇代表性论文:

1. Lucas-Kanade光流法(稀疏光流法):

Lucas, B. D., & Kanade, T. (1981). An iterative image registration technique with an application to stereo vision. In IJCAI (Vol. 81, No. 1, pp. 674-679).

        这篇论文的主要内容涉及图像处理领域中的图像配准技术,特别是在立体视觉应用中的应用。图像配准是指将两幅或多幅图像对齐,以便进行比较、分析或合并。在立体视觉中,将两幅或多幅图像进行配准可以用来生成深度图、三维模型以及其他立体视觉相关的信息。

        论文的主要贡献是介绍了一种迭代式的图像配准技术。这种技术的目标是在一个图像中找到与另一个图像中的相应点相匹配的点,从而实现两幅图像之间的配准。为了实现这一目标,作者提出了一种基于局部图像亮度一致性的迭代优化方法,该方法可以在图像中搜索相应点的位置,并通过不断迭代优化来逐步提高匹配的准确性。

        该论文在计算机视觉领域引起了广泛的兴趣,因为图像配准是许多计算机视觉任务的关键步骤,包括立体视觉、目标跟踪、图像拼接等。论文提出的迭代式配准技术为后来的研究和应用提供了一个基础框架,许多后续的图像配准方法都受到了这篇论文的启发。

        总的来说,在这篇论文中介绍了一种重要的图像配准技术,该技术在计算机视觉领域产生了深远的影响,并为立体视觉等应用提供了关键的方法。

2. Horn-Schunck光流法(稠密光流法):

        Horn, B. K., & Schunck, B. G. (1981). Determining optical flow. Artificial intelligence, 17(1-3), 185-203.

        这篇论文主要关注光流(optical flow)的确定问题,光流是指图像中物体表面上点在连续图像帧之间的运动模式。确定光流对于理解图像序列中的物体运动以及其他计算机视觉任务至关重要。论文的目标是提出一种方法,可以从连续图像序列中计算出物体点的光流向量。

        Horn 和 Schunck 在这篇论文中介绍了一种基于亮度恒定性假设的光流计算方法。这个假设基于这样一个观察:相邻图像帧之间,物体表面上的点在灰度上应该保持不变。作者将这个问题转化为一个能量最小化问题,通过优化来找到使得能量最小的光流场。

        这种方法是基于一种变分优化技术,作者将亮度恒定性假设形式化为一个能量函数,然后使用变分法来求解这个能量函数的最小值,从而得到光流场的估计。该方法是一个迭代过程,通过不断调整光流场来逐步减小能量。

        这篇论文的贡献在于引入了一种方法来解决光流估计问题,并且将问题形式化为一个优化问题,从而为后来的研究提供了基础。这种方法虽然基于简化的假设,但为计算机视觉领域中的光流估计问题提供了一个启发性的框架。

        总体而言,Horn 和 Schunck 在这篇论文中提出了一种经典的光流估计方法,为后来的计算机视觉研究奠定了基础,并且对于理解图像序列中的物体运动模式具有重要意义。

3. Farneback光流法:

Farnebäck, G. (2003). Two-frame motion estimation based on polynomial expansion. In Scandinavian conference on Image analysis (pp. 363-370). Springer.

 论文介绍了一种基于基于频域和多项式展开的双帧运动估计方法。

        这篇论文主要关注双帧图像之间的运动估计问题,即从两幅连续图像中推断出物体表面上点的运动。这对于很多计算机视觉应用,如光流估计、目标跟踪等都具有重要意义。论文的目标是提出一种方法,能够从两帧图像中估计出像素级别的运动场。

        作者 Farnebäck 在这篇论文中介绍了一种基于多项式展开的运动估计方法。这个方法基于一个关键的观察:在两帧图像之间,物体的运动模式可以近似为一个多项式。作者利用这个思想,通过多项式展开来建模两帧图像之间的像素值变化,并通过优化来确定多项式的系数,从而得到像素级别的运动估计。

        这种方法相对于传统的基于亮度变化或相关性的方法具有一些优势,特别是在存在纹理较弱或遮挡的情况下。它能够较好地处理图像中的非均匀运动和复杂的场景。

        这篇论文的贡献在于引入了一种基于多项式展开的新颖的双帧运动估计方法,为计算机视觉领域提供了一种新的思路。这种方法在一些情况下表现出色,为处理复杂场景和运动模式的图像提供了一种有效的工具。

        总体而言,Farnebäck 在这篇论文中提出了一种创新的双帧运动估计方法,为计算机视觉领域的运动估计问题带来了新的视角,并且在特定情况下具有实际应用价值。

4  FlowNet: 端到端的深度光流估计:

        Dosovitskiy, A., Fischer, P., Ilg, E., Hausser, P., Hazirbas, C., Golkov, V., ... & Brox, T. (2015). FlowNet: Learning optical flow with convolutional networks. In Proceedings of the IEEE international conference on computer vision (ICCV) (pp. 2758-2766).

        这篇论文介绍了使用卷积神经网络(Convolutional Neural Networks,CNN)来学习光流(optical flow)的方法。 

        光流是指图像中物体点在不同图像帧之间的运动模式,对于计算机视觉中的许多任务,如目标跟踪、3D重建和图像合成等,都非常重要。传统的光流估计方法通常基于复杂的数学模型和计算,而近年来,深度学习技术,特别是卷积神经网络,已经在图像处理领域取得了显著的进展。

        这篇论文的主要目标是使用卷积神经网络来学习光流的估计。作者提出了一种称为 FlowNet 的网络结构,它是一个端到端的卷积神经网络可以从两幅图像中直接学习光流。FlowNet 的设计充分利用了卷积神经网络在图像特征提取和学习表示方面的优势。

        FlowNet 包含两个主要分支,分别用于处理两幅输入图像。每个分支都包含多个卷积和池化层,以及特定的连接层,用于生成光流场。整个网络通过监督学习的方式,在训练数据中优化光流估计。

        该论文的贡献在于引入了一种使用卷积神经网络进行光流估计的方法,避免了传统方法中复杂的手工特征工程和数学建模。FlowNet 在当时取得了非常出色的光流估计结果,证明了深度学习在光流估计领域的潜力。

        总的来说,"FlowNet: Learning Optical Flow with Convolutional Networks" 这篇论文为光流估计领域引入了深度学习方法,为计算机视觉研究提供了新的思路,也为后来的研究奠定了基础。

5. RAFT: 结构化的光流估计:

Teed, Z., & Deng, J. (2020). Raft: Recurrent all-pairs field transforms for optical flow. In Proceedings of the European Conference on Computer Vision (ECCV) (pp. 336-352).

代码: GitHub - princeton-vl/RAFTContribute to princeton-vl/RAFT development by creating an account on GitHub.icon-default.png?t=N7T8https://github.com/princeton-vl/RAFT

        "Raft: Recurrent All-Pairs Field Transforms for Optical Flow" 是由 Zachary Teed 和 Jia Deng 于 2020 年在欧洲计算机视觉大会(European Conference on Computer Vision,ECCV)上发表的论文。这篇论文介绍了一种用于光流估计的方法,称为 Raft,该方法利用循环的全对场变换来实现光流估计。

        这篇论文的主要目标是提出一种新颖的方法来解决光流估计问题,即 Raft 方法。Raft 方法采用了一种循环的全对场变换,通过对所有点对进行操作来估计光流。这种方法与传统的局部方法不同,它能够在全局范围内捕捉更大范围的运动信息

        Raft 方法的核心思想是通过逐步迭代,将每对点的光流变换应用于整个图像,从而逐渐优化光流估计。这种全对场变换的方式可以捕捉到不同点之间的相互作用,从而提高了光流估计的准确性。       

         论文的贡献在于引入了一种基于循环全对场变换的光流估计方法,这种方法在全局范围内捕捉运动信息,具有较好的性能。Raft 方法在多个光流估计数据集上取得了优秀的结果,证明了其有效性。

        总的来说,"Raft: Recurrent All-Pairs Field Transforms for Optical Flow" 这篇论文为光流估计领域引入了一种创新的方法,为解决运动估计问题提供了新的视角,为计算机视觉研究和应用带来了新的启示。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/62238.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于空洞卷积DCNN与长短期时间记忆模型LSTM的dcnn-lstm的回归预测模型

周末的时候有时间鼓捣的一个小实践,主要就是做的多因子回归预测的任务,关于时序数据建模和回归预测建模我的专栏和系列博文里面已经有了非常详细的介绍了,这里就不再多加赘述了,这里主要是一个模型融合的实践,这里的数…

[论文笔记]DSSM

引言 这是DSSM论文的阅读笔记,后续会有一篇文章来复现它并在中文数据集上验证效果。 本文的标题翻译过来就是利用点击数据学习网页搜索中深层结构化语义模型,这篇论文被归类为信息检索,但也可以用来做文本匹配。 这是一篇经典的工作,在DSSM之前,通常使用传统机器学习的…

iOS 使用coreData存贮页面的模型数据中的字典

我们使用coreData时候,会遇到较为复杂的数据类型的存贮,例如,我们要存一个模型,但是一个模型里面有个字典,这时候,我们该如何存贮呢 如图所示,一个对象中含有一个字典 我们实现一个公共的方法…

【ArcGIS Pro二次开发】(64):多分式标注

在ArcGIS中有时会遇到需要二分式标注的情况,有时甚至是三分式、四分式。 通过输入标注表达式,可以做出如下的效果,但是代码不短,每次都要输一遍也挺麻烦。 网上也有一些分式标注的python工具,但不够直观,于…

港联证券|股票过户费是什么意思?

股票过户费是指在股票商场中,由于股份所有权的转让,双方需求付出的一种买卖费用。这种费用首要是为了付出证券公司和证券中介机构转让股票所发生的各项费用,如代理费、登记费、买卖税等。股票过户费的数额一般是按照股票的数量和买卖金额来核…

Git学习part1

02.尚硅谷_Git&GitHub_为什么要使用版本控制_哔哩哔哩_bilibili 1.Git必要性 记录代码开发的历史状态 ,允许很多人同时修改文件(分布式)且不会丢失记录 2.版本控制工具应该具备的功能 1)协同修改 多人并行不悖的修改服务器端…

rust交叉编译 在mac下编译linux和windows

系统版本macbook proVentura 13.5linux ubuntu22.04.3 LTS/18.04.6 LTSwindowswindows 10 专业版 20H2mac下rustc --versionrustc 1.74.0-nightly (58eefc33a 2023-08-24)查看当前系统支持的交叉编译指定系统版本列表 rustup target list如果已经安装这里会显示(installed)。…

360牛盾点选

网址:https://info.so.com/cache_remove.html 360旗下的产品,协议并不难。 感兴趣的话大家可以去看看,一个AES,坐标需要缩放处理。 鱼导就是牛,还没失败过。 完事儿了哦,大表哥们。以上需要算法&#xff0…

【高阶数据结构】哈希表详解

文章目录 前言1. 哈希的概念2. 哈希冲突3. 哈希函数3.1 直接定址法3.2 除留余数法--(常用)3.3 平方取中法--(了解)3.4 折叠法--(了解)3.5 随机数法--(了解)3.6 数学分析法--(了解) 4. 哈希冲突的解决方法及不同方法对应的哈希表实现4.1 闭散列(开放定址法&#xff0…

安全基础 --- https详解(02)、cookie和session、同源和跨域

https详解(02)--- 数据包扩展 Request --- 请求数据包Response --- 返回数据包 若出现代理则如下图: Proxy --- 代理服务器 (1)http和https的区别 http明文传输,数据未加密;http页面响应速度…

QT可执行程序打包成安装程序

目录 1.将QT程序先放到一个文件中 2.下载QtInstallerFramework-win-x86.exe 3.将setup.exe单独拷贝出来,进行安装测试 4.测试安装后的程序是否可执行 1.将QT程序先放到一个文件中 (1)QT切换到release模式,编译后在构建目录生…

RSA算法与错误敏感攻击

参见《RSA 算法的错误敏感攻击研究与实践》 RSA 算法简介 RSA 算法原理: 1) RSA 算法密钥产生过程 (1)系统随机产生两个大素数 p p p 和 q q q,对这两个数据保密; (2)计算 n p …

RealSense D455启动教程

环境: ubuntu20.04 ros:noetic 视觉传感器:Intel RealSense D455 通过命令安装不成功后改为下面源码安装 1. 安装Intel RealSense SDK 2.0 1.1源码安装 1. 下载源码git clone https://github.com/IntelRealSense/librealsense cd librealsense…

【爬虫】实验项目二:模拟登录和数据持久化

目录 一、实验目的 二、实验预习提示 三、实验内容 实验要求 基本要求: 改进要求A: 改进要求B: 四、实验过程 基本要求: 源码如下: 改进要求A: 源码如下: 改进要求B: 源码如下&…

Java【手撕双指针】LeetCode 18. “四数之和“, 图文详解思路分析 + 代码

文章目录 前言一、四数之和1, 题目2, 思路分析3, 代码 前言 各位读者好, 我是小陈, 这是我的个人主页, 希望我的专栏能够帮助到你: 📕 JavaSE基础: 基础语法, 类和对象, 封装继承多态, 接口, 综合小练习图书管理系统等 📗 Java数据结构: 顺序表, 链表, 堆…

设计模式大白话——适配器模式

适配器模式 概述示例适配器的种类小结 概述 ​ 适配器其实非常好理解,放到生活中来,我们身边处处都有这样的例子,最常见的是用的比较多的各种转接线(如:USB 转 Type-C),有了这个“适配器”&…

Linux系统下建立Socket聊天服务器

目录 1.服务器结构 2.各模块函数 2.1 socket函数 2.2 bind函数 2.3 Listen函数 2.4 accept函数 2.5 接收发送函数 2.6 close函数 2.7 connect函数 3 代码段 3.1 服务器代码 1.服务器结构 使用socket的API函数编写服务端和客户端程序的步骤图示: 2.各模块函数 服务…

循环购模式:美妆行业的新趋势

美妆是一种能够提升自信和魅力的艺术,它让每个人都可以展现自己的个性和风格。但是,美妆也是一种需要不断更新和学习的技能,它需要消费者投入时间和金钱,才能找到适合自己的产品和方法。有没有一种方式,可以让美妆变得…

MySQL 数据库常用命令大全(详细)

文章目录 1. MySQL命令2. MySQL基础命令3. MySQL命令简介4. MySQL常用命令4.1 MySQL准备篇4.1.1 启动和停止MySQL服务4.1.2 修改MySQL账户密码4.1.3 MySQL的登陆和退出4.1.4 查看MySQL版本 4.2 DDL篇(数据定义)4.2.1 查询数据库4.2.2 创建数据库4.2.3 使…

[Linux]进程程序替换

[Linux]进程程序替换 文章目录 [Linux]进程程序替换进程程序替换的意义见一见进程程序替换进程程序替换的原理进程程序替换中的写时拷贝介绍进程程序替换接口 进程程序替换的意义 Linux系统下使用fork系统函数创建子进程后,子进程只能执行继承的部分父进程代码&…