【图像拼接(Image Stitching)】关于【图像拼接论文精读】专栏的相关说明,包含专栏使用说明、创新思路分享等(不定期更新)

在这里插入图片描述

文章目录

  • 前言
  • 专栏简介
  • 适用人群
  • 使用方法
  • 阅读顺序
  • 潜在的创新方向
  • 【图像拼接论文精读】专栏文章目录


前言

为什么会有这篇文章?

  • 因为专栏简介里写不下太多东西,只能通过这篇文章和大家交流,算是一个专栏阅读指南吧。

说点心里话

  • 本来吧,我只想用CSDN来记录自己学习【图像拼接】领域论文的过程,对每篇文章有个细致的理解,方便自己反复查阅。设置为付费也是因为涉及论文和本人其他项目需要,防止查重和其他问题,所以价格最开始设置的是专栏付费价格里最高的。起初,确实没有人看,一切也都平淡地度过着。直到我毕业了走上工作岗位后,我才发现原本我以为的非常小众的研究领域竟然有这么多人在关注,私信我的朋友很多,大多是硕士博士要搞这方面的研究,而且导师可能比较放养。慢慢地订阅也开始多了起来,我发现后立马降低了专栏价格,以一个平台分成后算是比较合理的价格设置。由于【图像拼接】领域过于小众,难度大,门槛高,研究的人少,需要数学和图形学的基础支撑,做讲解、教程的人也少,我仗着自己在该领域摸爬滚打了解过几年,斗胆做了这样一个专栏,供需要该领域研究的学者们快速阅读理解图像拼接论文。

  • 虽然工作了,但是该专栏永久更新,有新的图像拼接(Image Stitching)领域论文诞生,我会第一时间给大家做论文精读。

  • 有源码的论文,源码解读会在另一个专栏更新,不过会慢一些因为需要花时间去研究。基于传统特征的方法大多数是matlab的,基于深度学习的方法是python的,一定会更新的。大家可以关注一下。图像拼接论文源码精读专栏:图像拼接论文源码精读

  • 感谢大家听我说了这么多流水账,我会把该领域的论文和源码做好的,决不辜负订阅这个专栏的人。

专栏简介

图像拼接领域及方向的论文精读,包括论文各部分理解、复现以及总结延申。论文包括基于传统特征的图像拼接方法和基于深度学习的图像拼接论文。对应的源码解读请见另一个专栏,两部分同步阅读。从原理解读、算法推导,再到源码复现,带领你深入理解图像拼接在现有技术基础之上的最新研究成果。

论文需要略读和精读,一些没有源码的文章我可能就粗略一点,可以作为增长见识和拓展思路来阅读,一些有源码的顶会/顶刊文章需要精读,我会写的比较细致,除了搞懂思路和创新点,也要在其中学到知识,如何为己所用,如何寻找创新点并实现。

该专栏并不仅仅是机械的翻译文章而已,而是在阅读的过程中体会,如何阅读文献,如何寻找创新点,如何自己写论文。毕竟,都是要发文章的,不看别人怎么写的,自己怎么会写呢。

其实最简单的也是大家最常用的办法,就是先写中文论文,再翻译成英文,最后润色。

那么中文论文是怎么来的呢?图像拼接领域的一些词汇如何表述才能翻译的更精准呢?那就是看本专栏了。

除此之外,本专栏文章的公式全部按照原文章的公式书写,有需要markdown公式的朋友可以留言或者私信我。CSDN的markdown语法有的和overleaf不太一样,写论文的时候注意一下。

适用人群

研究图像拼接领域的硕士、博士和其他该领域工作者。帮助你快速上手,入门科研,入门图像拼接。

如果你的导师不懂该领域,又放养你,你很迷茫,不知道该在哪学习,那这篇专栏就再合适不过了。看看你是对传统图像拼接感兴趣,还是对基于深度学习的图像拼接感兴趣。

如果你已经在该领域学习一段时间,有一定的基础,那么可以直接去订阅【图像拼接源码精读】专栏,毕竟发文章还是得做实验跑代码的,读懂代码,才能知道如何改进,如何创新。不建议没有任何图像拼接基础的同学直接订阅【图像拼接源码精读】专栏,因为本专栏不仅有论文精读,还又一些基础的图像拼接相关的知识,比如单应、TPS、图割等等,还涉及很多图形学的知识,比如刚性变换,三角剖分,网格变形,超像素等。图像拼接是个很庞大的工作流程,每个步骤都可以单独拿出来进行改进,所以还是尽可能多的阅读论文,了解思路。

要明确你的目标,是为了发文章毕业,还是为了搞算法研究,还是为了工程项目。

使用方法

如果电脑分屏阅读,那就原论文一个屏幕,本专栏文章一个屏幕,对照着阅读。
如果没有菊花链这样的多显示器,那就使用ipad或者手机等,尽量保证原文和精读文章同时显示。
实在没有,就同一个屏幕一边一半显示。
如果用手机或者pad阅读,则建议先大概看一下原文,有点了解之后再直接看本专栏文章。

论文本身重点关注:摘要,创新点部分(一般在介绍部分结尾,相关工作之前。作者会列出来),算法部分,实验部分。其中:

  • 摘要和创新点部分主要了解作者做了什么事,解决了什么问题。如果它是基于某篇论文创新的,那么要先了解上一篇工作的大概算法;
  • 算法部分重点说一下,如果你想快速理解并上手,那么就忽略繁琐的公式,尽量用纸笔简单的过一遍。因为图像拼接就是参照图和目标图,warp后一顿折腾,跟着走一遍比较顺畅。论文中的公式大多写的比较繁琐的原因是因为它是论文,不是教程,只是让你看着高端。其实有的公式,很简单就能写明。我倒不是吐槽,而是告诉你,当你发论文的时候,你也要这么写。所以,算法部分除了理解,更多的是要学习它的写法,用在你自己要发的论文里。最后,着重注意有参数的公式、用了某些函数的公式,因为那可能是你创新的依据和来源。比较简单的创新就是调参,比较高端的创新就是改公式。比如创造能量函数,给能量函数添加项等。
  • 实验部分:重点看原作者是怎么做实验的,如何对比说明的自己的方法比SOTA方法更好。要随时记录,尽可能地让实验丰富。纵向对比,横向对比,消融实验等。注:不一定所有的待拼接图像在某个算法上的效果都好,那不成神仙了。论文作者只是挑了比较好的结果展示,你得自己动手跑一下,试一下,看一看,想想为啥有的图像拼接效果不好。这不就分析出特征了吗?没准科研就是思路了,研究方向就有了。

本专栏还是更多的让大家会读论文,试着写论文,至于论文的内容,如何创新,如何读代码,做实验,更多的细节和想法还是写在另一个专栏中。

本专栏的文章中,会有我自己读该论文时候的心得体会和吐槽,会用红色标注出来。另外,有的文章我会自己总结,还会展示展示不同数据集上的效果。

阅读顺序

专栏中的文章标题有缩写的是比较经典的,可以作为论文中实验部分的比较方法。是必看的!而且代码也要跑通,得能跑出结果才能展示实验,对比结果。

基于传统方法的图像拼接:AutoStitch、APAP、AANAP、SPW、LPC、GSP、GES-GSP

AANAP是在APAP基础上实现的,LPC是在SPW基础上实现的,代码风格类似,matlab实现的
GSP、GES-GSP是C++实现的
其他:SPHP、ELA等,代码风格差异很大,各自单独看即可。

基于学习的图像拼接:UDIS,UDIS++

基于学习的图像拼接论文包含机器学习和深度学习。
其他:有两篇R1约束的文章不错,是基于机器学习的。matlab实现。其余的基本是python实现。

20231130更新:目前基于深度学习的论文精读写的比较少,后面狂补。基于传统方法的SOTA方法基本都涉及到了,有漏的后面我再补上,正在写源码精读专栏,matlab生疏了,敬请期待。目前主要更新基于深度学习的图像拼接方法,既是主流研究方向,具有实时性,而且比较容易创新,所以暂时以其为主。

潜在的创新方向

图像拼接工作流程:
请添加图片描述
基于传统的图像拼接方法基本上是照着如上步骤进行的。在论文中可以叫pipline,overview等。两张图像经过预处理、特征匹配、图像翘曲(warp)、图像融合最后得到拼接结果。可以创新的步骤有:特征检测与匹配、图像翘曲、图像融合。

特征检测与匹配:单拿出来已经在图像配准领域发展的很好了,有很多深度学习的特征匹配算法。但是不能单拿出来用到图像拼接流程里,因为特征没有sift准,感受野也不同。如果你想特征匹配用深度学习的方法,那么就要考虑后面的流程如何改进。

图像翘曲:从全局单应到局部单应是创新,从局部单应的网格变形再到三角剖分和超像素是创新,现在的发展就是机器学习、深度学习去学习出翘曲后的图像。那么问题就是无法标注真值,所以无监督比较火,也是现在聂大佬在做的。机器学习用约束限制,23年CVPR也发过文章,不知道以后能不能发展起来。除此之外,可以考虑重叠区域和非重叠区域的平滑问题,这也有很多人做过了,但是可以试试不同的方法。

图像融合:常规的融合方法,加权平均融合,接缝线融合,接缝线融合还能玩出花来吗?换目标函数没准是个思路。有用sigmoid的。廖老师有几篇不错的基于接缝线的融合,可以多看看。单独拿出来看看图像融合领域的文章不知道能不能有思路。

除了这些,全景图后处理也是不错的研究方向。聂大佬这两年就改进了何凯明的两篇图形学文章,全景拼接图矩形化和图像内容旋转矫正的。都是用深度学习改进的,读一读看看能不能改进提升。

还有一些手段可以尝试作为思路:颜色修正,直方图平滑,光照等因素。

以上提到的文章不出意外都会出现在本专栏中,有源码的也会出现在另一个专栏中。

更多详细的【图像拼接】研究思路和创新见专栏中的其他文章,比较详细。这里仅作为一个概述。

订阅专栏的同学有问题随时私信我,看见了都会回复。

最后,感谢大家厚爱,共同努力。

【图像拼接论文精读】专栏文章目录

  1. Seam Carving for Content-Aware Image Resizing
  2. As-Rigid-As-Possible Shape Manipulation(ARAP)
  3. Adaptive As-Natural-As-Possible Image Stitching(AANAP)
  4. Shape-Preserving Half-Projective Warps for Image Stitching(SPHP)
  5. Seam-Driven Image Stitching
  6. Parallax-tolerant Image Stitching
  7. Parallax-Tolerant Image Stitching Based on Robust Elastic Warping(ELA/REW)
  8. SuperPoint: Self-Supervised Interest Point Detection and Description
  9. As-Projective-As-Possible Image Stitching with Moving DLT(APAP)
  10. Leveraging Line-point Consistence to Preserve Structures for Wide Parallax Image Stitching(LPC)
  11. Single-Perspective Warps in Natural Image Stitching(SPW)
  12. Local-Adaptive Image Alignment Based on Triangular Facet Approximation(TFA/TFT)
  13. Image stitching method by multi-feature constrained alignment and colour adjustment
  14. Natural Image Stitching Using Depth Maps
  15. Perception-based seam cutting for image stitching
  16. Stable Linear Structures and Seam Measurements for Parallax Image Stitching

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/187349.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Hi-Net:用于多模态MR图像合成的混合融合网络

Hi-Net: Hybrid-Fusion Network for Multi-Modal MR Image Synthesis Hi-Net:用于多模态MR图像合成的混合融合网络背景贡献实验方法the modality-specific network(模态特定网络)multi-modal fusion networkmulti-modal synthesis network 损…

TQ2440开发板-LED全亮全灭控制程序设计

目录 什么是GPIOS3C2440的GPIO访问和控制方式:3种寄存器 TQ2440的LED灯底板原理图---LED测试部分核心板原理图----GPIO部分 LED控制---设计思想整体代码 && 代码研读配置GPIO端口为输出模式控制LED的全亮和全灭 真就是从零学起。 什么是GPIO GPIO&#xff…

Vue3+ElementPlus,image动态更新src

我想通过点击图片动态更新src&#xff0c;代码如下&#xff1a; <el-image style"width: 100px; height: 30px" :src"ImageUrl" click"refresh" :fit"fit" /> const ImageUrl reactive(http://localhost:9001/getImage)const…

20个Python源码项目下载

20个很不错的Python项目源码&#xff0c;其中包括适合毕业设计的项目。这些资源中涵盖了Django 3版本的项目&#xff1a; DjangoMysqlBulma实现的商场管理系统源码 PythonDjango实现基于人脸识别的门禁管理系统 PythonFlaskMySQL实现的学生培养计划管理系统 Python大熊猫主题人…

使用yolov7进行多图像视频识别

1.yolov7你可以让你简单的部署,比起前几代来说特别简单 #下面是我转换老友记的测试视频,可以看到几乎可以准确预测 2.步骤 1.在github官网下载代码 https://github.com/WongKinYiu/yolov7 2.点击下载权重文件放到项目中 3.安装依赖,我的python版本是3.6的 pip install -r requ…

Java8 之 Optional 详解

目录 一. 前言 二. Optional 用法 2.1. 概要 2.2. 创建 Optional 对象 2.3. 获取 Optional 对象的值 2.4. 检查 Optional 对象是否为空 2.5. 安全访问 Optional 对象的值 2.6. 处理过滤操作 2.7. 处理转换操作 2.8. 使用默认值 三. Optional 使用场景 3.1. 空判断 …

RPC与HTTP的详细比较

RPC 示例&#xff08;使用 gRPC&#xff09; 在这个例子中&#xff0c;我们使用 gRPC&#xff08;一个流行的 RPC 框架&#xff09;来演示 RPC 的基本用法。我们创建一个简单的计算器服务&#xff0c;客户端可以调用服务器上的加法操作。 服务定义 - Calculator.proto&#x…

深度解析 Dockerfile:构建可重复、可扩展的Docker镜像

文章目录 什么是Dockerfile&#xff1f;Dockerfile的基本结构常用Dockerfile指令解析1. FROM2. LABEL3. WORKDIR4. COPY5. RUN6. EXPOSE7. ENV8. CMD 构建可重复、可扩展的Docker镜像1. 指定基础镜像的版本2. 合理使用缓存3. 精简镜像4. 使用多阶段构建 总结 &#x1f388;个人…

提升网页交互体验的秘密武器——防抖和节流

说在前面 在现代Web开发中&#xff0c;提高网页性能是至关重要的。本文介绍了防抖和节流这两种常用的性能优化技术&#xff0c;通过控制函数的执行频率&#xff0c;有效减少不必要的计算和网络请求&#xff0c;从而提升用户体验和页面加载速度。 函数节流 节流是指限制一个函数…

【分享】centos7vim异常

问题描述: 虚拟机安装centos7&#xff0c;安装vim后异常&#xff0c;上下左右键会变成abcd,退格键无法删除。 系统版本: CentOS Linux release 7.5.1804 (Core) 原因: 暂时未知&#xff0c;有可能是vim安装时&#xff0c;一个组件未安装导致。后续追溯 解决方案: echo &quo…

nginx之rewrite

rewrite rewrite 作用是地址重定向&#xff0c;语法&#xff1a;rewrite regex replacement[flag]; 根据 regex&#xff08;正则表达式&#xff09;匹配请求地址&#xff0c;然后跳转到 replacement&#xff0c;结尾是flag标记 如下例子&#xff0c;请求地址是 http://192.168.…

异常 Exception 练习题 (未完成)

异常 Exception 练习题 try-catch异常处理1234 异常1&#xff08;没有自己写&#xff09;234 try-catch异常处理 1 class Exception01 {public static int method() {try {String[] names new String[3];//String[]数组if (names[1].equals("tom")) {//NullPointe…

血的教训---入侵redis并免密登录redis所在服务器漏洞复现

血的教训—入侵redis并免密登录redis所在服务器漏洞复现 今天就跟着我一起来入侵redis并免密登录redis所在服务器吧&#xff0c;废话不多说&#xff0c;我们直接开始吧。 这是一个体系的学习步骤&#xff0c;当然如果基础扎实的话可以继续往下面看 以下都是关联的文章&#xff…

Unity3D 导出的apk进行混淆加固、保护与优化原理(防止反编译)

Unity3D 导出的apk进行混淆加固、保护与优化原理&#xff08;防止反编译&#xff09; 目录 前言&#xff1a; 准备资料&#xff1a; 正文&#xff1a; 1&#xff1a;打包一个带有签名的apk 2&#xff1a;对包进行反编译 3&#xff1a;使用ipaguard来对程序进行加固 前言&…

C++ 学习之匿名名字空间的使用细节

匿名命名空间&#xff08;anonymous namespace&#xff09;是C中的一种特殊命名空间&#xff0c;它没有显式的名称。匿名命名空间可以用来定义仅在当前文件中可见的全局变量、函数和类。 由于没有名字&#xff0c;所以相当于直接引入&#xff0c;但是没有引入定义 如果发生冲…

小程序如何刷新当前页面?

在小程序中&#xff0c;刷新当前页面通常有两种方法&#xff1a; 使用 wx.navigateBack 方法&#xff1a; wx.navigateBack({delta: 1 }) 这将返回上一页&#xff0c;并刷新页面。你可以通过调整 delta 参数来控制返回的页面数。例如&#xff0c;如果你想要返回到两页之前的页…

Echarts 柱状图添加标记 最大值 最小值 平均值

标记 最大值 最小值 series: [//图表配置项 如大小&#xff0c;图表类型{name: 图例,type: bar,//图表类型data: [{value: 500,time: 2012-11-12},{value: 454,time: 2020-5-17},{value: 544,time: 2022-1-22},{value: 877,time: 2013-1-30}, {value: 877,time: 2012-11-12}] …

AS 之 gradle 命令

文章目录 1、命令大全2、编译命令2.1 检查依赖并编译打包2.2 编译并打 Debug 包2.3 编译打出 Debug 包并安装2.4 编译并打出 Release 包2.5 编译打出 Release 包并安装2.6 Debug/Release 编译并打印日志 3、清除命令4、卸载命令4.1 卸载 Debug/Release 安装包4.2 adb 卸载 5、调…

Webpack 生产环境

文章目录 前言配置NPM Scripts指定 mode压缩(Minification)源码映射(Source Mapping)CLI 替代选项后言 前言 hello world欢迎来到前端的新世界 &#x1f61c;当前文章系列专栏&#xff1a;webpack &#x1f431;‍&#x1f453;博主在前端领域还有很多知识和技术需要掌握&#…

Ubuntu18.04安装LIO-SAM保姆级教程

目录 1 LIO-SAM的安装前要求 1.1 ROS安装:参考我的另一篇博客 1.2 gtsam安装(参考LeGO-LOAM 1.2节) 2 安装