即插即用+任意blur的超分辨率重建——DPSR

计算机视觉中存在许多的不适定问题ill-posed problem。先来看什么是适定问题well-posed problem,适定问题必须同时满足三个条件:

  • 1. a solution exists      解必须存在
  • 2. the solution is unique       解必须唯一
  • 3. the solution's behavior changes continuously with the initial conditions. 解能根据初始条件连续变化,不会发生跳变,即解必须稳定

CV中的一些问题经常不满足于条件2和3,,比如图像去噪(ImageDe-nosing),图像恢复(Image Restorsion),图像放大(Image Zooming),图像修补(ImageInpainting),图像去马赛克(image Demosaicing),图像超分辨(Image super-resolution)等。这些问题往往同时属于反问题inverse problem,所以往往需要构建正向过程的模型,而这种逆推的解往往不是唯一的,即有多种可能性,每次只能选择可能性最大的或者说最适合的那一个。

好比是通信中的维纳滤波和信道均衡。

在超分辨率重建中,有两个应用广泛的衰退模型。一个是先使用模糊核卷积,然后以尺度s下采样,然后对信号加一个高斯加性白噪声。模糊滤波卷积核有很多种,比如高斯核,Motion blur和disk blur。如果使用这种模型就意味着我们需要知道卷积核的种类,即便知道了种类也有很多超参数是待定的。另一种是简单地使用三次方插值,比如matlab中的resize函数就是这样。这种模型使得SISR中的CNN方法发展很快,但是因为模型简单,在很多情况下的效果也比较差。至于为什么三次插值的模型对DNN有帮助,需要看一下文献2.

所以,需要做的是改进现有的模型,但是还需要新的模型对DNN也适用。新模型也使用了卷积,下采样,加噪三要素,但是不同的是三者的先后顺序不同。之前的模型是先卷积再下采样,新的模型是先下采样,再卷积。相比于模糊卷积核和加噪,下采样之后的图像仍然可以认为是clean image,所以可以将通常的超分辨重建问题转化为先进行图像去噪和纯粹的超分辨重建,可以利用成熟的去噪方法来估计得到k。

有了退化模型,就可以基于模型和最大后验概率MAP得到能量函数的表达式。能量函数energy function分为两部分,一部分是保真项fidelity(likehood term),一部分是正则项regularization(prior) term。对于判别学习的方法,预测模型对应能量函数;用于训练的HR和LR数据则对应衰退模型,这就解释了为什么基于三次插值衰退模型训练的方法无法在真实数据中依然有较好的表现,因为真实数据的衰退方法更加复杂,且不同。

现在的目标函数是最小化能量函数。首先增加了一个辅助变量z,将原函数变成约束型函数。然后使用HQS方法或者ADMM方法求解。HQS方法又在函数中引入了一个二次惩罚项,惩罚参数越大,使得z越靠近下采样之后的x。求解的过程是一个迭代的过程,分别对z和x求最小化。在假设卷积有圆形边界限制circular boundary condition下,可以在频域得到对z求最小化时的闭式解。

而当对x求最小化时,卷积已经没有了,这时求解对应的衰退模型其实就是下采样+噪声。注意这时对应的模型其实相比于传统的三次下采样模型只是加了一个噪声,所以仍然可以很方便地使用DNN训练。这个衰退模型的参数有两个,一个是采样的尺度参数,一个是噪声的标准差。

总结一下,公式7和8是原问题的两个子问题,公式7可以从频域求解,注意这里包含了模糊卷积核k,减轻了卷积核的变形对结构的影响;公式8则进一步使用更简单的衰退模型和DNN得到没有模糊和噪声的HR图像。可以把公式8对应的求解看作是super-resolver prior,具体地可以使用SRMD网络,因为它本身就包含noise level map,不用额外增加噪声的输入。在这篇文章里,他使用的是基于SRResNet的修改,得到SRResNet+,改变是首先增加了噪声的输入;特征图的数目从64增加到96,;安装文献58的建议去除了BN层。

训练时是对每个尺度因子分别训练一个模型,HR图像从DIV2K数据集中得到,LR是HR经过下采样和加噪的模型得到,噪声图像大小和LR尺寸一样,所有的元素都是sigma,范围从[0,50]

训练时使用Adam优化器,l1损失函数,学习率从e-4开始,每5e+5次迭代学习率减半。batchsize是16,LR的patch尺寸是48x48.

https://arxiv.org/pdf/1903.12529.pdf

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/493561.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Tomcat基础教程(一)

Tomcat, 是Servlet和JSP容器,其是实现了JSP规范的servlet容器。它在servlet生命周期内包容,装载,运行,和停止servlet容器。 Servlet容器的三种工作模式: 1. 独立的Servlet容器 Servlet容器与基于JAVA技术的Web服务器集…

opencv--图像金字塔

一,高斯金字塔--图片经过高斯下采样 """ 高斯金字塔 """ def gauss_pyramid():img cv2.imread(./data/img4.png)lower_reso cv2.pyrDown(img)lower_reso2 cv2.pyrDown(lower_reso)plt.subplot(131), plt.imshow(img)plt.title(In…

中国移动:5G蜂窝IoT关键技术分析

来源:5G本文讨论了蜂窝物联网的技术现状,针对增强机器类通信和窄带物联网技术标准,提出了2种现网快速部署方案,并进一步指出了C-IoT面向5G的演进路径。该路径充分考虑了5G网络中网络功能虚拟化、软件定义网络、移动边缘计算和大数…

dataframe常用操作总结

初始化 可以使用arraycolumns的格式, dpd.DataFrame(np.arange(10).reshape(2,5)) df1 pd.DataFrame([[Snow,M,22],[Tyrion,M,32],[Sansa,F,18],[Arya,F,14]], columns[name,gender,age]) 也可以使用字典大括号的格式: df pd.DataFrame({a: [1, 2…

DEDE无简略标题时显示完整标题

新闻的标题需要进行字数限制,这就需要加入一个title属性,让鼠标放上去的时候显示完整标题。另外目前的调用只能同时调用一种标题方式,不过可 以采用以下方法,进行判断,无简略标题显示完整标题。例如dede早期版本中的”…

清华大学发布:人脸识别最全知识图谱

来源:智东西摘要:本期我们推荐来自清华大学副教授唐杰领导的学者大数据挖掘项目Aminer的研究报告,讲解人脸识别技术及其应用领域,介绍人脸识别领域的国内玩人才并预测该技术的发展趋势。自20世纪下半叶,计算机视觉技术…

图像变换dpi(tif->jpg),直方图均衡化,腐蚀膨胀,分水岭,模板匹配,直线检测

一.图像变换dpi 1.示例1 import numpy as np from PIL import Image import cv2 def test_dp():path./gt_1.tif# imgImage.open(path)# print(img.size)# print(img.info)imgcv2.imread(path)imgImage.fromarray(img)print(img.size)print(img.info)img.save(test.jpg, dpi(3…

CV中的经典网络模型

目标检测 目标检测,不仅要识别目标是什么(分类),还要知道目标的具体位置(可以当作回归来做)。 RCNN Selective Search 算法获得候选框,Alexnet提取特征,SVM对每个候选框区域打分。…

无表头单链表增删改查操作

1、返回单链表中第pos个结点中的元素,若pos超出范围,则返回02、把单链表中第pos个结点的值修改为x的值,若修改成功返回1,否则返回03、向单链表的表头插入一个元素 4、向单链表的末尾添加一个元素…

JBU联合双边上采样

很多图像处理算法,如立体视觉中的深度估计,图像上色,高动态范围HDR中的tone mapping,图像分割,都有一个共性的问题:寻找一个全局的解,这个解是指一个分段的piecewise平滑含糊,描述了…

技术阅读周刊第十一期

技术阅读周刊,每周更新。 历史更新 20231124:第七期20231201:第八期20231215:第十‍期 A Comprehensive guide to Spring Boot 3.2 with Java 21, Virtual Threads, Spring Security, PostgreSQL, Flyway, Caching, Micrometer, O…

数据智能是大数据的未来

来源:中国信息产业网 近日,两家大数据领域的代表性企业Cloudera和Hortonworks宣布了它们相对平等的合并,宣称新公司将创建世界领先的下一代数据平台并提供业界首个企业数据云,这令很多人感到意外,大数据的未来何去何从…

利用GAN原始框架生成手写数字

这一篇GAN文章只是让产生的结果尽量真实,还不能分类。 本次手写数字GAN的思想: 对于辨别器,利用真实的手写数字(真样本,对应的标签为真标签)和随机噪声经过生成器产生的样本(假样本&#xff0…

DL也懂纹理吗——图像的纹理特征

工作中遇到一个问题:对于同一场景,训练好的DL模型能把大部分样本分类准确,而对于少量负样本,DL会错分到另外一个对立的类中。错分的样本可以认为是难分的样本,但是我们还想知道这两种样本到底是哪里的差异导致DL做出了…

排序算法--(冒泡排序,插入排序,选择排序,归并排序,快速排序,桶排序,计数排序,基数排序)

一.时间复杂度分析 - **时间复杂度**:对排序数据的总的操作次数。反应当n变化时,操作次数呈现什么规律 - **空间复杂度**:算法在计算机内执行时所需要的存储空间的容量,它也是数据规模n的函数。 1.例题: 有一个字符串数组&…

肠里细菌“肚里蛔虫”:肠脑研究缘何越来越热

来源:科学网最懂你大脑的,可能不是“肚子里的蛔虫”,而是肠子里的细菌——肠道菌群对神经系统、心理和行为方面的影响正成为一个新兴热点领域。在日前举办的美国神经科学学会年会上,一张海报上的大脑切片显微镜图像显示&#xff0…

SVM原理与实战

先看线性可分问题。对于线性可分,其实感知机就可以解决。但是感知机只是找到一个超平面将数据分开,而这样的超平面可能是平行的无限多个,我们需要在这其中找到最优的一个。怎么衡量一个超平面是不是最优的呢,直观上讲,…

2014-01-01

一:HyperlinkButton点击后打开新窗口的方法 1,直接在界面中写这段代码就可以了: <HyperlinkButton NavigateUri"http://www.cnblogs.com/wsdj-ITtech/" Content"Click Me" TargetName"_blank" FontSize"28" Height"50"…

李飞飞高徒:斯坦福如何打造基于视觉的智能医院?

作者&#xff1a;Albert Haque、Michelle Guo来源&#xff1a;机器之心自 2009 年担任斯坦福人工智能实验室和视觉实验室的负责人&#xff0c;李飞飞在推动计算机视觉方面研究的同时&#xff0c;还密切关注 AI 医疗的发展。昨日&#xff0c;李飞飞离任斯坦福 AI 实验室负责人一…

tensorflow知识点

一.bazel编译tensorflow注意版本号: 在/tensorflow/tensorflow/configure.py 查看bazel版本号 https://github.com/tensorflow/tensorflow https://github.com/bazelbuild/bazel/releases?after0.26.1 https://tensorflow.google.cn/ 二&#xff0c;基础知识点 1.打印出…