【EDSR】《Enhanced Deep Residual Networks for Single Image Super-Resolution》

在这里插入图片描述

CVPR workshops-2017

首尔大学

code:

  • https://github.com/limbee/NTIRE2017/tree/master
  • https://github.com/sanghyun-son/EDSR-PyTorch

文章目录

  • 1 Background and Motivation
  • 2 Related Work
  • 3 Advantages / Contributions
  • 4 Method
    • 4.1 Residual blocks
    • 4.2 Single-scale model
    • 4.3 Multi-scale model
  • 5 Experiments
    • 5.1 Datasets and Metrics
    • 5.2 Geometric Self-ensemble
    • 5.3 Evaluation on DIV2K Dataset
    • 5.4 Benchmark Results
    • 5.5 NTIRE2017 SR Challenge
  • 6 Conclusion(own)


1 Background and Motivation

single image super-resolution(SISR)aims to reconstruct a high-resolution image I S R I^{SR} ISR from a single low-resolution image I L R I^{LR} ILR

I L R I^{LR} ILR I S R I^{SR} ISR 的关系因应用场景而异,比如 bicubic downsampled 关系,blur,decimation(抽取) or noise

现有方法要么网络结构设计的不太稳定,要么 treat super-resolution of different scale factors as independent problems

作者设计了 single-scale SR model——enhanced deep super-resolution network(EDSR),和 multi-scale deep super-resolution system (MDSR)

2 Related Work

learn mapping functions between I L R I^{LR} ILR and I H R I^{HR} IHR image pairs

learning methods from neighbor embedding to sparse coding

第一篇用 DCNN 做 SR 的《Learning a deep convolutional network for image super-resolution》(ICCV-2014)

encoder

3 Advantages / Contributions

提出 single-scale SR model EDSR(改进了 residual block)和 multi-scale SR model MDSR(新结构)

Our proposed single-scale and multi-scale models have achieved the top ranks in both the standard benchmark datasets and the DIV2K dataset.

在这里插入图片描述

4 Method

4.1 Residual blocks

applying ResNet architecture directly to low-level vision problems like super-resolution can be suboptimal.

在这里插入图片描述
作者学习 SRResNet 去掉了 skip connection 后的 ReLU,在此基础上,又去掉了 BN,去掉 BN 的理由如下:

they get rid of range flexibility from networks by normalizing the features, it is better to remove them

4.2 Single-scale model

在这里插入图片描述

upsample 是 x2 or x3 or x4,根据任务要求来


深度为 B 宽度为 F 的网络 occupy O ( B F ) O(BF) O(BF) memory with O ( B F 2 ) O(BF^2) O(BF2)

提升宽度可以显著提升 model capacity,但是 inception-v4 中观察到 if filters number(width) 超过 1000,网络迭代后会慢慢死掉(average pooling 之前的 layer的输出为0),作者加大宽度的时候也会遇到这个问题,解决办法, Scaling of the Residuals——【Inception-v4】《Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning》

在这里插入图片描述
factor 0.1


作者用 x2 的模型作为预训练,来训练 x4 的,效果比直接从头开始训练 x4 的要好
在这里插入图片描述

4.3 Multi-scale model

在这里插入图片描述
不知道 Single-scale model 的基础上直接多尺度输出,效果 OK 不

这样多少有点冗余的感觉

训练的时候,对应任务部分才训练,其余部分都冻住,例如训练 x2 SR 的时候,x3 和 x4 相关 resblock 被冻结

construct the minibatch with a randomly selected scale among ×2, ×3 and ×4.

Only the modules that correspond to the selected scale are enabled and updated

在这里插入图片描述
Baseline 参数量比较小,MDSR 中等,EDSR 设计的比较大

单个 MDSR 网络肯定是大的,但比起 3个同等规模的 EDSR 来说,会省下一些参数量

5 Experiments

we use the RGB input patches of size 48×48 from LR image with the corresponding HR patches.

5.1 Datasets and Metrics

Datasets

  • DIV2K:2K resolution
  • Set5
  • Set14
  • B100
  • Urban100
  • NTIRE 2017 Super-Resolution Challenge

评价指标

  • peak signal-to-noise ratio (PSNR)
  • SSIM

5.2 Geometric Self-ensemble

就是 TTA——test time augmentation 吧

在这里插入图片描述
作者用 flip 和 rotation 产生另外 7 种包含原始输入共 8 种 inputs,推理后, inverse transform to those output images,最后 8个结果平均

eg 顺时针旋转 30 度的图 SR 后,逆时针转 30 回来

在这里插入图片描述
上面表达式中 n n n 表示输入图片的索引,i 是 transformation 的索引

LR = low resolution

SR = super resolution

论文中如果用了 Geometric Self-ensemble,模型名称后面会有个 +

5.3 Evaluation on DIV2K Dataset

在这里插入图片描述
作者用 L1 loss 替换 L2 loss,从第一列和第二列结果对比来看,L1 要好

其实抛开参数量谈效果,很流氓,但作者也说了这篇文章的 motivation,this work is initially proposed for the purpose of participating in the NTIRE2017 Super-Resolution Challenge——技术报告

5.4 Benchmark Results

在这里插入图片描述
在这里插入图片描述

效果对比起来看,确实 OK

5.5 NTIRE2017 SR Challenge

在这里插入图片描述

在这里插入图片描述

6 Conclusion(own)

  • applying ResNet architecture directly to low-level vision problems like super-resolution can be suboptimal.
  • geometric self-ensemble is valid only for symmetric downsampling methods such as bicubic downsampling

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/757473.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

华为OD机试 - 单向链表中间节点(Java JS Python C C++)

题目描述 给定一个单链表 L,请编写程序输出 L 中间结点保存的数据。 如果有两个中间结点,则输出第二个中间结点保存的数据。例如: 给定 L 为 1→7→5,则输出应该为7; 给定 L 为 1→2→3→4,则输出应该为…

盘点国内IP地址服务的功能及提供商

随着互联网的快速发展和普及,IP地址服务提供商在中国市场扮演着越来越重要的角色。这些代理软件提供商不仅为用户提供稳定的网络连接,还可以帮助用户实现IP地址切换、绕过地理限制等功能。虎观代理接下来将详解国内IP地址服务的主要功能,并对…

王道c语言-chap13 栈实例

王道c语言-chap13 栈实例 #include <iostream>#define END -1 #define MaxSize 50typedef int ElemType; typedef struct {int data[MaxSize];int top; } SqStack;void InitStack(SqStack &s) {s.top-1; }void PrinfSqStack(SqStack s) {for (int i 0; i < s.to…

什么是布隆过滤器

布隆过滤器&#xff08;Bloom Filter&#xff09;是一种概率型数据结构&#xff0c;用于判断一个元素是否存在于一个集合中。它的主要优点是占用空间少、查询速度快&#xff0c;并且支持高效的插入和查询操作。 布隆过滤器由一个位数组和多个哈希函数构成。初始时&#xff0c;…

八股文三(Spring、Spring Cloud Alibaba)

Spring篇 什么是Spring Spring是个轻量级的框架&#xff0c;他有两大内核分别是IOC、AOPIOC是什么 * 依赖注入和控制反转&#xff0c;它是一种思想&#xff0c;创建对象不是直接new出来&#xff0c;而是交给IOC容器&#xff0c;由容器去创建进行管理&#xff0c;这就是控制反…

解决antd vue 的table列表过宅内容换行和过长有空白列的问题

主要有两个注意点 1、columns数组中保留一个对象不设置宽度&#xff0c;其余都要设置宽度&#xff1b; 2、HTML中scroll要设置为{x: 足够长的固定宽度}&#xff1b; 具体代码如下&#xff1a; <a-tableref"table"size"middle"rowKey"rowSerial&qu…

字符串函数---(1)

字符函数 文章目录 前言1.strlen 的使用和模拟实现2.strcpy 的使用和模拟实现3. strcat 的使用和模拟实现4. strcmp 的使用和模拟实现 前言 上一篇我们学习了字符函数&#xff0c;下来我们学习常见的字符串函数 1.strlen 的使用和模拟实现 size_t strlen(const char *str) 字…

(70min)字节暑假实习二面(已挂)

还没找到工作的小伙伴加油&#xff01; 字节看面评果然名不虚传。。 面试官&#xff1a; 看你一面基础也回答得不好&#xff0c;没事&#xff0c;那我就不问你八股&#xff0c;多问项目吧。 然后开始鞭打项目。 项目使用mq&#xff0c;从背景的&#xff0c;技术选型&#xff0…

DDOS攻击防御介绍

DDOS&#xff1a;分布式拒绝服务攻击 瞬间收到大量数据 总带宽是有限的 合法用户访问的时候&#xff0c;被非法方法流量占据 无法溯源 流量清洗&#xff1a;AntiDdos 边界&#xff0c;旁挂的 备用域名&#xff0c;ip更换 机房会提供解决方案 解决不了问题&#xff0c;就干…

【真实体会】花几百块买ChatGPT4.0账号一年值得吗?

GPT4.0使用体验及价值 性能提升: GPT4比GPT3.5在内容质量和数量上有显著提高&#xff0c;使得知乎等平台的收益增加。 功能丰富: GPT4支持文本、图片、文件问答&#xff0c;而GPT3.5仅支持文本。GPT4内置多种专业工具&#xff08;GPTS&#xff09;&#xff0c;如设计师LOGO的A…

关于我的经历

技能 1 Java基础扎实&#xff0c;具备并发编程经验&#xff0c;熟悉JMM、线程通信线程安全、锁、原子类、阻塞队列、并发容器、线程池原理。清楚并发内容的实现原理。阅读过部分JDK源码。 深入了解JVM虚拟机&#xff1a;内存模型、GC、垃圾回收算法、以及垃圾回收器&#xff0…

Android Studio实现内容丰富的安卓视频管理平台

获取源码请点击文章末尾QQ名片联系&#xff0c;源码不免费&#xff0c;尊重创作&#xff0c;尊重劳动 项目编号081 1. 开发环境 android stuido 2.功能介绍 安卓端&#xff1a; 1.注册登录 2.本地视频 3.视频播放 4.收藏功能 5.网路视频 6.个人中心 7.我的收藏 8.浏览历史 3.系…

蓝桥杯第14届模拟赛最大连通分块(dfs)

问题描述(答案148)   小蓝有一个 30 行 60 列的数字矩阵&#xff0c;矩阵中的每个数都是 0 或 1 。 110010000011111110101001001001101010111011011011101001111110 010000000001010001101100000010010110001111100010101100011110 001011101000100011111111111010000010010…

Redis高阶使用消息队列分布式锁排行榜等

一、前言 在大多数传统的web系统中&#xff0c;使用Redis一般都是作为缓存使用&#xff0c;在大数据查询时作为缓解性能的一种解决方案。博主的的系统中使用Redis也主要使用到缓存的作用&#xff0c;还有做了注册中心&#xff0c;分布式事务。其他的强大的功能&#xff0c;没有…

【哈希表】算法例题

目录 五、哈希表 39. 赎金信 ① 40. 同构字符串 ① 41. 单词规律 ① 42. 有效的字母异位词 ① 43. 字母异位词分组 ② 44. 两数之和 ① 45. 快乐数 ① 46. 存在重复元素 ① 47. 最长连续序列 ② 五、哈希表 39. 赎金信 ① 给你两个字符串&#xff1a;ransomNote 和 m…

Linux课程_____网络管理

一、查看接口信息 1. ifconfig 查看所有活动网络接口的信息 ifconfig -a 查看所有网络接口信息 ifconfig 直接加网络接口 查看指定网络接口信息 1.1查看指定接口IP [rootlocalhost ~]# ip addr show ens160 1.2设置网络接口的IP地址 # ifconfig eth0 192.168.152.133 …

考研模拟面试-题目【攻略】

考研模拟面试-题目【攻略】 前言版权推荐考研模拟面试-题目前面的问题通用问题专业题数据结构计算机网络操作系统数据库网络安全 手写题数据结构操作系统计算机网络 代码题基础代码题其他代码题 后面的问题补充题目 最后 前言 2023-10-19 12:00:57 以下内容源自《考研模拟面试…

全国各省市县统计年鉴/中国环境统计年鉴/中国工业企业数据库/中国专利数据库/污染排放数据库

统计年鉴是指以统计图表和分析说明为主&#xff0c;通过高度密集的统计数据来全面、系统、连续地记录年度经济、社会等各方面发展情况的大型工具书来获取统计数据资料。 统计年鉴是进行各项经济、社会研究的必要前提。而借助于统计年鉴&#xff0c;则是研究者常用的途径。目前国…

DC-DC 变换集成电路芯片MC34063A测试参数介绍

MC34063A 为一单片 DC-DC 变换集成电路&#xff0c;内含温度补偿的参考电压源&#xff08;1.25V&#xff09;、比较器、能有效限制电流及控制工作周期的振荡器&#xff0c;驱动器及大电流输出开关管等。外配少量元件&#xff0c;就能组成升压、降压及电压反转型 DC-DC 变换器。…

Java基础知识八股

1.为什么静态方法无法调用非静态方法&#xff1f; 回答&#xff1a;因为静态方法是随着类的加载而加载&#xff0c;而非静态方法则是随着类的实例化才会被加载&#xff0c;生存周期不一样&#xff0c;所以静态方法的生命周期更长 2.Java–内部类持有外部类导致内存泄露的原因和…