【EDSR】《Enhanced Deep Residual Networks for Single Image Super-Resolution》

在这里插入图片描述

CVPR workshops-2017

首尔大学

code:

  • https://github.com/limbee/NTIRE2017/tree/master
  • https://github.com/sanghyun-son/EDSR-PyTorch

文章目录

  • 1 Background and Motivation
  • 2 Related Work
  • 3 Advantages / Contributions
  • 4 Method
    • 4.1 Residual blocks
    • 4.2 Single-scale model
    • 4.3 Multi-scale model
  • 5 Experiments
    • 5.1 Datasets and Metrics
    • 5.2 Geometric Self-ensemble
    • 5.3 Evaluation on DIV2K Dataset
    • 5.4 Benchmark Results
    • 5.5 NTIRE2017 SR Challenge
  • 6 Conclusion(own)


1 Background and Motivation

single image super-resolution(SISR)aims to reconstruct a high-resolution image I S R I^{SR} ISR from a single low-resolution image I L R I^{LR} ILR

I L R I^{LR} ILR I S R I^{SR} ISR 的关系因应用场景而异,比如 bicubic downsampled 关系,blur,decimation(抽取) or noise

现有方法要么网络结构设计的不太稳定,要么 treat super-resolution of different scale factors as independent problems

作者设计了 single-scale SR model——enhanced deep super-resolution network(EDSR),和 multi-scale deep super-resolution system (MDSR)

2 Related Work

learn mapping functions between I L R I^{LR} ILR and I H R I^{HR} IHR image pairs

learning methods from neighbor embedding to sparse coding

第一篇用 DCNN 做 SR 的《Learning a deep convolutional network for image super-resolution》(ICCV-2014)

encoder

3 Advantages / Contributions

提出 single-scale SR model EDSR(改进了 residual block)和 multi-scale SR model MDSR(新结构)

Our proposed single-scale and multi-scale models have achieved the top ranks in both the standard benchmark datasets and the DIV2K dataset.

在这里插入图片描述

4 Method

4.1 Residual blocks

applying ResNet architecture directly to low-level vision problems like super-resolution can be suboptimal.

在这里插入图片描述
作者学习 SRResNet 去掉了 skip connection 后的 ReLU,在此基础上,又去掉了 BN,去掉 BN 的理由如下:

they get rid of range flexibility from networks by normalizing the features, it is better to remove them

4.2 Single-scale model

在这里插入图片描述

upsample 是 x2 or x3 or x4,根据任务要求来


深度为 B 宽度为 F 的网络 occupy O ( B F ) O(BF) O(BF) memory with O ( B F 2 ) O(BF^2) O(BF2)

提升宽度可以显著提升 model capacity,但是 inception-v4 中观察到 if filters number(width) 超过 1000,网络迭代后会慢慢死掉(average pooling 之前的 layer的输出为0),作者加大宽度的时候也会遇到这个问题,解决办法, Scaling of the Residuals——【Inception-v4】《Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning》

在这里插入图片描述
factor 0.1


作者用 x2 的模型作为预训练,来训练 x4 的,效果比直接从头开始训练 x4 的要好
在这里插入图片描述

4.3 Multi-scale model

在这里插入图片描述
不知道 Single-scale model 的基础上直接多尺度输出,效果 OK 不

这样多少有点冗余的感觉

训练的时候,对应任务部分才训练,其余部分都冻住,例如训练 x2 SR 的时候,x3 和 x4 相关 resblock 被冻结

construct the minibatch with a randomly selected scale among ×2, ×3 and ×4.

Only the modules that correspond to the selected scale are enabled and updated

在这里插入图片描述
Baseline 参数量比较小,MDSR 中等,EDSR 设计的比较大

单个 MDSR 网络肯定是大的,但比起 3个同等规模的 EDSR 来说,会省下一些参数量

5 Experiments

we use the RGB input patches of size 48×48 from LR image with the corresponding HR patches.

5.1 Datasets and Metrics

Datasets

  • DIV2K:2K resolution
  • Set5
  • Set14
  • B100
  • Urban100
  • NTIRE 2017 Super-Resolution Challenge

评价指标

  • peak signal-to-noise ratio (PSNR)
  • SSIM

5.2 Geometric Self-ensemble

就是 TTA——test time augmentation 吧

在这里插入图片描述
作者用 flip 和 rotation 产生另外 7 种包含原始输入共 8 种 inputs,推理后, inverse transform to those output images,最后 8个结果平均

eg 顺时针旋转 30 度的图 SR 后,逆时针转 30 回来

在这里插入图片描述
上面表达式中 n n n 表示输入图片的索引,i 是 transformation 的索引

LR = low resolution

SR = super resolution

论文中如果用了 Geometric Self-ensemble,模型名称后面会有个 +

5.3 Evaluation on DIV2K Dataset

在这里插入图片描述
作者用 L1 loss 替换 L2 loss,从第一列和第二列结果对比来看,L1 要好

其实抛开参数量谈效果,很流氓,但作者也说了这篇文章的 motivation,this work is initially proposed for the purpose of participating in the NTIRE2017 Super-Resolution Challenge——技术报告

5.4 Benchmark Results

在这里插入图片描述
在这里插入图片描述

效果对比起来看,确实 OK

5.5 NTIRE2017 SR Challenge

在这里插入图片描述

在这里插入图片描述

6 Conclusion(own)

  • applying ResNet architecture directly to low-level vision problems like super-resolution can be suboptimal.
  • geometric self-ensemble is valid only for symmetric downsampling methods such as bicubic downsampling

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/757473.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

盘点国内IP地址服务的功能及提供商

随着互联网的快速发展和普及,IP地址服务提供商在中国市场扮演着越来越重要的角色。这些代理软件提供商不仅为用户提供稳定的网络连接,还可以帮助用户实现IP地址切换、绕过地理限制等功能。虎观代理接下来将详解国内IP地址服务的主要功能,并对…

字符串函数---(1)

字符函数 文章目录 前言1.strlen 的使用和模拟实现2.strcpy 的使用和模拟实现3. strcat 的使用和模拟实现4. strcmp 的使用和模拟实现 前言 上一篇我们学习了字符函数,下来我们学习常见的字符串函数 1.strlen 的使用和模拟实现 size_t strlen(const char *str) 字…

DDOS攻击防御介绍

DDOS:分布式拒绝服务攻击 瞬间收到大量数据 总带宽是有限的 合法用户访问的时候,被非法方法流量占据 无法溯源 流量清洗:AntiDdos 边界,旁挂的 备用域名,ip更换 机房会提供解决方案 解决不了问题,就干…

【真实体会】花几百块买ChatGPT4.0账号一年值得吗?

GPT4.0使用体验及价值 性能提升: GPT4比GPT3.5在内容质量和数量上有显著提高,使得知乎等平台的收益增加。 功能丰富: GPT4支持文本、图片、文件问答,而GPT3.5仅支持文本。GPT4内置多种专业工具(GPTS),如设计师LOGO的A…

Android Studio实现内容丰富的安卓视频管理平台

获取源码请点击文章末尾QQ名片联系,源码不免费,尊重创作,尊重劳动 项目编号081 1. 开发环境 android stuido 2.功能介绍 安卓端: 1.注册登录 2.本地视频 3.视频播放 4.收藏功能 5.网路视频 6.个人中心 7.我的收藏 8.浏览历史 3.系…

Redis高阶使用消息队列分布式锁排行榜等

一、前言 在大多数传统的web系统中,使用Redis一般都是作为缓存使用,在大数据查询时作为缓解性能的一种解决方案。博主的的系统中使用Redis也主要使用到缓存的作用,还有做了注册中心,分布式事务。其他的强大的功能,没有…

【哈希表】算法例题

目录 五、哈希表 39. 赎金信 ① 40. 同构字符串 ① 41. 单词规律 ① 42. 有效的字母异位词 ① 43. 字母异位词分组 ② 44. 两数之和 ① 45. 快乐数 ① 46. 存在重复元素 ① 47. 最长连续序列 ② 五、哈希表 39. 赎金信 ① 给你两个字符串:ransomNote 和 m…

Linux课程_____网络管理

一、查看接口信息 1. ifconfig 查看所有活动网络接口的信息 ifconfig -a 查看所有网络接口信息 ifconfig 直接加网络接口 查看指定网络接口信息 1.1查看指定接口IP [rootlocalhost ~]# ip addr show ens160 1.2设置网络接口的IP地址 # ifconfig eth0 192.168.152.133 …

全国各省市县统计年鉴/中国环境统计年鉴/中国工业企业数据库/中国专利数据库/污染排放数据库

统计年鉴是指以统计图表和分析说明为主,通过高度密集的统计数据来全面、系统、连续地记录年度经济、社会等各方面发展情况的大型工具书来获取统计数据资料。 统计年鉴是进行各项经济、社会研究的必要前提。而借助于统计年鉴,则是研究者常用的途径。目前国…

DC-DC 变换集成电路芯片MC34063A测试参数介绍

MC34063A 为一单片 DC-DC 变换集成电路,内含温度补偿的参考电压源(1.25V)、比较器、能有效限制电流及控制工作周期的振荡器,驱动器及大电流输出开关管等。外配少量元件,就能组成升压、降压及电压反转型 DC-DC 变换器。…

基于springboot+vue的火锅店管理系统

博主主页:猫头鹰源码 博主简介:Java领域优质创作者、CSDN博客专家、阿里云专家博主、公司架构师、全网粉丝5万、专注Java技术领域和毕业设计项目实战,欢迎高校老师\讲师\同行交流合作 ​主要内容:毕业设计(Javaweb项目|小程序|Pyt…

[做题]动态规划

文章目录 0.DP前言1.线性DP数字三角形朴素做法更优雅的写法一维优化(朴素版本) 最长上升子序列朴素做法二分(数据加强版) 最长公共子序列朴素做法 最短编辑距离朴素做法 编辑距离朴素做法 2.其他DP区间dp石子合并 计数dp整数划分dp写法:完全背…

AI - 机器学习GBDT算法

目录 GBDT 提升树 梯度提升树 GBDT算法实战案例 XGBoost 😆😆😆感谢大家的观看😆😆 GBDT 梯度提升决策树(Gradient Boosting Decision Tree),是一种集成学习的算法&…

手机投屏到电脑

手机投屏到电脑 Github 有2个开源的手机投屏项目: Scrcpy: https://github.com/Genymobile/scrcpy QtScrcpy: https://github.com/barry-ran/QtScrcpy 这2个项目都很好用,我这里用的是 Scrcpy: 官方文档中介绍了如何在windows上使用 Scrcpy…

基于龙芯2k1000 mips架构ddr调试心得(一)

1、基础知识 DDR2的I/O频率是DDR的2倍,也就是266、333、400MHz。 DDR3传输速率介于 800~1600 MT/s之间 DDR4的传输速率目前可达2133~3200 MT/s 2k1000内存:板载2GB DDR3 ,可选4GB 使用龙芯芯片最好用他们自己的Bo…

C++特性三:多态的基本语法及原理剖析

一、多态的基本语法 多态分为两类 静态多态: 函数重载 和 运算符重载属于静态多态,复用函数名 动态多态: 派生类和虚函数实现运行时多态 静态多态和动态多态区别: 静态多态的函数地址早绑定 - 编译阶段确定函数地址 动态多态的函数地址晚绑定 - 运…

【Python】使用selenium对Poe批量模拟注册脚本

配置好接码api即可实现自动化注册登录试用一体。 运行后会注册账号并绑定邮箱与手机号进行登录试用。 测试结果30秒一个号 import re import time import requests from bs4 import BeautifulSoup from selenium import webdriver from selenium.webdriver.chrome.options imp…

keithley2612A数字源表

181/2461/8938产品概述: Keithley 2612A源表既可用作台式I-V表征工具,也可用作多通道I-V测试系统的构建模块组件。对于台式使用,吉时利2612ASourceMeter具有嵌入式TSP Express软件工具,允许用户快速轻松地执行常见的I-V测试&…

微信小程序开发学习笔记——4.2showModal和showLoading界面交互操作

>>跟着b站up主“咸虾米_”学习微信小程序开发中,把学习记录存到这方便后续查找。 课程连接:https://www.bilibili.com/video/BV19G4y1K74d?p27&vd_source9b149469177ab5fdc47515e14cf3cf74 一、showModal 显示模态对话框 1、属性 https:/…

基于springboot+vue的摄影网站(源码+部署说明+系统介绍+数据库)

作者主页:Java程序员老张 主要内容:SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app等设计与开发。 收藏点赞不迷路 关注作者有好处 文末获取源码 技术选型 【后端】:Java 【框架】:…