生成超清分辨率视频,南洋理工开源Upscale-A-Video

大模型在生成高质量图像方面表现出色,但在生成视频任务中,经常会面临视频不连贯、图像模糊、掉帧等问题。

这主要是因为生成式抽样过程中的随机性,会在视频序列中引入无法预测的帧跳动。同时现有方法仅考虑了局部视频片段的时空一致性,无法保证整个长视频的整体连贯性。

为了解决这些难题,新加坡南洋理工大学的研究人员开发了一种Upscale-A-Video框架,无需任何训练便能快速集成到大模型中,提供视频超分辨率、去噪、还原等强大功能。

论文地址:https://arxiv.org/abs/2312.06640

开源地址:https://github.com/sczhou/Upscale-A-Video

项目地址:https://shangchenzhou.com/projects/upscale-a-video/

Upscale-A-Video主要借鉴了图像模型中的扩散方法,设计了一种无需大规模训练即可快速迁移的框架。

该框架融合了局部和全局两种策略来维持时间的一致性。局部层,模型通过 3D 卷积和时序注意力层增强特征提取网络U-Net在短视频片段内的一致性。

全局层,则通过光流指导的循环潜码传播功能,提供跨视频片段强化更长时间尺度下的连贯性。

除了时间一致性,Upscale-A-Video还可以通过文本提示指导细节纹理的生成,不同的提示词可产生不同风格、质量。

图片

时序U-Net

U-Net作为特征提取网络,对视频质量起决定性作用。传统只考虑空间信息的U-Net在处理视频时往往会引入高频误差,表现为抖动和闪烁。

Upscale-A-Video通过向U-Net中插入3D卷积块和时序自注意力层,增强其对时间维度的建模能力。这使U-Net可以学习视频数据中帧与帧之间的依赖,从而在局部序列内实现一致的超分辨重建。

图片

另一方面,研究人员选择固定U-Net中的空间层参数,只对新增时序层进行调优。这种策略的优点是可以避免从头大规模预训练,充分利用图像模型中提取的丰富特征。同时也缩短了网络收敛的时间,起到事半功倍的效果。

循环潜码

时序U-Net的作用范围仅局限于短视频片段,难以约束更长序列的全局一致性。而视频抖动和质量波动往往都是长时间范围内的现象。

为解决这一问题,Upscale-A-Video设计了一个基于光流的循环潜码传播模块。

该模块可以在不增加训练参数的情况下,通过前向和后向传播推断所有帧的潜码信息,有效扩大模型感知的时间范围。

图片

具体来说,该模块利用预先估计的光流场,进行逐帧传播与融合。它根据光流的前向-后向一致性误差判断传播的有效性,只选择误差小于阈值的区域进行特征传播。

而超出阈值的区域则保留当前帧信息。这种混合融合策略,既利用了光流建模的长期信息,又避免了传播错误的累积。

文本提示增强指导

Upscale-A-Video还支持文本条件和噪声水平的控制,用户可以依据实际情况,引导模型生成不同风格和质量的结果。

图片

文本提示可以指导模型合成更逼真的细节,如动物皮毛、油画笔触等。噪声水平的调整也提供了在还原与生成间权衡的灵活性:加入更少噪声有利于保真,而更高水平的噪声则促使模型补充更丰富的细节。

这种可控制的生成能力进一步增强了Upscale-A-Video处理复杂真实场景的鲁棒性

实验数据

研究人员从定量和定性两个方面全面验证了Upscale-A-Video的性能。在四个合成低质量视频基准上,皆取得了最高的峰值信号噪声比和最低的流式感知损失。

流式验证集和AI生成视频上, Upscale-A-Video的非参考画质评分也高居各方法之首。这也证明了Upscale-A-Video在保真还原和感知质量上的优势。

图片

从生成效果对比来看,Upscale-A-Video重建的视频展现了更高实际分辨率下的细节层次;运动轨迹更加连贯自然,没有明显的抖动和裂缝。这得益于强大的扩散先验和时空一致性优化。

相比之下,卷积神经网络和扩散等方法会出现模糊不清,失真等效果,无法达到同等水准。

本文素材来源Upscale-A-Video论文,如有侵权请联系删除

END

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/560377.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

matlab 文件之间相互调用实例

效果: 找到按钮的回调 function pushbutton1_Callback(hObject, eventdata, handles) cd Deploy Nodes %square_random(100,100,0.03);%布置节点 GPS误差为0 %square_random(1000,300,0.2,30) %GPS误差为30m %C_random([1000,300,300,700],240,0.2); square_regul…

linux+虚拟机上的wdcp,linux虚拟主机服务器wdcp系统教程

满意答案eslct2017.01.29采纳率:47% 等级:9已帮助:1264人linux虚拟主机服务器wdcp系统教程在我们安装了网络服务管理系统wdcp后,可能会有不少疑问还有就是使用过程中出现的问题,下面为大家总结几点比较常见的&#…

matlab guide实现多级界面

matlab如何实现多级界面呢?也就是说,在一个界面点击某个地方,就弹出来另一个界面,在另一个界面还可以再进行操作。 实验结果 实验原理 首先建立两个gui,并且每个gui都进行如下设置: 然后我们找到test.f…

常见积分和导数的推导

导数: 1.yarcsinxyarcsinxyarcsinx的导数: yarcsin⁡x→xsin⁡y→1y′cos⁡y→y′1cos⁡y→y′11−x2\\y\arcsin x\\ \rightarrow x\sin y\\ \rightarrow 1{y}\cos y\\ \rightarrow {y}\frac{1}{\cos y}\\ \rightarrow {y}\frac{1}{\sqrt{1-x^{2}}}yarc…

c语言函数调用排序用插入法,C语言:编写查找和排序函数(二分查找,冒泡排序,选择排序法,插入排序)...

任务代码&#xff1a;二分查找数组的一个数字&#xff1a;(函数法)#include int binarySearch(int a[],int len,int key){int low0,highlen-1,mid;int i-1;//相当于indexwhile(low<high){mid(lowhigh)/2;if(a[mid]key){imid;break;}else if(key>a[mid]){lowmid1;}else{hi…

常用于解决放缩问题的基本不等式及其几何直观证明

考研中遇到放缩问题就需要用到不等式&#xff1a; 一般放缩的地方就是夹逼准则&#xff0c;还有判断多元函数极限是否存在。 基本不等式&#xff1a; (调和均值 ≤ 几何均值 ≤ 算术均值 ≤ 平方均值) 当且仅当ab时等号成立。 基本不等式的几何直观证明&#xff1a; 基本不…

c语言 连接哨兵 redis6,Redis哨兵--缓存服务器

redis哨兵说明:通过缓存服务器可以有效的提升用户的访问效1.注意事项:A:缓存的数据结构应该选用K-V结构,只要K唯一那么结果必然相同B:缓存总的数据不可能一直储存,需要定期将内存数据进行优化,LRU算法....C:缓存的运行数据要求要快,C语言实现... 运行在内存中D:如果缓存运行的数…

复数和复变指数函数和三角函数和欧拉公式关系及几何直观意义

证明欧拉公式 如果这么看自变量&#xff1a;θωt\theta \omega t θωt那么就可以发现欧拉公式的几何意义。 复数的表示形式 通过下面对比可以发现&#xff0c;用复指数表示复数在几何上更直观。 复数的运算 1.加法运算 设z1abi&#xff0c;z2cdi是任意两个复数&#xf…

利用DHT22和Arduino测量温湿度并显示在串口和OLED显示屏上

实验结果 温湿度显示在串口&#xff1a; 温湿度显示在OLED屏幕&#xff1a; 实验代码 #include "U8glib.h" #include "DHT.h"U8GLIB_SSD1306_128X32 u8g(U8G_I2C_OPT_NONE); #define DHTTYPE DHT22 // DHT 22 (AM2302) #define DHTPIN 2 // wh…

Altium Designer20新建项目\导入库\绘制原理图\导入pcb\绘制pcb

1.新建项目 2.新建原理图和PCB 3.新建原理图库和pcb库 4.导入原理图库和pcb库 点击如图所示 然后点击安装&#xff0c;找到需要安装的位置&#xff0c;打开 然后在下拉框里就可以找到&#xff0c;并选择外部的库 5.绘制原理图 在Components里面选择一个库然后找元器件 然…

红魔1android版本能升到多少,红魔5G:实力全开,比快更快

红魔5G&#xff1a;实力全开&#xff0c;比快更快2020-03-20 20:37:090点赞0收藏0评论在当代年轻人的生活里&#xff0c;手游似乎已经成为必不可少的一部分&#xff1a;心情不好来一局、初次见面来一局、闲来无事来一局。各大手机厂商洞察到这一点&#xff0c;纷纷推出针对手游…

Altium Designer20原理图绘制

1.网络标签 如图所示&#xff0c;添加网络标签&#xff0c;两个相同标签连到一块 添加name&#xff0c;可以直接按TAB键改名&#xff0c;如果需要上横线&#xff0c;在字母后面加’\‘ 2.电源标识 3.画线 这里的线不是导线&#xff0c;不具有电气特性&#xff0c;是用来划…

Altium Designer20原理图库放置引脚报错解决方案

原理图库里点击放置引脚&#xff0c;然后AD20报错。 View Pin threw an exception. System.Windows.Markup.XamlParseException: 在“System.Windows.Markup.StaticResourceHolder”上提供值时引发了异常。 —> System.Exception: 无法找到名为“JustificationToAlignmen…

android微信表情导出来的,微信表情怎么导出 如何批量备份微信表情

微信表情怎么导出&#xff1f;如何批量备份微信表情&#xff1f;因为微信自身的软件限制因素&#xff0c;导致我们无法直接在手机客户端中完成自定义表情的导入操作&#xff0c;所以还请各位小伙伴们移步PC端同步助手来导入自定义表情哦~1)下载安装同步助手电脑版&#xff0c;将…

Android studio下载安装使用遇到的问题及解决办法

1.haxm文件已经下载&#xff0c;但未安装&#xff0c;导致启动avd模拟器不成功 ①&#xff1a;在Android Studio中打开 File | Settings | Appearance & Behavior | System Settings | Android SDK&#xff0c;下载HAXM ②&#xff1a;打开文件资源管理器&#xff0c;进…

html盒子自动居中,css盒子怎么居中?

在前端切图的时候&#xff0c;可能经常会遇到一个div盒子怎么在固定区域垂直居中的需求&#xff0c;下面我们来看一下css实现盒子居中的方法。css设置盒子居中的方法&#xff1a;第一种&#xff1a;用css的position属性.div1 {width: 100px;height: 100px;border: 1px solid #0…

Altium Designer20原理图库制作

1.绘制SMA元件 放置管脚&#xff0c;管脚的十字朝外&#xff0c;点击place pin 然后按TAB键。Designator是管脚号&#xff0c;Name可以不写。点击眼睛的按钮可以隐藏管脚号。 可以双击引脚修改长度 可以通过修改圆的宽度&#xff0c;变成实心的。 设置元器件的名字&#xff…

如何抓取html请求,怎么获取请求头

如何查看HTTP请CSS布局HTML小编今天和大家分享头方法/步骤 1 打开Chrome浏览器&#xff0c;点击右上角“三”按钮。 点击工具-再点击开发者工具 2 找到Network选项框。以百度经验页面为例&#xff0c;点击任务选框来查看网络请CSS布局HTML小编今天和大家分享流 3 在Network框内…

HTML5类选择器使用,CSS选择器种类及使用方法

CSS选择器种类及使用方法2018年04月17日| 萬仟网IT编程| 我要评论css选择器 有通配符选择器书写格式&#xff1a;*&#xff5b;声名块&#xff5d; 并集选择器/组合选择器 书写格式;元素或类或id“”元素或类或id“&#xff0c;”元素或类或id&#xff5b;声明块&#xff5d; 列…

yii2 html 跳转,阐述在Yii2上实现跳转提示页

序言为了让用户有更加良好的体验&#xff0c;在操作成功或者失败后&#xff0c;来个提示并跳转页面&#xff0c;我就在Yii2上实现了这一个效果。在写这个跳转提示页的时候&#xff0c;找资料我发现网上关于这方面的中文资料真的很少&#xff0c;大家也都共享下吧&#xff01;需…