一个令人惊艳的图片高清化重绘神器:SUPIR来了!

今天给大家分享一个将模糊图片还原为照片级高清图像的AI项目:SUPIR。这个项目以尖端的大规模人工智能革新图像恢复技术,通过文本驱动、智能修复,将AI技术与创新思维相结合,赋予每张图像全新的生命力。这个项目的修复能力本质上是一种重绘能力,很多搞设计的同学都说挺不错。

效果展示

经过我的实测,这个项目特别适合低分辨率和模糊照片的高清化处理,比Stable Diffusion WebUI中的高清化效果要好上很多。话不多说,先看效果:

风景图片

感觉这个项目对风景图和物件等真实图片的高清化修复效果是最好的,默认设置就可以出来比较好的效果。

人物肖像

人物肖像的处理效果稍微差点,不过相比其它的AI项目还是会好上不少的。这里我从网上找了一些模糊的剧照和普通人照片,大家可以参考下。小图看着不是很明显,放大对比效果比较明显,建议实际试试。相关图片可以到我的公众号(yinghuo6ai)领取。

老照片

这个项目也可以修复老照片,不过略感遗憾的是,这个项目没有修复破损图片的能力,和之前分享过的老照片高清修复对比一下:可以看到图片上的斑点、划线都被加强了。那种有很多雪花、污渍和裂痕的图片并不适合用SUPIR进行直接修复,可以试试一些AI在线修复工具,比如改图鸭、VanceAI等。

不过SUPIR的优点也很明显,不仅处理了面部,对画面中的其它元素也进行了修复,比如上图中的服装部分更清晰了。所以这又给我提供了一个新的思路,先通过之前SD WebUI的方法对图片进行高清处理,再通过SUPIR进一步处理,我们仍然能获得一些收益。效果对比如下:

部署安装

这个项目发布在Github上:GitHub - Fanghua-Yu/SUPIR: SUPIR aims at developing Practical Algorithms for Photo-Realistic Image Restoration In the Wild

你可以参照其中的介绍自行安装,不过坑可能比较多,还有很多模型需要特殊网络设置才能下载,仅建议技术高手尝试。

为了方便使用,我在AutoDL的云环境中制作了一个镜像,可以一键启动,直接开始创作,免去安装和下载模型的烦恼,创建实例时搜索社区镜像 yinghuoai-SUPIR 即可找到。

另外我对自己的安装过程也做了一个整理,相关程序和模型都提供了方便的下载地址,按照这个步骤你可以把它部署在任意地方。

制作不易,镜像使用方法和独立安装说明目前仅发布在我的AI绘画专栏,如有需要点此前往。

使用方法

基本使用

SUPIR使用起来很简单,只需要4步,如下图所示:

第1步:上传一张待处理的照片,这里以百度贴吧中“弱智吧”的Logo为例。

第2步:对图片进行预处理。这一步会对图片进行“伽玛校正”,校正图片的亮度和色彩。预处理的图片会展示在 Stage1 Output 处。

第3步:生成图片内容描述。这是下一步用来修复图片的提示词,生成后展示在 Prompt 处,如果感觉描述不准确,可以手动修改。

第4步:提交修复图片。这一步可能比较慢,最终效果会展示在 Upscaled Images Output 处。可以拖动中间的横线,对比原始图片和修复图片的差别。

调整参数

如果你对修复的效果不是很满意,可以调整参数试试。我在修复人像图片的时候就遇到一些问题,皮肤皱纹会比较多,显得很老,或者模型根本没有理解图片中各个部分的内容,图片崩掉了。

我们先看一下阶段1和阶段2的这几个参数,如下图所示:

基本上就是Stable Diffusion的相关参数,参数的含义我已经在图中做了标记,就不挨个介绍了,只挑几个重点的参数说明下。

4、图像放大倍数:图像越大使用的显存越多,处理的也越慢。

6、提示词引导系数:如果感觉生成的图片偏离原图过多,可以降低这个数值试试。模糊图像比较明显。

7、阶段2引导强度:如果感觉生成的图片偏离原图过多,也可以同时降低这个数值试试。模糊图像比较明显。

11、引入噪音:会在每次采样时加入一些噪音,值越大生成图片的变化会更多一些。

12、正向提示词:你想加强哪些方面,就写上对应的词语。

13、负向提示词:你不想要哪些方面,就把对应的词语写在这里。比如ugly,bad face等等。

另外还有一些参数,对图片的处理影响比较小,这里简单介绍下,如下图所示:

1、侧重质量还是还原性:图片质量高可能与原图差别较大,还原性就是保真性,更贴近原图。

3、线性阶段2引导起始阶段:这个参数会让图片更贴近提示词,产生更多变化。如果使用,建议使用0.75以上,不要偏离的太多。


以上就是本文的主要内容。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/817193.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI的说服力如人类?Anthropic最新研究揭秘机器的辩论能力|TodayAI

人们常常对人工智能模型在对话中的说服力表现持怀疑态度。长久以来,社会上一直存在一个疑问:人工智能是否会达到人类那样,在对话中具有改变他人想法的能力? 直到最近,这一领域的实证研究相对有限,对于人工…

零基础使用FlexLua打造LoRa无线气体流量计,硬件轻松快速开发。

在工业领域,对气体流量进行准确监测和管理是保障生产安全和提高效率的重要环节。而LoRa(长距离低功耗无线技术)作为一种适用于远距离、低功耗的通信技术,为无线传感器网络的建设提供了可靠的解决方案。结合气体流量传感技术&#…

畅游网络:构建C++网络爬虫的指南

概述 随着信息时代的来临,网络爬虫技术成为数据采集和网络分析的重要工具。本文旨在探讨如何运用C语言及其强大的cpprestsdk库构建一个高效的网络爬虫,以便捕捉知乎等热点信息。为了应对IP限制的挑战,我们将引入亿牛云爬虫代理服务&#xff…

NPU流式输出-torch_npu和transformers框架-多线程Streamer-昇腾910B-EE1001

前情提要 torch_npu框架不支持多线程自动set_device 报错详情 直接使用transformers的TextIteratorStreamer进行流式推理,会报错 Exception in thread Thread-6: Traceback (most recent call last):File "/root/anaconda3/envs/AI/lib/python3.9/threadin…

《springcloud alibaba》 六 微服务链路跟踪skywalking

目录 准备调整配置接入多个微服务网关项目调整order-seata项目stock-seata项目测试 接入网关微服务 skywalking持续化到mysql自定义链路跟踪pom .xmlorderControllerOrderServiceOrderDaoOrderTblMapper.xml测试 性能剖析日志tid打印pom.xmllogback-spring.xml日志收集启动项目…

OSI七层网络模型 —— 筑梦之路

在信息技术领域,OSI七层模型是一个经典的网络通信框架,它将网络通信分为七个层次,每一层都有其独特的功能和作用。为了帮助记忆这七个层次,有一个巧妙的方法:将每个层次的英文单词首字母组合起来,形成了一句…

TensorFlow-GPU安装

第一步:安装Anaconda、cuda以及对应的cudNN,其中TensorFlow-GPU对应版本如下图所示: 想看最新的话,可以看官方链接:https://www.tensorflow.org/install/source_windows?hlzh-cn 第二步:创建对应的虚拟环…

在Windows上安装Go编译器并配置Golang开发环境

文章目录 1、安装Go语言编译程序1.1、下载GoLang编译器1.2、安装GoLang编译器 2、配置Golang IDE运行环境2.1、配置GO编译器2.1.1、GOROOT 概述2.1.2、GOROOT 作用2.1.2、配置 GOROOT 2.2、配置GO依赖管理2.2.1、Module管理依赖2.2.2、GOPATH 管理依赖 2.3、运行GO程序2.3.1、创…

【面试经典 150 | 数学】直线上最多的点数

文章目录 写在前面Tag题目来源解题思路方法一:枚举直线遍历统计方法二:枚举斜率哈希统计 写在最后 写在前面 本专栏专注于分析与讲解【面试经典150】算法,两到三天更新一篇文章,欢迎催更…… 专栏内容以分析题目为主,并…

改进的注意力机制的yolov8和UCMCTrackerDeepSort的多目标跟踪系统

基于yolov8和UCMCTracker/DeepSort的注意力机制多目标跟踪系统 本项目是一个强大的多目标跟踪系统,基于[yolov8]链接和[UCMCTracker/DeepSot]/链接构建。 🎯 功能 多目标跟踪:可以实现对视频中的多目标进行跟踪。目标检测:可以实…

在 VS Code 中使用 GitHub Copilot

Code 结合使用。 GitHub Copilot 是什么 GitHub Copilot 是一个可以帮助你更简单、更快速地编写代码的工具,由 GPT-3 提供支持。你只需编写所需代码的描述——例如,编写一个函数来生成一个随机数,或对一个数组进行排序——Copilot 就会为你…

【Docker】docker原理及使用-1

Docker目录 1️⃣概念2️⃣使用容器的好处2️⃣docker和普通软件启动方式的区别2️⃣docker和传统虚拟机的区别 1️⃣下载安装2️⃣安装步骤 1️⃣必须要掌握的核心概念1️⃣命令2️⃣例子2️⃣练习题目2️⃣进入一下python环境(简洁) 1️⃣解释一下 redis1️⃣docker底层隔离机…

L3 【哈工大_操作系统】操作系统启动

本节要点: 1、理解 OS 启动过程发生了什么,理解 OS 与 硬件 与 应用 之间的关系 2、本节讲解了 setup 模块 和 system 模块实现的功能 1、计算机上电时,操作系统在硬盘(磁盘)上,为了“取指执行”&#xff0…

康姿百德床垫抗干扰设计,保证你和伴侣睡眠不受影响

康姿百德官网价格公开透明,床垫价格合理质量安全可靠 在我们的一生中,睡眠的时间占据我们生活的大部分。在繁忙的一天结束时,没有什么比沉浸在舒适床垫的温柔拥抱中更让人期待的,让您在睡眠过程中释放一整天的疲惫。康姿百德床垫…

第十五届蓝桥杯大赛软件赛省赛 C/C++ 大学 B 组

试题 C: 好数 时间限制 : 1.0s 内存限制: 256.0MB 本题总分:10 分 【问题描述】 一个整数如果按从低位到高位的顺序,奇数位(个位、百位、万位 )上 的数字是奇数,偶数位(十位、千位、十万位 &…

基于Spring Boot的入职匹配推荐系统设计与实现

基于Spring Boot的入职匹配推荐系统设计与实现 开发语言:Java框架:springbootJDK版本:JDK1.8数据库工具:Navicat11开发软件:eclipse/myeclipse/idea 系统部分展示 管理员登录界面,登录成功后进入到系统操…

面试经典150题——二叉树的最大深度

1. 题目描述 ​ 2. 题目分析与解析 这个题目有过一定基础的都应该知道,采用递归解决问题,因为要求一个二叉树的深度(也就是高度),其实上就是根节点的左子树和右子树中高度最高的那个。因此这个问题就可以拆解为&…

Python爬虫-京东商品评论数据

前言 本文是该专栏的第68篇,后面会持续分享python爬虫干货知识,记得关注。 在本专栏之前,笔者有详细介绍京东滑块验证码的解决方法,感兴趣的同学,可以直接翻阅文章《Python如何解决“京东滑块验证码”(5)》进行查看。 而本文,笔者以京东商品详情页的评论数据为例,通过…

悠络客亮相第十届智慧商业数字化运营高峰论坛

2024年4月12日,由中国零售(餐饮)CIO俱乐部、《智慧零售与餐饮》新媒体主办的“2024第十届智慧商业数字化运营高峰论坛暨中国零售CIO俱乐部春季思享会”在北京举办。 来自全国各地的商超、便利、生鲜、百货、购物中心、快消品、食品/酒水/鞋服…

探索分布式技术--------------注册中心zookeeper

目录 一、ZooKeeper是什么 二、ZooKeeper的工作机制 三、ZooKeeper特点 四、ZooKeeper数据结构 五、ZooKeeper应用场景 5.1统一命名服务 5.2统一配置管理 5.3统一集群管理 5.4服务器动态上下线 5.5软负载均衡 六、ZooKeeper的选举机制 6.1第一次启动选举机制 6.2非…