网页网站开发项目设计/集客营销软件官方网站

网页网站开发项目设计,集客营销软件官方网站,全国疫情最新消息今日情况,怎么做代刷网站写在前面:本博客仅作记录学习之用,部分图片来自网络,如需引用请注明出处,同时如有侵犯您的权益,请联系删除! 文章目录 前言论文动机方法实验 总结互动致谢参考往期回顾 前言 盲人脸恢复是一个高度不适定的…

写在前面:本博客仅作记录学习之用,部分图片来自网络,如需引用请注明出处,同时如有侵犯您的权益,请联系删除!


文章目录

  • 前言
  • 论文
    • 动机
    • 方法
    • 实验
  • 总结
  • 互动
  • 致谢
  • 参考
  • 往期回顾


前言

盲人脸恢复是一个高度不适定的问题,通常需要辅助指导,各种先验已经被用来减轻这个问题的不适定性,包括几何先验,参考先验和生成先验。

LQ-HQ映射不确定性仍然存在,并且输出质量因输入图像的退化而恶化。一些基于生成先验方法,通过迭代优化或直接潜在编码将退化的人脸投影到连续的无限空间中。在严重退化的情况下,很难找到准确的潜在向量,导致低保真度的结果。

进而将盲人脸恢复作为码本预测任务可大大降低恢复映射的不确定性和模糊性,同时提供丰富的视觉原子来生成高质量的人脸。进一步依赖可控的特征变换模块,允许灵活的保真度和质量之间的权衡。


论文

论文名: Towards Robust Blind Face Restoration with Codebook Lookup Transformer

论文速递: 点我转跳哦

代码通道: GitHub、Gitee

动机

本质上实现以下内容即可实现较高质量的复原:

  • 改进/改进从LQ输入到期望输出的映射
  • 补充输入中丢失的高质量细节

在这里插入图片描述

(a)连续生成先验(顶部)和离散码本先验(底部)的恢复框架。(B)HQ/LQ面部特征和码本的 t-SNE 可视化。

  • 高质量图像,面部组件的潜在向量/码本是可分的

  • 退化图像,面部组件的潜在向量/码本分布边界不清晰

    • 因此在连续潜在空间,退化严重就很难找到准确的潜在向量进行优化,导致复原质量不高。
    • 将潜在空间选取有限的码本, 可大幅减少LQ到HQ的错误映射。

方法

在这里插入图片描述

CodeFormer框架。首先学习一个离散的码本和一个解码器,通过自重构学习来存储人脸图像的高质量视觉部分。在固定码本和解码器的情况下,引入Transformer模块来进行码序列预测,对低质量输入的全局人脸组成进行建模。

  • 第一阶段 - 学习码本:为了减少LQ-HQ映射的不确定性并补充高质量的恢复细节,对量化的自动编码器进行预训练,以学习上下文丰富的码本,去提高网络的表现力以及对降级的鲁棒性。

  • 第二阶段 - 码本Transformer学习:由于LQ面部中纹理的破坏,最近邻匹配通常无法找到用于面部恢复的准确码本,采用Transformer来对全局相互关系进行建模,以实现更好的码本预测。自编码器的编码器后面插入一个包含九个自注意块的Transformer模块。

  • 第三阶段 - 可控特征转换:其实第二阶段已经获得了一个很好的人脸恢复模型,利用可控特征变换(CFT)模块来控制信息流从LQ编码器EL到解码器DH。

将512 × 512 × 3的人脸图像表示为16 × 16的码元序列,使用四个NVIDIA Tesla V100 GPU进行训练,羡了这算力。

实验

毫无疑问,吊打当时的先进方法,上图。

在这里插入图片描述

合成数据集

在这里插入图片描述


在这里插入图片描述

真实数据集

在这里插入图片描述


在这里插入图片描述

侧脸也不赖


总结

总结: CodeFormer通过学习一个小的离散但有表现力的码本空间,将人脸恢复转化为码元预测,大大降低了恢复映射的不确定性,简化了恢复网络的学习。同时通过一个有表现力的Transformer模块从降级的面孔中探索全局组合和依赖性,以获得更好的码本预测。


互动

  • 上述内容对你有帮助吗?

欢迎在评论区解答上述问题,分享你的经验和疑问!

当然,也欢迎一键三连给我鼓励和支持:👍点赞 📁 关注 💬评论。


致谢

欲尽善本文,因所视短浅,怎奈所书皆是瞽言蒭议。行文至此,诚向予助与余者致以谢意。


参考

[1] Towards Robust Blind Face Restoration with Codebook Lookup Transformer
[2] https://gitee.com/qianxdong/CodeFormer
[3] https://github.com/sczhou/CodeFormer?tab=readme-ov-file


往期回顾


👆 DeepSeek本地化部署保姆级教程👆

👆 EfficientTrain++帮你降低网络训练的成本👆

👆 PyCharm环境下Git与Gitee联动👆

👆 【CVPR-2023】DR2:盲人脸复原👆

👆 轻量化设计如何提高模型的推理速度👆

👆 正则化与正则剪枝👆

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/73997.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

k8s1.30 部署calio网络

一、介绍 网路组件有很多种,只需要部署其中一个,推荐calio。 calio是一个纯三成的数据中心网络方案,calico支持广泛的平台。如k8s,openstack等。 calio在每一个计算节点利用linux内核,实现了一个高效的虚拟路由器来…

数据结构(python)-------栈和队列2

目录 二、队列 (一)、定义 1. 定义 2. 逻辑结构 3. 存储结构 4. 运算规则 5. 实现方式 (二)、队列与一般线性表的区别 一般线性表 队列 (三)、分类 …

基于SpringBoot的“校园招聘网站”的设计与实现(源码+数据库+文档+PPT)

基于SpringBoot的“校园招聘网站”的设计与实现(源码数据库文档PPT) 开发语言:Java 数据库:MySQL 技术:SpringBoot 工具:IDEA/Ecilpse、Navicat、Maven 系统展示 系统整体功能图 局部E-R图 系统首页界面 系统注册…

投资日记_道氏理论技术分析

主要用于我自己参考,我感觉我做事情的时候容易上头,忘掉很多事情。 技术分析有很多方法,但是我个人相信并实践的还是以道氏理论为根本的方法。方法千千万万只有适合自己价值观,习惯,情绪,性格的方法才是好的…

Windows主机、虚拟机Ubuntu、开发板,三者之间文件互传

以下内容源于日常学习的整理,欢迎交流。 下图是Windows主机、虚拟机Ubuntu、开发者三者之间文件互传的方式示意图: 注意,下面谈及的所有方式,都要求两者的IP地址处于同一网段,涉及到的软件资源见felm。 一、Windows主…

RIP路由欺骗攻击与防御实验详解

一、基础网络配置 1. 路由器R1配置 interface GigabitEthernet0/0/0ip address 192.1.2.254 255.255.255.0 ! interface GigabitEthernet0/0/1ip address 192.1.3.254 255.255.255.0 ! router rip 1version 2network 192.1.2.0network 192.1.3.0 2. 路由器R2配置 interface…

阿里云平台Vue项目打包发布

目录: 1、vue项目打包2、通过ngixn发布vue的打包文件 1、vue项目打包 在你的vue项目下执行npm run build命令进行打包。 2、通过ngixn发布vue的打包文件 直接将打包的dist文件拷贝到nginx目录下即可。 修改nginx.conf的配置文件的相关配置,如端口或者ro…

《基于Spring Boot+Vue的智慧养老系统的设计与实现》开题报告

个人主页:@大数据蟒行探索者 一、研究背景及国内外研究现状 1.研究背景 根据1982年老龄问题世界大会联合国制定的标准,如果一个国家中超过65岁的老人占全国总人口的7%以上,或者超过60岁的老人占全国总人口的10%以上,那么这个国家将被定义为“老龄化社会”[1]。 随着国…

SpringCache @Cacheable 在同一个类中调用方法,导致缓存不生效的问题及解决办法

由于项目需要使用SpringCache来做一点缓存,但自己之前没有使用过(其实是没有听过)SpringCache,于是,必须先学习之。 显然,就是在同一个类中,MethodA 调用了 MethodB,那么 MethodB 上…

在VMware上部署【Ubuntu】

镜像下载 国内各镜像站点均可下载Ubuntu镜像,下面例举清华网站 清华镜像站点:清华大学开源软件镜像站 | Tsinghua Open Source Mirror 具体下载步骤如下: 创建虚拟机 准备:在其他空间大的盘中创建存储虚拟机的目录&#xff0c…

初入ARM,点灯,按键与中断相结合

与MCU不同,ARM属于功能更复杂,更强大的SOC,是可以移植操作系统的,但是在最开始学习arm,需要了解arm的运行方式,所以现在使用的是裸机开发。arm系统有多种工作模式,分别是User,IRQ&am…

Moonlight-16B-A3B: 变革性的高效大语言模型,凭借Muon优化器打破训练效率极限

近日,由Moonshot AI团队推出的Moonlight-16B-A3B模型,再次在AI领域引发了广泛关注。这款全新的Mixture-of-Experts (MoE)架构的大型语言模型,凭借其创新的训练优化技术,特别是Muon优化器的使用,成功突破了训练效率的极…

风尚云网|前端|JavaScript性能优化实战:从瓶颈定位到高效执行

JavaScript性能优化实战:从瓶颈定位到高效执行 JavaScript性能优化 在移动优先和Web应用日益复杂化的今天,JavaScript性能优化已成为前端工程师的必修课。本文将通过真实场景案例,深入解析从性能瓶颈定位到具体优化策略的完整闭环&#xff…

强大的AI网站推荐(第一集)—— Devv AI

网站:Devv AI 号称:最懂程序员的新一代 AI 搜索引擎 博主评价:我的大学所有的代码都是使用它,极大地提升了我的学习和开发效率。 推荐指数:🌟🌟🌟🌟🌟&#x…

使用 .NET Core 的本地 DeepSeek-R1

使用 .NET 在我的 MacBook Pro 上与当地 LLM 聊天的历程。 如今,只需使用浏览器即可轻松使用 ChatGPT 或其他 genAI。作为开发人员,我们可以通过直接集成 OpenAI API 等来做更复杂的事情。如果我们想在自己的机器上运行 LLM,只是为了找人聊天…

Visual Studio调试的技巧

1.什么是bug? bug:程序漏洞,也就是程序中存在的问题。 2.什么是调试? 当我们发现了程序中的问题后就会解决问题,前提是要找到问题,那么进行调试(debug)以此来找到问题。 3.debug…

利用大语言模型生成的合成数据训练YOLOv12:提升商业果园苹果检测的精度与效率

之前小编分享过关于《YOLO11-CBAM集成:提升商业苹果园树干与树枝分割的精准度》,改进YOLO11算法后,进行苹果树的实例分割。本期文章我们将分享关于最新的YOLO12算法改进的苹果目标检测。 论文题目:Improved YOLOv12 with LLM-Gen…

设计模式 二、创建型设计模式

GoF是 “Gang of Four”(四人帮)的简称,它们是指4位著名的计算机科学家:Erich Gamma、Richard Helm、Ralph Johnson 和 John Vlissides。他们合作编写了一本非常著名的关于设计模式的书籍《Design Patterns: Elements of Reusable…

redis,tar.gz安装后,接入systemctl报错解决

1. WARNING Memory overcommit must be enabled! 这种报错,有两种解决方法 1.1 修改系统参数 编辑 /etc/sysctl.conf 文件,设置 overcommit_memory 为 1 vm.overcommit_memory 11.2 修改redis的最大使用内存 修改配置文件 redis.conf maxmemory 1g…

Python绘图技巧,主流绘图库

一、主流绘图库概览 1. 核心工具对比 库名称特点适用场景Matplotlib基础绘图库,高度可定制科学绘图、论文图表Seaborn基于Matplotlib,统计图表优化数据分布、关系可视化Plotly交互式可视化,支持网页输出仪表盘、动态数据展示Pandas内置简易…