论文解读——掌纹生成网络 RPG-Palm升级版PCE-Palm

该文章是2023年论文RPG-Palm的升级版
论文:PCE-Palm: Palm Crease Energy Based Two-Stage Realistic Pseudo-Palmprint Generation
作者:Jin, Jianlong and Shen, Lei and Zhang, Ruixin and Zhao, Chenglong and Jin, Ge and Zhang, Jingyun and Ding, Shouhong and Zhao, Yang and Jia, Wei
出版刊物:Proceedings of the AAAI Conference on Artificial Intelligence
代码:https://github.com/Ukuer/PCE-Palm


文章目录

  • 1、算法概述
  • 2、背景知识
  • 3、算法细节
    • 3.1 Transfer from Bézier Palm to PCE Domain
    • 3.2 Generate Realistic Palmprint from PCE Domain
    • 3.3 推理阶段
  • 4、实验


1、算法概述

腾讯优图的掌纹生成文章,从2022年的BézierPalm,到2023年的RPG-Palm,到今年2024年的PCE-Palm,该文章是将RPG-Palm中从Bézier曲线一步到位生成掌纹图片拆分成了两步进行,新增了中间一步叫做PCE图像,减小了一步到位生成掌纹图像的难度。


2、背景知识

因为该论文是基于RPG-Palm进行改进升级的,所以有必要了解一下RPG-Palm算法的训练和推理步骤,详细论文解读见博文掌纹生成网络RPG-Palm论文解读,RPG-Palm算法框架如下图所示:
在这里插入图片描述
图(a)是训练阶段,图(b)是推理阶段;
生成器G结构类似于常见的图像生成器结构UNet,为了生成多样化的结果,引入了条件自适应实例规范化模块(CAdaIN),对每个Down-Block和Up-Block生成的细节进行调制。D是判别器,而编码器E用于将掌纹图像进行编码,论文中了Resnet结构,为了保证生成的id类内一致,作者添加了ID-aware Loss。
推理阶段,可以看到,是一步到位的,即直接从Bézier图像经过生成器G生成了“伪”掌纹图像。


3、算法细节

PCE-Palm掌纹生成算法基于RPG-Palm算法将推理步骤拆分成两个阶段,中间插入了生成PCE图像( palm crease energy),下图是两者的区别:
在这里插入图片描述
可以看到,从Bézier曲线图到掌纹图像之间有着巨大差距,而RPG-Palm算法试图一步到位生成(上面的箭头),而本文的PCE-Palm算法分两步,首先从Bézier曲线图生成手掌折痕图,第二步再加入皮肤纹理(下面的箭头)。

3.1 Transfer from Bézier Palm to PCE Domain

在第一阶段,生成器GB->P将随机采样的Bézier曲线转换为PCE图像。第一阶段主要的网络就是生成器GB->P,为了模拟高斯MFRAT
滤波器(Jia,Huang,andZhang2008)的效果,作者提出了线特征增强模块( line feature enhancement block, LFEB)用于增强生成器GB->P对线路能量特性的关注能力。第一阶段及生成器GB->P以及线特征增强模块LFEB的结构如下:
在这里插入图片描述
PCEM模块用于从真实掌纹图像中提取PCE图像,它的结构如下:
在这里插入图片描述


3.2 Generate Realistic Palmprint from PCE Domain

第二阶段是利用PCE图像生成逼真的掌纹图像,其训练生成器GP->R的框图如下:
在这里插入图片描述
其中,生成器GP->R和编码器E依然和RPG-Palm一样,均是采用Unet和Resnet结构,PCEM模块同第一阶段一样,用于从掌纹图像中提取PCE图像信息。

与RPG-Palm不一样的是,对于确认生成的掌纹与真实像不像这里的损失,RPG-Palm用是的Lid损失函数加L1和判别器D的损失,Lid损失函数是计算两张图片特征的余弦相似度大小;而本论文是用的循环ID一致性损失Lcyc加L1和判别器D的损失,这个循环ID一致性损失Lcyc说白了也是L1损失,只是计算的两张图片是PCE图像,一个是由真实掌纹图而来,一个是由生成的掌纹图而来,它是基于这个假设,生成的掌纹图越像真实掌纹图,那么两者的PCE图应该也非常像。

循环ID一致性损失Lcyc公式如下:
在这里插入图片描述
生成器GP->R的损失函数以及第二阶段整个损失函数的公式如下:
在这里插入图片描述


3.3 推理阶段

推理阶段就没那么复杂了,直接利用上面两节训练好的生成器GB->P和生成器GP->R进行生成就行,首先用随机抽样的控制点生成Bézier曲线。然后,使用生成器GB→P将Bézier曲线转换到PCE域。之后,用训练好的生成器GP→R可以以PCE图像作为ID条件生成逼真的掌纹。为了生成多样化的掌纹,将随机噪声向量输入到GP→R中作为潜在的控制向量,以再现各种光线和皮肤纹理。如下面框图所示:
在这里插入图片描述
同时,作者为了最大限度地减少了生成掌纹和真实掌纹之间的差距。还根据皮肤纹理学方面的知识,设计了Bézier曲线的5个模板,生成Bézier曲线均基于这些模板,如下图所示:
在这里插入图片描述


4、实验

开放集掌纹识别对比情况如下表所示:
在这里插入图片描述

限制id数量下掌纹识别对比情况如下:
在这里插入图片描述

在开放集协议下,采用不同的生成方法进行定量识别的对比情况如下:
在这里插入图片描述

消融实验
在这里插入图片描述

线特征增强模块LFEB提升掌纹中线的特征提取能力,可视化结果如下:
在这里插入图片描述
可以看到,掌纹图像经过LFEB模块后,线特征得到了强化,有点图像锐化的效果,对于后续生成PCE图像有帮助。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/64092.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

代码随想录算法【Day2】

Day2 1.掌握滑动窗口法 2.模拟题&#xff0c;坚持循环不变量原则 209 长度最小的子数组 暴力法&#xff1a; class Solution { public:int minSubArrayLen(int target, vector<int>& nums) {//暴力法int i, j; //i代表起始点&#xff0c;j代表终止点int sum; //…

android——屏幕适配

一、屏幕适配的重要性 在 Android 开发中&#xff0c;屏幕适配是非常关键的。因为 Android 设备具有各种各样的屏幕尺寸、分辨率和像素密度。如果没有进行良好的屏幕适配&#xff0c;应用可能会出现显示不完整、元素拉伸或压缩变形、字体大小不合适等问题&#xff0c;极大地影响…

oscp学习之路,Kioptix Level2靶场通关教程

oscp学习之路&#xff0c;Kioptix Level2靶场通关教程 靶场下载&#xff1a;Kioptrix Level 2.zip 链接: https://pan.baidu.com/s/1gxVRhrzLW1oI_MhcfWPn0w?pwd1111 提取码: 1111 搭建好靶场之后输入ip a看一下攻击机的IP。 确定好本机IP后&#xff0c;使用nmap扫描网段&…

第二十六周机器学习笔记:PINN求正反解求PDE文献阅读——正问题

第二十六周周报 摘要Abstract文献阅读《Physics-informed neural networks: A deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations》1. 引言2. 问题的设置3.偏微分方程的数据驱动解3.1 连续时间模型3.1.1 …

【安全编码】Web平台如何设计防止重放攻击

我们先来做一道关于防重放的题&#xff0c;答案在文末 防止重放攻击最有效的方法是&#xff08; &#xff09;。 A.对用户密码进行加密存储使用 B.使用一次一密的加密方式 C.强制用户经常修改用户密码 D.强制用户设置复杂度高的密码 如果这道题目自己拿不准&#xff0c;或者…

中关村科金智能客服机器人如何解决客户个性化需求与标准化服务之间的矛盾?

客户服务的个性化和标准化之间的矛盾一直是一个挑战。一方面&#xff0c;企业需要提供标准化的服务以保持运营效率和成本控制&#xff1b;另一方面&#xff0c;为了提升客户满意度和忠诚度&#xff0c;企业又必须满足客户的个性化需求。为此&#xff0c;中关村科金推出了智能客…

OPPO Android面试题及参考答案 (上)

性能优化方面,讲一下图片内存占用计算,以及如何避免持有不必要的引用。 在 Android 中,计算图片内存占用主要与图片的尺寸和像素格式有关。对于一张位图(Bitmap),其内存占用大小可以通过以下方式估算:内存占用 = 图片宽度 图片高度 每个像素占用字节数。例如,常见的 …

Agent 案例分析:金融场景中的智能体-蚂蚁金服案例(10/30)

Agent 案例分析&#xff1a;金融场景中的智能体 —蚂蚁金服案例 一、引言 在当今数字化时代&#xff0c;金融行业正经历着深刻的变革。随着人工智能技术的飞速发展&#xff0c;智能体&#xff08;Agent&#xff09;在金融场景中的应用越来越广泛。蚂蚁金服作为金融科技领域的…

ElasticSearch 的工作原理

理解 ElasticSearch 的工作原理需要从索引、搜索、以及其背后的核心机制几个方面来探讨。 1. ElasticSearch 是什么&#xff1f; ElasticSearch 是一个分布式搜索和分析引擎&#xff0c;适用于各种类型的数据&#xff0c;例如文本、数值、地理位置、结构化或非结构化数据。它基…

STM32F407 | Embedded IDE01 - vscode搭建Embedded IDE开发环境(支持JLINK、STLINK、DAPLINK)

导言 Embedded IDE官网:https://em-ide.com/docs/intro 我猜肯定有部分人使用SI Keil开发STM32项目&#xff0c;也有vscode Keil开发STM32程序。SI或vscode编写代码&#xff0c;然后切换Keil编译、下载、调试程序。有一段时间&#xff0c;我也是这么干的。但是&#xff0c;程…

光谱相机的工作原理

光谱相机的工作原理主要基于不同物质对不同波长光的吸收、反射和透射特性存在差异&#xff0c;以下是其具体工作过程&#xff1a; 一、光的收集 目标物体在光源照射下&#xff0c;其表面会对光产生吸收、反射和透射等相互作用。光谱相机的光学系统&#xff08;如透镜、反射镜…

ThinkPHP接入PayPal支付

ThinkPHP 5接入PayPal 支付&#xff0c;PayPal的流程是服务器请求Paypal的接口下单&#xff08;需要传订单id/支付成功的重定向地址/支付失败的重定向地址&#xff09;&#xff0c;接会返回一个支付地址&#xff0c;项目服务器把地址返给用户&#xff0c;用户打开链接登录Paypa…

stream流的toMap

假设有这么一个类: import java.util.Arrays; import java.util.HashMap; import java.util.List; import java.util.Map; import java.util.stream.Collectors;public class Student {private int id;private String name;public Student(int id, String name) {this.id id;…

html + css 淘宝网实战

之前有小伙伴说&#xff0c;淘宝那么牛逼你会写代码&#xff0c;能帮我做一个一样的淘宝网站吗&#xff0c;好呀&#xff0c;看我接下来如何给你做一个淘宝首页。hahh,开个玩笑。。。学习而已。 在进行html css编写之前 先了解下网页的组成和网页元素的尺寸吧 1.网页的组成 …

神经网络、深度学习、卷积神经网络

好的&#xff01;我会尽量详细且易懂地为你解释这些概念&#xff0c;并在最后用简单直白的语言总结一下。 1. 神经网络思想 神经网络是灵感来自于生物大脑神经元的工作原理&#xff0c;是一种模仿人类大脑处理信息的方式来设计的数学模型。我们的大脑由亿万个神经元组成&…

设计模式01:创建型设计模式之单例、简单工厂的使用情景及其基础Demo

一、单例模式 1.情景 连接字符串管理 2.好处 代码简洁&#xff1a;可全局访问连接字符串。性能优化&#xff1a;一个程序一个连接实例&#xff0c;避免反复创建对象&#xff08;连接&#xff09;和销毁对象&#xff08;连接&#xff09;。线程安全&#xff1a;连接对象不会…

【不太正常的题】LeetCode.232:用栈的函数接口实现队列

&#x1f381;个人主页&#xff1a;我们的五年 &#x1f50d;系列专栏&#xff1a;初阶数据结构刷题 &#x1f389;欢迎大家点赞&#x1f44d;评论&#x1f4dd;收藏⭐文章 &#x1f697; 1.问题描述&#xff1a; 题目中说了只能使用两个栈实现队列&#xff0c;并且只能使用…

Linux搭建text-generation-webui框架,安装通义千问大模型,开放对外api,voxta测试对话图文教程

目录 text-generation-webui部分 开放对外API 通义千问部分 远程API对话测试部分 text-generation-webui部分 本来不想发这个文章的&#xff0c;但是自己部署的时候看了挺多人的帖子&#xff0c;很多发的不全面&#xff0c;要么就是跟着他们流程走有些小问题啥的&#xff…

QT程序发布后,mysql在其它电脑设备无法连接数据库

QT程序发布后&#xff0c;mysql在其它电脑设备无法连接数据库 D:\mysql-5.7.24-winx64\lib, mysql-5.7.24-winx64是一个压缩包&#xff0c;用于启动mysql服务&#xff0c;创建数据库 压缩包 解决方法&#xff1a; 拷贝库到exe的相同目录&#xff0c;libmysql.dll,libmysql.li…

ElasticSearch 的核心功能

要深入理解 ElasticSearch 的核心功能&#xff0c;需要全面掌握其 全文搜索、分析、聚合 和 索引生命周期管理&#xff08;ILM&#xff09; 的设计原理和实际应用。 1. 全文搜索 ElasticSearch 的全文搜索是其核心功能之一&#xff0c;依赖于倒排索引和强大的分词、相关性评分…