图像处理之《基于语义对象轮廓自动生成的生成隐写术》论文精读

一、相关知识

在这里插入图片描述

首先我们需要了解传统隐写和生成式隐写的基本过程和区别。传统隐写需要选定一幅封面图像,然后使用某种隐写算法比如LSB、PVD、DCT等对像素进行修改将秘密嵌入到封面图像中得到含密图像,通过信道传输后再利用算法的逆过程提出秘密信息。而生成式隐写无需选择封面图像,主要使用GAN网络及GAN网络的变体,直接将秘密信息输入到生成器中生成含密图像,通过信道传输再使用提取器提取秘密信息。

可以很明显知道,传统隐写需要封面图像进行修改,很容易被隐写分析器检测到,而生成式隐写无需封面图像,在秘密信息的驱动下生成新的图像,具有较好的抗隐写能力。因此,生成式隐写已成为近年来信息隐藏领域最热门的研究课题之一。

在这里插入图片描述
在本文中,将生成式隐写分成两类:一类是单阶段方法,直接隐藏图像生成过程中的秘密信息,目前的单阶段方法主要是构造纹理、指纹等含密图像,比如第一个是2009年的《移动数据通信中的纹理合成》,第二个是构造大理石纹理含密图像,第三个是构造指纹含密图像。其主要缺点是:合成的含密图像内容不自然,视觉效果不够好,且隐藏容量低。

另外一类是两阶段方法,通常首先将给定的秘密信息编码为特征表示比如GAN的标签、潜变量等,然后通过GAN及GAN的变体将特征表示转换为相应的隐写图像。这幅框架图是我们阅读过的2022年的《基于生成对抗网络和梯度下降逼近的鲁棒无覆盖隐写术》,该文中将秘密信息映射成噪声向量,再通过WGAN-GP生成含密图像。目前的生成式隐写存在的问题主要有:信息提取准确率不高,特征域安全性低,性能差,隐藏容量低。本文主要针对前两个问题进行解决。

在这里插入图片描述

同时,本文通过了两个定义引出了刚才提出的目前生成式隐写存在的问题。

定义1主要是说明解耦特征和交织特征的定义,将一个数据空间映射到另一个特征空间中,如果变量xi满足这个公式为解耦特征,即该空间中的特征独立于其他空间中的特征变化,否则为交织特征,即指特征不易分离和解耦。该公式简单理解为在变量xj的条件下对变量xi本身概率无影响。

因为目前的大部分生成式隐写都将秘密信息映射成交织特征,在提取秘密信息时,特征不易分离,使秘密信息准确性受到影响

定义2主要是通过相对熵的概念来判断一个隐写系统是否为保持分布系统。当载体空间和隐写空间的相对熵为0时,表示该隐写系统为保持分布系统。显然,封面图像和隐写图像的分布完全相同,无法被隐写分析器检测,具有较好的安全性。

因为目前的大部分生成式隐写都是以非保持分布的形式将秘密信息映射成交织特征,且交织特征存在较低的安全性。当对隐写图像进行特征域分析,安全性较低

二、提出方法
在这里插入图片描述
本文提出的框架图如图所示,主要包括信息隐藏和信息提取两个阶段。其中信息隐藏阶段是通过CtrGAN将秘密信息编码成轮廓图像,然后通过BicycleGAN进行轮廓-图像变换生成含密图像;信息提取阶段是通过BicycleGAN的逆向过程进行图像-轮廓变换得到轮廓图像,再根据CtrGAN的逆向过程提取秘密信息。

在这里插入图片描述
本文提出了一种新的GAN模型,称为轮廓生成对抗网络即CtrGAN,所提出的CtrGAN由轮廓生成器和轮廓判别器组成。因为物体轮廓可以看作是由一系列连续的点组成的曲线,物体轮廓生成过程相当于在二维平面上选取一系列轮廓点。又因为LSTM长短期记忆网络可以根据前t−1时刻的数据计算t时刻数据的概率分布,具有强大的序列数据生成能力,所以CtrGAN的生成器采用的是LSTM。判别器使用简单的基于CNN的二分类网络,其中真实轮廓图像是通过HED算法进行提取,使用判别器对真实轮廓图像和生成轮廓图像进行判断。

在这里插入图片描述
算法1是对本文提出的CtrGAN的训练过程,其中对于生成器Gθ的训练主要使用强化学习。在公式3中,MC是一个搜索函数,由蒙特卡洛算法实现。将C1:t−1视为当前轮廓点,在剩下的T-t+1个点中进行N次搜索,并使用公式4计算这N个轮廓点的平均回报值,选择平均回报值最大的轮廓点序列作为生成轮廓点。

对于判别器Dφ的训练是使用Gθ生成的物体轮廓和D中的真实物体轮廓进行对抗性训练,公式7是Dφ的损失函数,使用梯度上升策略进行更新。

在这里插入图片描述
下面通过算法2说明秘密信息隐藏阶段中的基于CPS编码。首先通过加密安全伪随机数生成器CSPRNG生成秘密密钥序列对秘密信息M进行异或运算进行加密得到M’,再将M’等分成l位的片段,并将其转化为十进制。
对于第一个轮廓点c1,需要使用公式9进行特殊处理。我们可以通过代值观察,假设v1=6,l=3和w=h=256,则Ind1=7+8Rand(0,8191),其中Rand(x,y)表示在[x,y]范围内随机选择一个整数的函数。

当Rand(0,8191)=8191时,Ind1 = 7 + 8 * 8191 = 65535;当Rand(0,8191)=0时,Ind1=7 + 8 * 0 = 7。此处公式9主要是为了生成轮廓起始位置不过低,然后选择候选池中第Ind1个点作为c1,其中候选池pool1中由w*h个点组成。

在这里插入图片描述
对于其余轮廓点,将生成轮廓点c1~ci−1输入到CtrGAN的Gθ,使用公式11输出ci的条件概率分布,构建非零值的候选点池pooli。因为在生成轮廓时不能重复使用同一轮廓点。如果一个候选点已被占用,则设置该候选点的概率为0。再使用公式12将均匀分布vi映射到P(ci|ci,ci,…,ci−1)概率分布,其中RS()是拒绝采样函数,其主要功能是将一个变量从均匀概率分布映射到另一个概率分布。最后使用公式13选择pooli中的第Indi个点作为轮廓点vi。

在这里插入图片描述

该图是轮廓生成过程中的基于CPS编码示意图,我们通过一个例子具体理解CPS编码。

假设加密后秘密信息段110101…110…100,且分段长度l=3,则110/101/…/110/…/100,对应十进制为v1=6,v2=5,…,vi=6,…,vn=4。又假设通过公式9,计算v1的Ind1=7+597=600,即选取第600个点作为轮廓点。又假设通过公式12,计算vi的Indi=200,即选取第200个点作为轮廓点。

我们可以得出一个结论:假设总共生成含有n个轮廓点的轮廓线,分段长度为l,则在轮廓线生成过程中的隐藏总量为l*n位。另外感觉这个图有个地方画错了,对于第一个轮廓点v1并没有使用拒绝采样函数进行处理

在这里插入图片描述
秘密信息隐藏的第二个阶段是轮廓-图像变换,主要是通过BicycleGAN完成,它有两部分组成:cVAE-GAN即条件变分自编码器GAN 和cLR-GAN即条件隐回归GAN。其中条件变分自编码器GAN的损失有三部分组成:LKL(E)为生成的潜在编码和高斯分布的KL散度损失、LGANVAE(G,D,E)为cVAE-GAN的对抗损失和LVAE(G,E)为生成图像与真实图像的重建损失L1;条件隐回归GAN的损失有两部分组成:Llatent(G,E)为提取的潜在编码和高斯分布的L1损失和LGAN(G,D)为cLR-GAN的对抗损失。公式14是BicycleGAN的最终损失函数,两个对抗损失无超参数,而其余三个损失对应三个超参数λ、λlatent和λKL,将在实验部分确定其具体值。

BicycleGAN在2017年的论文《走向多模态图像到图像的翻译》被提出,本文只是重新训练和使用。同时生成器和判别器分别采用原文的中设置分别为U-Net和PatchGAN。另外感觉这个图有个地方画错了,对于cVAE-GAN部分,图中只给出两个损失LKL(E)和LVAE(G,E),还应该包括一个对抗损失LGANVAE(G,D,E),在2017年原文画出,但此处并没有标注

在这里插入图片描述
于秘密信息提取阶段,我们首先需要通过BicycleGAN的逆过程从隐写图像中恢复出轮廓图像,再通过算法3从恢复的轮廓图像中进行秘密解码。对于第一个轮廓点v1使用公式15计算,其余轮廓点使用公式16计算。将所有秘密段的十进制值转换为二进制位,并将所有二进制位连接起来,得到秘密比特流M’。最后,用Key对M’进行解密,恢复原来的秘密比特流M。算法3的伪码缺少十进制转二进制的操作

三、实验结果

在这里插入图片描述
本文采用的数据集有三个:(1)T-Zap50K(鞋子图像);(2)从亚马逊下载的产品集(手提包图像);(3)通过谷歌搜索下载的动物集(10,000张动物图像),都是不常见的数据集,同时并将图像处理成256*256大小。
对于前文提及的参数设置分别是BicycleGAN损失函数的三个超参数和秘密段长度l,本文通过消融实验进行说明。首先看超参数λ(LVAE(G,E)为生成图像与真实图像的重建损失L1),从该图的(a)可以看出当λ=10时,信息提取准确率开始稳定不变,从该图的(b)可以看出当λ=8时,生成图像的EMD开始微小波动,为了在信息提取的准确性和生成的隐写图像质量之间取得良好的平衡,设置λ = 10。

在这里插入图片描述
接下来,我们继续看λlatent和λKL。从(a)和(b)的纵轴观察可知,λlatent和λKL对信息提取的准确性和生成的隐写图像质量的影响比较小,小于超参数λ,因为这两个超参数都是针对衡量潜在编码和高斯分布之间的差异。同理由图可知,将超参数λlatent和λKL设置为1和0.01,所提方法达到最优。

最后观察秘密段长度l,l表示每个轮廓点选择过程中隐藏的比特数,随着l的增大,信息容量会显著增加,但信息提取的准确性和生成图像的质量会下降。所以本文测试l取2,4,6,8时的条件下各种指标的结果,均表现较好,EAR都在98%以上,EMD都在0.02左右。

在这里插入图片描述
我们从有效载荷的角度看一下本文所提方法的隐藏容量,分别计算l去2,4,6,8时的条件下的有效载荷,前面已经说明图像大小为256*256。由计算结果可知,当l=2时,有效载荷为0.0078125bpp;当l=4时,有效载荷为0.03125bpp。将该结果与2022年论文《基于生成对抗网络和梯度下降逼近的鲁棒无覆盖隐写术》对比可知,是比不过红色框的有效载荷结果,原因可能是他们设置的图像大小比较小,大部分为64 * 64,更有16 * 16

在这里插入图片描述
该表将本文方法与传统基于嵌入隐写方法和生成式隐写方法在信息提取精度进行比较。虽然在2*256位条件下,ISN的信息提取精度略高于本文提出的方法,但总体上高于其他方法。因为在基于嵌入的隐写方法中,秘密信息以有损方式编码和嵌入;生成式隐写方法将秘密信息编码为潜在噪声向量或抽象结构向量等交织特征,提取时难以分离。这些对比的方法有很多都是我们阅读过的论文,比如Deep-Stego、HiNet、ISN、IDEAS。

在这里插入图片描述
该表表示不同隐藏有效载荷的不同隐写方法对SRM和XuNet隐写分析器的反隐写分析能力,所使用的指标PE,当PE = 0.5时,抗隐写能力性能最佳。本文所提出方法的PE值最接近0.5。这表明在不同的隐藏载荷下,该方法对隐写分析器具有最高的抗检测能力。

同时可以发现,基于嵌入的隐写算法的抗隐写能力低于生成隐写术算法。主要原因是基于嵌入的隐写方法不可避免地留下修改痕迹,这将导致它们很容易被隐写分析器检测到

在这里插入图片描述
该表表示不同方法在特征域上的抗检测性,由表可知在高容量下,这些方法在特征域很容易被隐写分析器检测到,因为目前的生成隐写术直接以非保持分布的方式将秘密信息编码为特征,而我们的方法是以保持分布的方式实现秘密信息。

图像域和特征域抗隐写分析的区别:1)图像域直接对图像进行分析,而特征域将图像映射到另一个空间再分析该空间的特征;2)图像域中隐写算法对分析算法影响大,而特征域对所有隐写算法具有通用性

在这里插入图片描述
该表表示不同隐藏载荷下不同方法生成的隐写图像的FID值。其中FID越小,生成的隐写图像质量越高,与其他生成隐写术方法相比,所提出的方法通常具有较小的FID值。

下图是生成图像的展示,很难直接区分没有信息隐藏的生成图像和有信息隐藏的生成图像,涉及到前面提到的鞋子和手提袋数据集,但没有展示动物数据集

在这里插入图片描述
该表表示在不同类型的图像攻击下比如强度变化、对比度增强、椒盐噪声、高斯噪声、JPEG压缩和图像消毒,不同方法的信息提取精度。从表中可以看出,在这些图像攻击下,该方法的信息提取精度远高于SWE和ISWE。但个人存在一个问题:没有使用常见的图像攻击如右图所示,比如平移、旋转、裁剪等

四、总结

在这里插入图片描述

论文地址:Generative Steganography via Auto-Generation of Semantic Object Contours

中文参考论文地址:基于轮廓自动生成的构造式图像隐写方法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/86607.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

React中的受控组件(controlled component)和非受控组件(uncontrolled component)

聚沙成塔每天进步一点点 ⭐ 专栏简介⭐ 组件⭐ 写在最后 ⭐ 专栏简介 前端入门之旅:探索Web开发的奇妙世界 欢迎来到前端入门之旅!感兴趣的可以订阅本专栏哦!这个专栏是为那些对Web开发感兴趣、刚刚踏入前端领域的朋友们量身打造的。无论你是…

【jmeter】jmeter引用变量,变量值传递失败

最近在用jmeter做接口测试的时候,发现有个变量,参数值一直没有传递进来,导致request的时候,请求体里面一直是${}变量的形式。 后来经过排查发现,是因为我在定义用户变量的时候,在这个now后面多加了一个空格…

ps[001] 初学创建剪切蒙版

前置条件:PS2020版本 技能应用:ps 海报标题和图片结合 1、画布1300*1300像素,altdel设置背景为前景色 2、准备一张绿色的海报,可以百度宫崎骏,找张绿色的图片就可以了 3、拉个文字款,写个SUMMER英文体&a…

《开发实战》17 | 异步处理好用,但非常容易用错

大多数业务项目都是由同步处理、异步处理和定时任务处理三种模式相辅相成实现的。区别于同步处理,异步处理无需同步等待流程处理完毕,因此适用场景主要包括: 服务于主流程的分支流程。比如,在注册流程中,把数据写入数…

SpringAOP入门案例

package com.elf.spring.aop.aspectj; /*** author 45* version 1.0*/ public interface UsbInterface {public void work(); }package com.elf.spring.aop.aspectj; import org.springframework.stereotype.Component; /*** author 45* version 1.0*/ Component //把Phone对象…

什么是WhatsApp群发,WhatsApp协议,WhatsApp云控

那么WhatsApp群控云控可以做什么呢? 1、获客 自动化引流,强大的可控性,产品快速拓客 2、导流 一键式傻瓜化自动加好友,群发,朋友圈营销 3、群控 一键式拉群好友,建群,进群 …

力扣236 补9.14

做不来,我做中等题基本上都是没有思路,这里需要先遍历祖先节点,那必然用先序遍历,这题还是官方题解容易理解,第二火的题解反而把我弄得脑袋昏昏的。 class Solution { TreeNode ans; public TreeNode lowestCommonAnce…

公众号迁移多久可以完成?

公众号账号迁移的作用是什么?只能变更主体吗?长期以来,由于部分公众号在注册时,主体不准确的历史原因,或者公众号主体发生合并、分立或业务调整等现实状况,在公众号登记主体不能对应实际运营人的情况下&…

Django之视图

一)文件与文件夹 当我们设定好一个Djiango项目时,里面会有着view.py等文件,也就是文件的方式: 那么我们在后续增加app等时,view.py等文件会显得较为臃肿,当然也根据个人习惯,这时我们可以使用…

2023-9-23 最大不相交区间数量

题目链接&#xff1a;最大不相交区间数量 #include <iostream> #include <algorithm>using namespace std;const int N 100010;int n;struct Range {int l, r;bool operator< (const Range &W) const {return r < W.r;} }range[N];int main() {cin >…

IDEA最新激 20活23码

人狠话不多 大家好&#xff0c;最近Intelli Idea官方的校验规则进行了更新&#xff0c;之前已经成功激20活23的Idea可能突然无法使用了。 特地从网上整理了最新、最稳定的激20活23码分享给大家&#xff0c;希望可以帮助那些苦苦为寻找Idea激20活23码而劳累的朋友们。 本激23…

前端框架之争:Vue.js vs. React.js vs. Angular

文章目录 Vue.js - 渐进式框架的魅力简单易用组件化开发生态系统和工具适用场景 React.js - 高性能的虚拟DOM虚拟DOM单向数据流社区和生态系统适用场景 Angular - 一站式框架完整的框架双向数据绑定类型安全适用场景 如何选择&#xff1f;项目规模生态系统技能和经验性能需求 结…

MyBatis基础之SqlSession

SqlSession 线程安全问题 当你翻看 SqlSession 的源码时&#xff0c;你会发现它只是一个接口。我们通过 MyBatis 操作数据库&#xff0c;实际上就是通过 SqlSession 获取一个 JDBC 链接&#xff0c;然后操作数据库。 SqlSession 接口有 3 个实现类&#xff1a; #实现类1Defa…

【Java 基础篇】Java函数式接口详解

Java是一门强类型、面向对象的编程语言&#xff0c;但在Java 8引入了函数式编程的概念&#xff0c;这为我们提供了更多灵活的编程方式。函数式接口是函数式编程的核心概念之一&#xff0c;本文将详细介绍Java函数式接口的概念、用法以及一些实际应用。 什么是函数式接口&#…

第一个Servlet程序

目录 一、Servlet是什么 二、第一个Servlet项目 2.1 创建Maven项目 2.2 引入Servlet依赖 2.3 创建目录 三、Servlet启动 3.1 编写代码 3.2 打包程序 3.3 部署程序 四、更便捷的部署方式 4.1 安装Smart Tomcat插件 一、Servlet是什么 Servlet 是一种实现动态页面的技术。是一组…

LeetCode 75-02:字符串的最大公因子

前置知识&#xff1a;使用欧几里得算法求出最大公约数 func gcdOfStrings(str1 string, str2 string) string {if str1str2 ! str2str1 {return ""}return str1[:gcd(len(str1), len(str2))] }func gcd(a, b int)int{if b 0{return a}return gcd(b, a%b) }

【C语言精髓 之 指针】指针*、取地址、解引用*、引用

/*** file * author jUicE_g2R(qq:3406291309)————彬(bin-必应)* 一个某双流一大学通信与信息专业大二在读 * copyright 2023.9* COPYRIGHT 原创技术笔记&#xff1a;转载需获得博主本人同意&#xff0c;且需标明转载源* language …

【postgresql 】 ERROR: “name“ is not supported as an alias

org.postgresql.util.PSQLException: ERROR: "name" is not supported as an alias 错误&#xff1a;不支持将“name”作为别名 SELECT real_name name FROM doc_user 加上 在关键词上加上 “” 示例&#xff1a; SELECT real_name "name" FROM do…

“Vue进阶:深入理解插值、指令、过滤器、计算属性和监听器“

目录 引言&#xff1a;Vue的插值Vue的指令Vue的过滤器Vue的计算属性和监听器vue购物车案例总结&#xff1a; 引言&#xff1a; Vue.js是一款流行的JavaScript框架&#xff0c;它提供了许多强大的功能来简化前端开发。在本篇博客中&#xff0c;我们将深入探讨Vue的一些高级特性…

Java项目:SSM的网上书城系统

作者主页&#xff1a;Java毕设网 简介&#xff1a;Java领域优质创作者、Java项目、学习资料、技术互助 文末获取源码 一、相关文档 1、关于雅博书城在线系统的基本要求 &#xff08;1&#xff09;功能要求&#xff1a;可以管理个人中心、用户管理、图书分类管理、图书信息管理、…