Pinsker’s inequality 与 Kullback-Leibler (KL) divergence / KL散度

文章目录

  • Pinsker’s inequality
  • Kullback-Leibler (KL) divergence
    • KL散度在matlab中的计算
  • KL散度在隐蔽通信概率推导中的应用

Pinsker’s inequality

Pinsker’s Inequality是信息论中的一个不等式,通常用于量化两个概率分布之间的差异。这个不等式是由苏联数学家Mark Pinsker于1964年提出的。

考虑两个概率分布 (P) 和 (Q) 在同一样本空间上的概率密度函数,Pinsker’s Inequality可以表示为:

[ D KL ( P ∥ Q ) ≥ 1 2 ( ∫ ( p ( x ) − q ( x ) ) 2 d x ) 2 D_{\text{KL}}(P \parallel Q) \geq \frac{1}{2} \left(\int \left(\sqrt{p(x)} - \sqrt{q(x)}\right)^2 \, dx\right)^2 DKL(PQ)21((p(x) q(x) )2dx)2 ]

其中:

  • ( D KL ( P ∥ Q ) D_{\text{KL}}(P \parallel Q) DKL(PQ)) 是P和Q之间的 K u l l b a c k − L e i b l e r Kullback-Leibler KullbackLeibler散度,表示两个概率分布之间的差异。
  • ( p ( x ) p(x) p(x)) 和 ( q ( x ) q(x) q(x)) 分别是P和Q在样本点 ( x x x) 处的概率密度函数。

Pinsker’s Inequality表明,KL散度的平方根下界是两个概率分布在L2范数(平方积分的平方根)上的差异。这个不等式在信息论和统计学中有广泛的应用,用于量化概率分布之间的距离。

Kullback-Leibler (KL) divergence

KL散度(Kullback-Leibler散度),也称为相对熵,是一种用于衡量两个概率分布之间差异的指标。给定两个概率分布 ( P P P) 和 ( Q Q Q),KL散度的定义如下:

[ D KL ( P ∥ Q ) = ∫ P ( x ) log ⁡ ( P ( x ) Q ( x ) ) d x D_{\text{KL}}(P \parallel Q) = \int P(x) \log\left(\frac{P(x)}{Q(x)}\right) \,dx DKL(PQ)=P(x)log(Q(x)P(x))dx ]

这个积分表示在样本空间上对 (P) 的每个事件的概率进行加权,权重是 ( P P P) 对应事件的概率,然后乘以 ( P P P) 和 ( Q Q Q) 概率比的自然对数。

KL散度有一些重要的性质:

  1. 非负性:( D KL ( P ∥ Q ) ≥ 0 D_{\text{KL}}(P \parallel Q) \geq 0 DKL(PQ)0),等号成立当且仅当 ( P P P) 和 ( Q Q Q) 在所有点上都相等。
  2. 不对称性:一般情况下,( D KL ( P ∥ Q ) ≠ D KL ( Q ∥ P ) D_{\text{KL}}(P \parallel Q) \neq D_{\text{KL}}(Q \parallel P) DKL(PQ)=DKL(QP))。它衡量了从 ( Q Q Q) 到 ( P P P) 的信息损失,和从 ( P P P) 到 ( Q Q Q) 的信息损失是不同的。
  3. 不满足三角不等式:( D KL ( P ∥ R ) ≰ D KL ( P ∥ Q ) + D KL ( Q ∥ R ) D_{\text{KL}}(P \parallel R) \nleq D_{\text{KL}}(P \parallel Q) + D_{\text{KL}}(Q \parallel R) DKL(PR)DKL(PQ)+DKL(QR))。这意味着KL散度不满足三角不等式,因此不能被解释为标准的距离度量。

KL散度的应用广泛,包括在信息论、统计学、机器学习等领域,例如在变分推断、最大似然估计和生成模型中。

KL散度在matlab中的计算

KL(Kullback-Leibler)散度是衡量两个概率分布之间差异的一种方法。在Matlab中,你可以使用kldiv函数来计算两个概率分布的KL散度。这个函数通常包含在Statistics and Machine Learning Toolbox中,因此你需要确保你的Matlab版本中包含了这个工具箱。

以下是一个简单的示例,演示如何使用kldiv函数计算两个离散概率分布之间的KL散度:

% 定义两个离散概率分布
P = [0.3, 0.4, 0.3]; % 第一个分布
Q = [0.5, 0.2, 0.3]; % 第二个分布% 计算KL散度
kl_divergence = kldiv(P, Q);% 显示结果
disp(['KL散度:', num2str(kl_divergence)]);

请确保你的Matlab环境中已经安装了Statistics and Machine Learning Toolbox,以便使用kldiv函数。如果没有安装,你可以通过MathWorks官方网站获取该工具箱或者使用其他方法计算KL散度,例如手动实现KL散度的计算公式。

KL散度在隐蔽通信概率推导中的应用

Robust Beamfocusing for FDA-Aided Near-Field
Covert Communications With Uncertain Location
2023 IEEE ICC

Let ( D w , θ w ) \left(D_{\mathrm{w}}, \theta_{\mathrm{w}}\right) (Dw,θw) denote the location of Willie. We assume Willie is synchronized with Alice with the full knowledge of the carrier frequencies, and the channel vector h H ( D w , θ w ) \mathbf{h}^{H}\left(D_{\mathrm{w}}, \theta_{\mathrm{w}}\right) hH(Dw,θw) . This is the worst case for legitimate nodes to analyze the lower bound of covert communications performance. The hypothesis test at Willie is given by

{ H 0 : y w ( n ) = z w ( n ) , H 1 : y w ( n ) = h w H w s ( n ) + z w ( n ) , \left\{\begin{array}{l} \mathcal{H}_{0}: y_{\mathrm{w}}^{(n)}=z_{\mathrm{w}}^{(n)}, \\ \mathcal{H}_{1}: y_{\mathrm{w}}^{(n)}=\mathbf{h}_{\mathrm{w}}^{H} \mathbf{w} s^{(n)}+z_{\mathrm{w}}^{(n)}, \end{array}\right. {H0:yw(n)=zw(n),H1:yw(n)=hwHws(n)+zw(n),

where h w H \mathbf{h}_{\mathrm{w}}^{H} hwH is short for h H ( D w , θ w ) \mathbf{h}^{H}\left(D_{\mathrm{w}}, \theta_{\mathrm{w}}\right) hH(Dw,θw) , and z w ( n ) ∼ C N ( 0 , σ w 2 ) z_{\mathrm{w}}^{(n)} \sim \mathcal{C N}\left(0, \sigma_{\mathrm{w}}^{2}\right) zw(n)CN(0,σw2) is the AWGN at Willie with noise power σ w 2 \sigma_{\mathrm{w}}^{2} σw2 . From (5), the probability distribution functions (PDFs) of y w = [ y w ( 1 ) , y w ( 2 ) , … , y w ( N ) ] T \mathbf{y}_{\mathrm{w}}= \left[y_{\mathrm{w}}^{(1)}, y_{\mathrm{w}}^{(2)}, \ldots, y_{\mathrm{w}}^{(N)}\right]^{T} yw=[yw(1),yw(2),,yw(N)]T under H 0 \mathcal{H}_{0} H0 and H 1 \mathcal{H}_{1} H1 can be derived as

P 0 ≜ P ( y w ∣ H 0 ) = 1 π N σ w 2 N e − y w H y w σ w 2 (6) \mathbb{P}_{0} \triangleq \mathbb{P}\left(\mathbf{y}_{\mathrm{w}} \mid \mathcal{H}_{0}\right)=\frac{1}{\pi^{N} \sigma_{\mathrm{w}}^{2 N}} e^{-\frac{\mathbf{y}_{\mathrm{w}}^{H} \mathbf{y}_{\mathrm{w}}}{\sigma_{\mathrm{w}}^{2}}} \tag{6} P0P(ywH0)=πNσw2N1eσw2ywHyw(6)

and:

P 1 ≜ P ( y w ∣ H 1 ) = 1 π N ( ∣ h w H w ∣ 2 + σ w 2 ) N e − y w H y w ∣ h w H ∣ 2 + σ w 2 (7) \mathbb{P}_{1} \triangleq \mathbb{P}\left(\mathbf{y}_{\mathrm{w}} \mid \mathcal{H}_{1}\right)=\frac{1}{\pi^{N}\left(\left|\mathbf{h}_{\mathrm{w}}^{H} \mathbf{w}\right|^{2}+\sigma_{\mathrm{w}}^{2}\right)^{N}} e^{-\frac{\mathbf{y}_{\mathrm{w}}^{H} \mathbf{y}_{\mathrm{w}}}{\left|\mathbf{h}_{\mathrm{w}}^{H}\right|^{2}+\sigma_{\mathrm{w}}^{2}}} \tag{7} P1P(ywH1)=πN(hwHw2+σw2)N1ehwH2+σw2ywHyw(7)

respectively. Let D 0 \mathcal{D}_{0} D0 and D 1 \mathcal{D}_{1} D1 denote the decisions in favor of H 0 \mathcal{H}_{0} H0 and H 1 \mathcal{H}_{1} H1 , respectively. The false alarm and missed detection probabilities are defined as P F A ≜ P ( D 1 ∣ H 0 ) \mathbb{P}_{F A} \triangleq \mathbb{P}\left(\mathcal{D}_{1} \mid \mathcal{H}_{0}\right) PFAP(D1H0) and P M D ≜ P ( D 0 ∣ H 1 ) \mathbb{P}_{M D} \triangleq \mathbb{P}\left(\mathcal{D}_{0} \mid \mathcal{H}_{1}\right) PMDP(D0H1) , respectively. The detection performance of Willie is characterized by the sum of the detection error probabilities ξ = P F A + P M D \xi=\mathbb{P}_{F A}+\mathbb{P}_{M D} ξ=PFA+PMD . Under the optimal detection, ξ \xi ξ is minimized, which is denoted by ξ ∗ \xi^{*} ξ . Then the covertness constraint of the system is expressed as ξ ∗ ≜ P F A + P M D ≥ 1 − ϵ \xi^{*} \triangleq \mathbb{P}_{F A}+\mathbb{P}_{M D} \geq 1-\epsilon ξPFA+PMD1ϵ , where
ϵ ∈ [ 0 , 1 ] \epsilon \in[0,1] ϵ[0,1] is an arbitrarily small positive constant indicating the level of covertness. Smaller \epsilon corresponds to stricter covertness requirement. Specially, when ϵ = 0 \epsilon=0 ϵ=0 , we have ξ ∗ = 1 \xi^{*}=1 ξ=1 , which renders Willie’s detection to a blind guess. Moreover, according to Pinsker’s inequality [14], [15], we have ξ ∗ ≥ 1 − D ( P 1 ∥ P 0 ) 2 \xi^{*} \geq 1-\sqrt{\frac{\mathcal{D}\left(\mathbb{P}_{1} \| \mathbb{P}_{0}\right)}{2}} ξ12D(P1P0) , where D ( P 1 ∥ P 0 ) = ∫ y P 1 log ⁡ P 1 P 0 d y \mathcal{D}\left(\mathbb{P}_{1} \| \mathbb{P}_{0}\right)=\int_{\mathbf{y}} \mathbb{P}_{1} \log \frac{\mathbb{P}_{1}}{\mathbb{P}_{0}} \mathrm{~d} \mathbf{y} D(P1P0)=yP1logP0P1 dy is the Kullback-Leibler (KL) divergence of P 1 \mathbb{P}_{1} P1 and P 0 \mathbb{P}_{0} P0 . It can be easily verified that the original covertness constraint is satisfied as long as D ( P 1 ∥ P 0 ) ≤ 2 ϵ 2 \mathcal{D}\left(\mathbb{P}_{1} \| \mathbb{P}_{0}\right) \leq 2 \epsilon^{2} D(P1P0)2ϵ2 . Furthermore, by substituting (6) and (7) into the expression of D ( P 1 ∥ P 0 ) \mathcal{D}\left(\mathbb{P}_{1} \| \mathbb{P}_{0}\right) D(P1P0) , we have D ( P 1 ∥ P 0 ) = N ζ ( ∣ h w H w ∣ 2 σ w 2 ) \mathcal{D}\left(\mathbb{P}_{1} \| \mathbb{P}_{0}\right)=N \zeta\left(\frac{\left|\mathbf{h}_{\mathrm{w}}^{H} \mathbf{w}\right|^{2}}{\sigma_{\mathrm{w}}^{2}}\right) D(P1P0)=(σw2hwHw2) , where ζ ( x ) = x − log ⁡ ( 1 + x ) \zeta(x)=x-\log (1+x) ζ(x)=xlog(1+x) for x ≥ 0 x \geq 0 x0 is a monotonically increasing function w.r.t. x x x . Then the original covertness constraint can be simplified by

∣ h w H w ∣ 2 σ w 2 ≤ ζ − 1 ( 2 ϵ 2 N ) (8) \frac{\left|\mathbf{h}_{\mathrm{w}}^{H} \mathbf{w}\right|^{2}}{\sigma_{\mathrm{w}}^{2}} \leq \zeta^{-1}\left(\frac{2 \epsilon^{2}}{N}\right) \tag{8} σw2 hwHw 2ζ1(N2ϵ2)(8)

where  ζ − 1 ( x ) is the inverse function of  ζ ( x ) .  \text { where } \zeta^{-1}(x) \text { is the inverse function of } \zeta(x) \text {. }  where ζ1(x) is the inverse function of ζ(x)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/614387.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

批量查询顺丰快递信息:固乔快递查询助手的实用指南

随着电商和物流行业的飞速发展,对于物流信息的查询需求也日益增长。固乔快递查询助手是一款高效、便捷的软件,能够帮助用户批量查询顺丰快递信息,大大提高了物流信息的管理和查询效率。 一、下载安装 首先,用户需要从固乔科技网站…

【C】extern 关键字

目录 extern1)基本概念2)用法1:声明全局变量3)用法2:声明函数4)用法3:在头文件中使用 extern extern 1)基本概念 extern 是C语言的一个关键字。 extern 用于声明在其他源文件中定…

统计学-R语言-2.1

文章目录 前言安装过程总结 前言 上篇文章介绍了统计学-R语言的介绍,本篇文章介绍如何安装R软件。 安装过程 可以登录官网,https://www.r-project.org/,点击此处跳转。 点进去下滑找到China,之后找任意一个链接地址进行下载即可。 我点的是…

【Harmony OS - 消息通知】

应用可以通过接口发送通知消息,提醒用户关注应用中的变化。用户可以在通知栏查看和操作通知内容,通常用于当应用处于后台时,发送,本文主要来介绍在Harmony OS中的三种消息通知。 基础通知 总体流程有三步: 导入noti…

确定了!软考中级「集成」、「监理」新版教程有哪些变化?

新版教程改了哪些内容?2024上半年软考应该如何备考? 准备考24年上集成的朋友们,先不要慌!备考脚步不要乱,改版可能还是好事呢,难度可能会降点? 2024年教程改版科目: ✔软考中级-集…

ARM汇编指令

数据和指令类型 ARM采用的是32位架构 ARM约定: Byte:8 bits Halfword:16 bits (2 byte) Word:32 bits (4 byte) Doubleword:64-bits(8byte) (Cortex-A处理器) 大部分ARM core …

优化改进YOLOv5算法之Deformable Attention,效果秒杀CBAM和CA等

目录 1 Deformable Attention模块原理 2 YOLOv5中加入Deformable Attention模块 2.1 common.py文件配置 2.2 yolo.py配置

由于找不到msvcp140.dll无法继续执行代码原因及解决教程分享

在计算机打开软件过程,我们经常会遇到一些错误提示,其中之一就是“由于找不到msvcp140.dll无法继续执行代码”。这个错误通常发生在使用Microsoft Visual C 2015或更高版本编译的程序运行时。那么,什么是msvcp140.dll文件?为什么会…

59.螺旋矩阵II

class Solution { public:vector<vector<int>> generateMatrix(int n) {//二维数组初始化 // int dis[4][4]{{-1,0},{1,0},{0,-1},{0,1}};int dis[4][4]{{0,1},{1,0},{0,-1},{-1,0}};//右下左上 0,1,2,3//cout<< dis[0][0]<<" "<<dis…

定制耐酸碱移液吸头PFA移液枪头可重复使用

移液枪是移液器的一种&#xff0c;常用于实验室少量或微量液体的移取&#xff0c;规格不同&#xff0c;不同规格的移液枪配套使用不同大小的枪头&#xff0c;不同生产厂家生产的形状也略有不同&#xff0c;但工作原理及操作方法基本一致。移液枪属精密仪器&#xff0c;使用及存…

C++函数(3)

纯粹素数 题目描述&#xff1a;纯粹素数是这样定义的&#xff1a;一个素数&#xff0c;去掉最高位&#xff0c;剩下的数仍为素数&#xff0c;再去掉剩下的数的最高位&#xff0c;余下的数还是素数。这样下去一直到最后剩下的个位数也还是素数。求出所有小于3000的四位的纯粹素…

电脑可以连接网络但浏览器无法访问部分或全部网页

啾咪&#xff01;离大谱了&#xff0c;电脑一段时间没有用&#xff0c;最近打开却发现可以连接网络但是无法访问部分网页&#xff08;如CSDN&#xff09;&#xff0c;显示如下&#xff1a; 有三种解决方法&#xff1a; &#xff08;1&#xff09;清除DNS缓存 步骤&#xff1a;…

离散数学3

补变元 解释&#xff1a;它是以反^作为一组一组的&#xff0c;因此&#xff0c;对于P反^Q来说&#xff0c;P是一组&#xff0c;Q是一组&#xff0c;又有以下&#xff1a;对缺少变元的项要补齐&#xff0c;P缺少Q&#xff0c;Q缺少P。因此&#xff0c;补齐。 用分配律展开 解释&…

useEffect监听多个变量

useEffect监听了多个变量怎么办&#xff1f; 前言 如何监听多个变量&#xff1f;在React开发中经常会遇到的问题。随着应用复杂性的增加&#xff0c;组件中可能涉及多个状态的变化&#xff0c;根据这种变化可以做相应的业务&#xff0c;这时候监听就变得很有必要了。 常见的…

C#,入门教程(15)——类(class)的基础知识

上一篇&#xff1a; C#&#xff0c;入门教程(14)——字符串与其他数据类型的转换https://blog.csdn.net/beijinghorn/article/details/124004562 物以类聚&#xff0c;凡物必类。 类的使用&#xff0c;须遵循几个简单的原则&#xff1a; &#xff08;1&#xff09;能类则类&a…

系统学习Python——警告信息的控制模块warnings:测试警告

分类目录&#xff1a;《系统学习Python》总目录 要测试由代码引发的警告&#xff0c;我们可以采用catch_warnings上下文管理器。有了它&#xff0c;就可以临时改变警告过滤器以方便测试。例如&#xff0c;以下代码可捕获所有的警告以便查看&#xff1a; import warningsdef fx…

使用 Ant Design Pro 的图表(展示cpu、内存、硬盘)

文章目录 使用 Ant Design Pro 的图表&#xff08;展示cpu、内存、硬盘&#xff09;一、Ant Design Charts 图表二、快速上手三、ant design chart 图表类型StatisticCard 指标卡结合 Ant Design Charts 图表库丰富数值内容&#xff0c;满足大多数数值展示的场景什么是水波图&a…

鸿蒙原生应用再添新丁!万达 入局鸿蒙

鸿蒙原生应用再添新丁&#xff01;万达 入局鸿蒙 来自 HarmonyOS 微博1月11日消息&#xff0c;#万达酒店及度假村启动鸿蒙原生应用及元服务开发# 作为具有中国特色的国牌服务酒店标杆之一&#xff0c;万达酒店及度假村Wanda 将带来全新的服务和交互方式&#xff0c;一步获取“…

网络之路28:二层链路聚合

正文共&#xff1a;1666 字 14 图&#xff0c;预估阅读时间&#xff1a;2 分钟 目录 网络之路第一章&#xff1a;Windows系统中的网络 0、序言 1、Windows系统中的网络1.1、桌面中的网卡1.2、命令行中的网卡1.3、路由表1.4、家用路由器 网络之路第二章&#xff1a;认识企业设备…