深度学习(2)--常见概率分布(2)

上一部分介绍了伯努利分布、二项式分布、多项式分布以及范畴分布,这里将继续介绍高斯分布、指数分布、Laplace分布、Dirac分布、经验分布及混合分布。

高斯分布

高斯分布又称为正态分布,其图形为钟形曲线(bell-shaped curve),特点是中间高、两头低。利用数学期望μ\muμ表示钟形曲线的中心位置,标准差σ\sigmaσ表示曲线的离散程度。
在这里插入图片描述
随机变量xxx服从数学期望μ\muμ、标准差σ2\sigma^2σ2的正态分布,记为x∼N(μ,σ2)x \thicksim N(\mu, \sigma^2)xN(μ,σ2),其概率密度函数为:
f(x)=12πσe−(x−μ)22σ2f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x - \mu)^2}{2\sigma^2}}f(x)=2πσ1e2σ2(xμ)2.
该密度函数具有如下性质:

  • x>0x > 0x>0时,f(x)>0f(x) > 0f(x)>0
  • y=x−μσy = \frac{x - \mu}{\sigma}y=σxμ, 则∫−∞∞f(x)dx=∫−∞∞12πσe−(x−μ)22σ2dx=∫−∞∞12πe−y22dy=1\int_{-\infty}^{\infty} f(x)dx = \int_{-\infty}^{\infty} \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x - \mu)^2}{2\sigma^2}}dx = \int_{-\infty}^{\infty} \frac{1}{\sqrt{2\pi}} e^{-\frac{y^2}{2}} dy= 1f(x)dx=2πσ1e2σ2(xμ)2dx=2π1e2y2dy=1.

指数分布

连续随机变量xxx服从参数为λ\lambdaλ的指数分布(λ>0\lambda > 0λ>0,常数),记为x∼E(λ)x \thicksim E(\lambda)xE(λ),其概率密度函数为:
f(x)={λe−λx,x>00,x≤0(1)f(x) = \left\{\begin{array}{ll}\lambda e^{-\lambda x}, &x > 0\\0, &x \le 0 \end{array}\right. \tag{1}f(x)={λeλx,0,x>0x0(1)
该密度函数具有如下性质:

  • x>0x > 0x>0时,f(x)>0f(x) > 0f(x)>0
  • ∫−∞∞f(x)dx=∫0∞f(x)dx=∫0∞λe−λxdx=−∫0∞e−λxd(−λx)=1\int_{-\infty}^{\infty} f(x)dx = \int_{0}^{\infty} f(x)dx = \int_{0}^{\infty}\lambda e^{-\lambda x}dx = -\int_{0}^{\infty} e^{-\lambda x}d(-\lambda x) = 1f(x)dx=0f(x)dx=0λeλxdx=0eλxd(λx)=1.

下图为不同λ\lambdaλ对应的概率密度函数图形:
在这里插入图片描述
指数分布在银行窗口服务、交通管理、火车票售票系统、消费市场研究等中被广泛运用。
【例题-1】假设一个煤矿矿难服从指数分布,其概率密度函数为:
f(t)=1142e−t142,t>0f(t) = \frac{1}{142} e^{-\frac{t}{142}}, t > 0f(t)=1421e142t,t>0
求分布函数。
【解答】
F(t)=∫0t1142e−x142dt=1−e−t142F(t) = \int_{0}^{t} \frac{1}{142} e^{-\frac{x}{142}} dt = 1- e^{-\frac{t}{142}}F(t)=0t1421e142xdt=1e142t.
有了指数分布函数,我们很容易得出某个时间区间内矿难发生的概率有多大,比如50~100天中发生矿难的概率是:
F(100)−F(50)=(1−e−100142)−(1−e−50142)=0.399F(100) - F(50) = (1- e^{-\frac{100}{142}}) - (1- e^{-\frac{50}{142}}) = 0.399F(100)F(50)=(1e142100)(1e14250)=0.399 .

拉普拉斯(Laplace)分布

设随机变量xxx服从参数为λ\lambdaλμ\muμ的拉普拉斯分布(λ\lambdaλμ\muμ是常数,且λ>0\lambda > 0λ>0),其概率密度函数为:
f(x)=12λe−∣x−μ∣λf(x) = \frac{1}{2\lambda} e^{-\frac{|x - \mu|}{\lambda}}f(x)=2λ1eλxμ.
该密度函数具有如下性质:

  • f(x)≥0f(x) \ge 0f(x)0
  • y=x−μλy = \frac{x - \mu}{\lambda}y=λxμ∫−∞∞f(x)dx=∫−∞∞12λe−∣x−μ∣λdx=∫−∞∞=12∫−∞∞e−∣y∣dy=∫0∞e−ydy=1\int_{-\infty}^{\infty} f(x) dx = \int_{-\infty}^{\infty} \frac{1}{2\lambda} e^{-\frac{|x - \mu|}{\lambda}} dx = \int_{-\infty}^{\infty} = \frac{1}{2} \int_{-\infty}^{\infty} e^{-|y|} dy = \int_{0}^{\infty} e^{-y} dy = 1f(x)dx=2λ1eλxμdx==21eydy=0eydy=1.

下图为μ=0\mu = 0μ=0,不同λ\lambdaλ对应的概率密度函数图形:
在这里插入图片描述

狄拉克(Dirac)分布

物理学经常需要研究一个物理量在空间或时间中分布的密度,例如质量密度、电荷密度、每单位时间传递的动量(即力)等,但是物理学中又常用到质点、点电荷、瞬时力等抽象模型,他们不是连续分布在空间或时间中,而是集中在空间中的某一点或者时间中的某一瞬时,那么它们的密度应该如何表示呢?
为了在数学上理想地表示出这种密度分布,引入了δ\deltaδ函数的概念,该函数在除了零以外的点取值都等于零,而其在整个定义域上的积分等于1。数学描述如下:
{δ(x)=0,x≠0∫−∞∞δ(x)=1(2)\left\{\begin{array}{ll}\delta(x) = 0, & x \ne 0 \\ \int_{-\infty}^{\infty} \delta(x) = 1 \end{array}\right. \tag{2}{δ(x)=0,δ(x)=1x=0(2)
严格来说δ\deltaδ函数不能算是一个函数,因为满足以上条件的函数是不存在的。数学上,人们为这类函数引入了广义函数的概念,在广义函数的理论中,δ\deltaδ函数的确切意义应该是在积分意义下来理解。在实际应用中,δ\deltaδ函数总是伴随着积分一起出现 。δ\deltaδ分布在偏微分方程、数学物理方法、傅立叶分析和概率论里都有很重要的应用。
一些函数可以认为是δ\deltaδ函数的近似,但是要注意,这些函数都是通过极限构造的,因此严格上都不是δ\deltaδ函数本身,不过在一些数学计算中可以作为δ\deltaδ函数进行计算。
δ(x)=lim⁡a→0+1aπe−x2a2\delta(x) = \lim_{a \rightarrow 0^+}\frac{1}{a\sqrt{\pi}}e^{-\frac{x^2}{a^2}}δ(x)=lima0+aπ1ea2x2
δ(x)=lim⁡a→0+1πaa2+x2\delta(x) = \lim_{a \rightarrow 0^+}\frac{1}{\pi}\frac{a}{a^2 + x^2}δ(x)=lima0+π1a2+x2a
δ(x)=lim⁡k→∞1πsin⁡(kx)x\delta(x) = \lim_{k \rightarrow \infty}\frac{1}{\pi}\frac{\sin(kx)}{x}δ(x)=limkπ1xsin(kx)
δ(x)=lim⁡k→∞12πsin⁡2(kx)/2k(x/2)2\delta(x) = \lim_{k \rightarrow \infty}\frac{1}{2\pi}\frac{\sin^2(kx)/2}{k(x/2)^2}δ(x)=limk2π1k(x/2)2sin2(kx)/2

经验分布

问题引入:假设{x1,x2,…,xn}\{\mathbf{x}_1, \mathbf{x}_2, \dots, \mathbf{x}_n\}{x1,x2,,xn}是总体X\mathbf{X}X的样本,XXX的分布函数FFF未知。如何利用{x1,x2,…,xn}\{\mathbf{x}_1, \mathbf{x}_2, \dots, \mathbf{x}_n\}{x1,x2,,xn}的信息,来推导出F(x)F(x)F(x)的形式?
方法:用经验分布函数去描述总体的分布(推断),用直方图去描述XXX的密度函数(近似)。当我们的观测值足够多,经验分布函数不断接近总体的分布函数。
【例题-1】对于X\mathbf{X}X,抽取一组大小为10的样本,得到的观察值为:{1.9,2.5,0.1,0.5,4,5.9,4.5,7.9,7.5,9.9}\{1.9, 2.5, 0.1, 0.5, 4, 5.9, 4.5, 7.9, 7.5, 9.9\}{1.9,2.5,0.1,0.5,4,5.9,4.5,7.9,7.5,9.9}
【分析】
第一步:对样本观察值进行排序并且求得极差
排序:[0.1,0.5,1.9,2.5,4,4.5,5.9,7.5,7.9,9.9][0.1,0.5,1.9,2.5,4,4.5,5.9,7.5,7.9,9.9][0.10.51.92.544.55.97.57.99.9]
极差:9.9−0.1=9.89.9-0.1=9.89.90.1=9.8 ##最大观察值-最小观察值
第二步:确定组距和组数。
区间:[b:a]=[0:10][b: a] = [0:10][b:a]=[0:10] ##区间要包含所有的观察值,左右边界值略宽于观测值的边界
组数:这个区间分成多少个组,利用如下经验公式计算得到
m≈1.87∗(b−1)0.4=1.87∗(10−1)0.4=4.5m \approx 1.87 * (b-1)^{0.4} = 1.87 * (10 - 1)^{0.4} = 4.5m1.87(b1)0.4=1.87(101)0.4=4.5
组距:将区间[0:10]分成m个小区间,每个小区间的距离叫做组距
b−am=10−04.5≈2.2\frac{b - a}{m} = \frac{10 - 0}{4.5} \approx 2.2mba=4.51002.2
为了方便,小区间被分成了:[0,2),[2,4),[4,6),[6,8),[8,10][0,2),[2,4),[4,6),[6,8),[8,10][0,2),[2,4),[4,6),[6,8),[8,10]
第三步:计算落入各个区间的样本个数(频数),并作XXX的经验分布函数
[0,2)[0,2)[0,2)—3个
[2,4)[2,4)[2,4)—1个
[4,6)[4,6)[4,6)—3个
[6,8)[6,8)[6,8)—2个
[8,10][8,10][8,10]—1个
经验分布函数为:
F(x)={0,x≤0310,0≤x<2410,2≤x<4710,4≤x<6910,6≤x<81,x≥8(3)F(x) = \left\{\begin{array}{lll}0, & x \le 0 \\ \frac{3}{10}, & 0 \le x \lt 2 \\ \frac{4}{10}, & 2 \le x \lt 4 \\ \frac{7}{10}, & 4 \le x \lt 6 \\ \frac{9}{10}, & 6 \le x \lt 8 \\ 1, & x \ge 8 \end{array}\right. \tag{3}F(x)=0,103,104,107,109,1,x00x<22x<44x<66x<8x8(3)
第四步:做直方图,获得近似的密度函数

混合分布

一个非常强大且常见的混合模型是高斯混合模型(Gaussian Mixture Model)。随机变量XXX服从混合高斯分布,则其密度函数为:
p(x∣θ)=∑i=1mεipi(x∣μi,σi2),(4)p(x|\theta) = \sum_{i = 1}^m \varepsilon_i p_i(x | \mu_i, \sigma_i^2), \tag{4}p(xθ)=i=1mεipi(xμi,σi2),(4)
其中,θ=(ε1,…,εm;μ1,…,μm;σ12,…,σm2)\theta = (\varepsilon_1, \dots, \varepsilon_m; \mu_1, \dots, \mu_m; \sigma_1^2, \dots, \sigma_m^2)θ=(ε1,,εm;μ1,,μm;σ12,,σm2), ε1+ε2+⋯+εm=1\varepsilon_1 + \varepsilon_2 + \dots + \varepsilon_m = 1ε1+ε2++εm=1, εi≥0\varepsilon_i \ge 0εi0, i=(1,2,…,m)i = (1, 2, \dots, m)i=(1,2,,m)pip_ipi, μi\mu_iμi, σi2\sigma_i^2σi2分别表示第iii个分布的密度函数、均值和方差,且pip_ipi相互独立。
在实际应用中,一个复杂的分布通常用两个或三个正态分布分量经混合便可得到较好的逼近。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/507710.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

update 千万数据_mysql学习(四)数据库

创建数据库create database 数据库名; 创建数据库的时候&#xff0c;我们应该记住以下几点&#xff1a; 1 不能与其他数据库名重复 2 名称可以由任意字母&#xff0c;阿拉伯数字&#xff0c;下划线&#xff0c;美元符&#xff0c;但是必须以字母开头 3 名称最长为64个字符&…

linux gpio按键驱动程序,Linux GPIO Key 驱动的加载

gpio-keys是基于input子系统实现的一个通用的GPIO按键驱动,基于platform来实现,位于drivers/input/keyboard/gpio_keys.c,这个文件是硬件无关的,而硬件有关的需要我们自己来注册.进入这个gpio_keys.c这个函数,第一步就是初始化.static int __init gpio_keys_init(void){return …

深度学习(3)--常用激活函数的有用性质

1 sigmoid函数 sigmoid函数是一个在生物学中常见的S型函数&#xff0c;也称为S型生长曲线。 sigmoid函数由下列公式定义: σ(x)11e−x(1)\sigma(x) \frac{1}{1 e^{-x}} \tag1σ(x)1e−x1​(1) sigmoid函数的级数表示&#xff1a; σ(x)1214x−148x31480x5−1780640x73114515…

kvm虚拟机不通网关_linux ssh 虚拟机下CentOS7开启SSH连接

一. 没开启&#xff0c;连接会报错二. 开启后&#xff0c;连接成功在虚拟机(Vmware Workstation)下&#xff0c;安装了CentOS7&#xff0c;现在想通过SSH工具连接虚拟机中的CentOS71、 首先&#xff0c;要确保CentOS7安装了 openssh-server&#xff0c;在终端中输入 yum list i…

linux netstat服务,linux netstat查看服务和端口状态

netstat可以查看linux系统中正在使用的服务和端口情况常见参数-a (all)显示所有选项&#xff0c;默认不显示LISTEN相关-t (tcp)仅显示tcp相关选项-u (udp)仅显示udp相关选项-n 拒绝显示别名&#xff0c;能显示数字的全部转化成数字。-l 仅列出有在 Listen (监听) 的服务状态-p …

memcpy函数实现_等比例缩放c++ opencv 实现

背景&#xff1a;在目标检测算法中&#xff0c; 输入图片等比例resize时mAP比直接resize会高几个点。实现&#xff1a;使用c 和opencv实现(之所以没用python&#xff0c;是因为用于生产环境)先贴代码&#xff1a;#include <math.h> #include <opencv2/core/core.hpp&g…

睡眠音频分割及识别问题(十一)--基于Android的YAMNet音频识别(总结)

WAV文件格式介绍 WAV文件遵守资源交换文件格式之规则&#xff0c;在文件的前44(或46)字节放置标头(header)&#xff0c;使播放器或编辑器能够简单掌握文件的基本信息&#xff0c;其内容以区块(chunk)为最小单位&#xff0c;每一区块长度为4字节&#xff0c;而区块之上则由子区…

黑白棋游戏水平(2)--pytorch剪裁

系统需求 Linux系统&#xff0c;并已安装git、gcc、g、cmake⼯具 下载源码 从github克隆Pytorch仓库 git clone --recursive https://github.com/pytorch/pytorch如果已经克隆过&#xff0c;则使⽤以下命令更新 git submodule sync git submodule update --init --recurs…

二维码图像去噪文献调研(1)--Real Image Denoising with Feature Attention

简介 &#xff08;1&#xff09; 论文&#xff08;包括期刊和发表时间&#xff09;&#xff1a; Real Image Denoising with Feature Attention&#xff08;ICCV 2019&#xff09; &#xff08;2&#xff09; 论文链接&#xff1a; https://arxiv.org/pdf/1904.07396.pdf &…

idea gui插件_给 IDEA 换了酷炫的主题,研发小姐姐看到:feel so high。。。

点击上方[全栈开发者社区]→右上角[...]→[设为星标⭐]IntelliJ IDEA介绍IDEA&#xff0c;全称 IntelliJ IDEA &#xff0c;是 Java 语言的集成开发环境&#xff0c; IDEA 在业界被公认为是最好的 java 开发工具之一&#xff0c;尤其在智能 代码助手、代码自动提示、重构、 J2E…

华为荣耀电脑第三方linux,【第三方Linux版】荣耀MagicBook Pro 16.1英寸全面屏如何?某东入手评测...

这款【第三方Linux版】荣耀MagicBook Pro 16.1英寸全面屏轻薄笔记本电脑(酷睿i5 8G 512G MX250 IPS)冰河银&#xff0c;看网上评测推荐的&#xff0c;后面网上种草了这款笔记本&#xff0c;用过一段日子了&#xff0c;分享使用感受如下&#xff1a;一、【第三方Linux版】荣耀Ma…

二维码提升对比度文献调研(1)--Fast Image Processing with Fully-Convolutional Networks

简介 (1) 论文 &#xff08;期刊和发表时间&#xff09; Fast Image Processing with Fully-Convolutional Networks (ICCV 会议 2017) (2) 论文链接 https://openaccess.thecvf.com/content_iccv_2017/html/Chen_Fast_Image_Processing_ICCV_2017_paper.html (3) 源代码链接 …

linux下 c语言 用write open二进制写文件,Linux下用C语言fopen、fread和fwrite函数对二进制文件的操作-Go语言中文社区...

一、前言在做一个镜头的初始化操作&#xff0c;需要加载一个648*522像素大小的文件&#xff0c;厂商提供的是一个excel表&#xff0c;如果要加载数据&#xff0c;可用加载txt文本的方式&#xff0c;我选用二进制方式加载文件&#xff1b;大家都知道电脑真正执行的不是高级语言&…

二维码提升对比度文献调研(2)--Zero-Reference Deep Curve Estimation for Low-Light Image Enhancement

简介 论文 &#xff08;期刊和发表时间&#xff09; Zero-Reference Deep Curve Estimation for Low-Light Image Enhancement (CVPR 会议 2020)论文链接 https://openaccess.thecvf.com/content_CVPR_2020/html/Guo_Zero-Reference_Deep_Curve_Estimation_for_Low-Light_Imag…

python打开是什么样子的图片_黑洞6问:黑洞内部是什么样子?黑洞图片发布,理论和实测的碰撞...

在科学领域&#xff0c;没有什么比你在第一次观察或实验结果中验证一个长期的理论预测时更令人兴奋的了。2012年&#xff0c;大型强子对撞机揭示了希格斯玻色子——标准模型中最后未发现的基本粒子的存在。 几年前&#xff0c;LIGO合作直接探测到了引力波&#xff0c;证实了对爱…

二维码提升对比度文献调研(3)--A Low-Complexity Algorithm for Contrast Enhancement of Digital Images

简介 &#xff08;1&#xff09;论文&#xff08;包括期刊和发表时间&#xff09;&#xff1a;A Low-Complexity Algorithm for Contrast Enhancement of Digital Images &#xff08;2&#xff09;论文链接&#xff1a; http://www.mecs-press.net/ijigsp/ijigsp-v10-n2/IJIG…

安卓checkbox无响应_【安卓手机】无法连接电脑的解决方法

转自&#xff1a;广西南宁平衡信息技术有限公司&#xff0c;作者&#xff1a;平衡LivY一般在对手机的数据采集过程中&#xff0c;尤其是安卓手机&#xff0c;最令人头疼的就是手机接入电脑后无法识别。相信以下窗口是大家在做手机取证的时候最不想看到的。那么这里大伙就会有疑…

linux s删除第一行,Linux文本处理三驾马车之一sed

sed对"行"操作动作含义a &#xff1a;新增&#xff0c; a 接字串&#xff0c;而这些字串会在新的一行出现(目前的下一行)&#xff5e;sed 1a\llll llllllll \n lllllll t.txtnl /etc/passwd | sed 2a drink teased -i $a# This is a test regular_express.txt ####文…

二维码提升对比度文献调研(4)--Attention Guided Low-light Image Enhancement

简介 &#xff08;1&#xff09;论文2&#xff1a; Attention Guided Low-light Image Enhancement with a Large Scale Low-light Simulation Dataset &#xff08;2&#xff09;论文链接&#xff1a; https://arxiv.org/pdf/1908.00682v3.pdf &#xff08;3&#xff09;源代…

函数传参string_C/C++的三种函数传值方式及其区别

C/C函数传参方式我想很多朋友应该都知道&#xff0c;但是不同传参方式的背后他们的区别是什么我想很多人并不那么清楚。本文就给大家揭露一下各传参方式的区别。传参方式有这三种&#xff1a;值传递、引用传递、指针传递大家可以去看三种传递方式的写法的区别&#xff0c;关于写…