深度学习(2)--常见概率分布(1)

许多简单的概率分布在机器学习的众多领域中都非常有用,这个内容将分为两个部分来说明,第一个部分介绍伯努利分布、二项式分布、多项式分布及范畴分布,第二个部分介绍高斯分布、指数分布、Laplace分布、Dirac分布、经验分布及混合分布。

伯努利(Bernoulli)分布

伯努利分布是一种离散分布,有两种可能的结果:

  • 1表示成功,出现的概率为ppp(其中0<p<10 \lt p \lt 10<p<1)。
  • 0表示失败,出现的概率为q=1−pq=1-pq=1p

这种分布在机器学习中很有用,比如正面或反面,成功或失败,有缺陷或没有缺陷,病人康复或未康复。
可以用数学描述为:随机变量xxx只取0和1两个值,其概率为:

  • P(x=1)=pP(x = 1) = pP(x=1)=p, P(x=0)=1−p=qP(x = 0) = 1 - p = qP(x=0)=1p=q

数学期望和方差计算如下:

  • E(x)=1∗p+0∗q=pE(x) = 1 * p + 0 * q = pE(x)=1p+0q=p
  • E(x2)=12∗p+02∗q=pE(x^2) = 1^2 * p + 0^2 * q = pE(x2)=12p+02q=p
  • D(x)=E(x2)−[E(x)]2=p−p2=p(1−p)=pqD(x) = E(x^2) - [E(x)]^2 = p - p^2 = p(1-p) = pqD(x)=E(x2)[E(x)]2=pp2=p(1p)=pq

二项式(Binomial)分布

nnn次独立重复的伯努利试验中,设每次试验成功的概率为ppp。用xxx表示nnn重伯努利试验中成功的次数,则xxx取值为{0,1,…,n}\{0, 1, \dots, n\}{0,1,,n}中的一个。
对每一个k(0≤k≤n)k(0 \le k \le n)k(0kn),事件{x=k}\{x=k\}{x=k}表示“nnn次试验成功恰好发生kkk次”,随机变量xxx的离散概率分布即为二项分布(Binomial Distribution)。
典型例子为:扔硬币,硬币正面朝上概率为ppp, 重复扔nnn次硬币,kkk次为正面的概率即为一个二项分布概率。
用概率表示如下:

  • P(x=k)=n!k!(n−k)!pk(1−p)n−kP(x = k) = \frac{n!}{k!(n-k)!}p^k(1-p)^{n-k}P(x=k)=k!(nk)!n!pk(1p)nk

下图为不同参数下的二项式分布的图形:
在这里插入图片描述

多项式(Multinomial)分布

多项式分布是二项式分布的推广。将二项式分布推广至多种状态,就得到了多项式分布。举例说明如下:

  • 二项式分布:扔硬币,硬币正面朝上概率为ppp, 重复扔nnn次硬币,kkk次为正面的概率。
  • 多项式分布:扔骰子,不同于扔硬币,骰子有6个面对应6个不同的点数,这样单次每个点数朝上的概率都是16\frac{1}{6}61(对应p1p_1p1~p6p_6p6,它们的值不一定都是16\frac{1}{6}61,只要和为1且互斥即可,比如一个形状不规则的骰子),重复扔nnn次,如果问有kkk次都是点数6朝上的概率。

更一般化的描述如下:投掷nnn次骰子,这个骰子共有6种结果输出,1点出现概率为p1p_1p1,2点出现概率p2p_2p2…\dots;多项式分布给出了在nnn次试验中,骰子1点出现k1k_1k1次,2点出现k2k_2k2次,3点出现k3k_3k3次,…,6点出现k6k_6k6次。这个结果组合的概率为:
f(k1,k2,…,k6;n,p1,p2,…,p6)f(k_1, k_2, \dots, k_6;n, p_1, p_2, \dots, p_6)f(k1,k2,,k6;n,p1,p2,,p6)
=P(x1=k1,x2=k2,…,x6=k6)= P(x_1= k_1, x_2= k_2, \dots, x_6= k_6)=P(x1=k1,x2=k2,,x6=k6)
=n!k1!k2!…k6!p1k1p2k2…p6k6= \frac{n!}{k_1!k_2! \dots k_6!}p_1^{k_1}p_2^{k_2} \dots p_6^{k_6}=k1!k2!k6!n!p1k1p2k2p6k6,
约束条件为∑i=16ki=n\sum_{i=1}^{6} k_i = ni=16ki=n.
为了更加简化,用Γ\GammaΓ函数来表示:
f(k1,k2,…,k6;n,p1,p2,…,p6)f(k_1, k_2, \dots, k_6;n, p_1, p_2, \dots, p_6)f(k1,k2,,k6;n,p1,p2,,p6)
=Γ(∑i=16ki+1)∏i=16Γ(ki+1)∏i=16piki=\frac{\Gamma(\sum_{i=1}^{6}k_i + 1)}{\prod_{i = 1}^{6}\Gamma(k_i + 1)}\prod_{i = 1}^{6}p_i^{k_i}=i=16Γ(ki+1)Γ(i=16ki+1)i=16piki.
【例题-1】同时投掷5枚骰子,投掷出2个一点,2个二点,1个三点的概率是多大?
【解答】
x1x_1x1x6x_6x6表示6个点的出现次数之和为n=5n = 5n=5,利用多项式分布组合概率公式有:
P(x1=2,x2=2,x3=1,x4=0,x5=0,x6=0)P(x_1= 2, x_2= 2, x_3 = 1, x_4 = 0, x_5 = 0, x_6= 0)P(x1=2,x2=2,x3=1,x4=0,x5=0,x6=0)
=5!2!2!1!0!0!0!(16)2(16)2(16)1(16)0(16)0(16)0=\frac{5!}{2!2!1!0!0!0!}(\frac{1}{6})^{2}(\frac{1}{6})^{2}(\frac{1}{6})^{1}(\frac{1}{6})^{0}(\frac{1}{6})^{0}(\frac{1}{6})^{0}=2!2!1!0!0!0!5!(61)2(61)2(61)1(61)0(61)0(61)0
=51296=\frac{5}{1296}=12965
【例题-2】同时投掷5枚骰子,出现两对点数一样的概率是多少?
【解答】
在【例题-1】的基础之上,需要考虑x1x_1x1~x6x_6x6,其中2个取2,1个取1有多少种?

x1x_1x1x2x_2x2x3x_3x3x4x_4x4x5x_5x5x6x_6x6
221000
202100
…\dots…\dots…\dots…\dots…\dots…\dots

先从6个里面选择2个取2,再从4个里面选出1个取1,总共有C62C41=60C_6^2C_4^1 = 60C62C41=60种。
出现两对点数一样的概率为5∗601296\frac{5 * 60}{1296}1296560 = 25108\frac{25}{108}10825

范畴(Categorical)分布

范畴分布又称为Multinoulli分布、类别分布,它是多项式分布的一个特例。
抛一次骰子,第xkx_kxk面朝上的概率,这是Categorical分布。

小结:几种分布的关系

  • 将一个小球放入两个桶,令变量 xxx 为第一个桶里面有的小球个数,那么只有 0 个或者 1 个,服从伯努利分布;
  • nnn个小球放入两个桶,令变量 xxx 为第一个桶里面的小球个数,那么最少可能有 0 个,最多可能有 nnn个,服从二项分布;
  • 将一个小球放入 kkk个桶,令变量 x={x1,x2,…,xk}x = \{x_1, x_2, \dots, x_k\}x={x1,x2,,xk}kkk个桶内的小球个数,xxx是一个One-hot形式的向量,因为这个小球只能在一个桶里面,服从Categorical分布;
  • nnn个小球放入 kkk个桶,令变量 x={x1,x2,…,xk}x = \{x_1, x_2, \dots, x_k\}x={x1,x2,,xk}kkk个桶内的小球个数,xxx是一个向量,元素和为 nnn,服从多项分布。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/507713.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

gdb 调试_GDB调试指南-源码查看

前言我们在调试过程中难免要对照源码进行查看&#xff0c;如果已经开始了调试&#xff0c;而查看源码或者编辑源码却要另外打开一个窗口&#xff0c;那未免显得太麻烦。文本将会介绍如何在GDB调试模式下查看源码或对源码进行编辑。 准备工作为了说明后面的内容&#xff0c;我们…

深度学习(2)--常见概率分布(2)

上一部分介绍了伯努利分布、二项式分布、多项式分布以及范畴分布&#xff0c;这里将继续介绍高斯分布、指数分布、Laplace分布、Dirac分布、经验分布及混合分布。 高斯分布 高斯分布又称为正态分布&#xff0c;其图形为钟形曲线(bell-shaped curve)&#xff0c;特点是中间高、…

update 千万数据_mysql学习(四)数据库

创建数据库create database 数据库名; 创建数据库的时候&#xff0c;我们应该记住以下几点&#xff1a; 1 不能与其他数据库名重复 2 名称可以由任意字母&#xff0c;阿拉伯数字&#xff0c;下划线&#xff0c;美元符&#xff0c;但是必须以字母开头 3 名称最长为64个字符&…

linux gpio按键驱动程序,Linux GPIO Key 驱动的加载

gpio-keys是基于input子系统实现的一个通用的GPIO按键驱动,基于platform来实现,位于drivers/input/keyboard/gpio_keys.c,这个文件是硬件无关的,而硬件有关的需要我们自己来注册.进入这个gpio_keys.c这个函数,第一步就是初始化.static int __init gpio_keys_init(void){return …

深度学习(3)--常用激活函数的有用性质

1 sigmoid函数 sigmoid函数是一个在生物学中常见的S型函数&#xff0c;也称为S型生长曲线。 sigmoid函数由下列公式定义: σ(x)11e−x(1)\sigma(x) \frac{1}{1 e^{-x}} \tag1σ(x)1e−x1​(1) sigmoid函数的级数表示&#xff1a; σ(x)1214x−148x31480x5−1780640x73114515…

kvm虚拟机不通网关_linux ssh 虚拟机下CentOS7开启SSH连接

一. 没开启&#xff0c;连接会报错二. 开启后&#xff0c;连接成功在虚拟机(Vmware Workstation)下&#xff0c;安装了CentOS7&#xff0c;现在想通过SSH工具连接虚拟机中的CentOS71、 首先&#xff0c;要确保CentOS7安装了 openssh-server&#xff0c;在终端中输入 yum list i…

linux netstat服务,linux netstat查看服务和端口状态

netstat可以查看linux系统中正在使用的服务和端口情况常见参数-a (all)显示所有选项&#xff0c;默认不显示LISTEN相关-t (tcp)仅显示tcp相关选项-u (udp)仅显示udp相关选项-n 拒绝显示别名&#xff0c;能显示数字的全部转化成数字。-l 仅列出有在 Listen (监听) 的服务状态-p …

memcpy函数实现_等比例缩放c++ opencv 实现

背景&#xff1a;在目标检测算法中&#xff0c; 输入图片等比例resize时mAP比直接resize会高几个点。实现&#xff1a;使用c 和opencv实现(之所以没用python&#xff0c;是因为用于生产环境)先贴代码&#xff1a;#include <math.h> #include <opencv2/core/core.hpp&g…

睡眠音频分割及识别问题(十一)--基于Android的YAMNet音频识别(总结)

WAV文件格式介绍 WAV文件遵守资源交换文件格式之规则&#xff0c;在文件的前44(或46)字节放置标头(header)&#xff0c;使播放器或编辑器能够简单掌握文件的基本信息&#xff0c;其内容以区块(chunk)为最小单位&#xff0c;每一区块长度为4字节&#xff0c;而区块之上则由子区…

黑白棋游戏水平(2)--pytorch剪裁

系统需求 Linux系统&#xff0c;并已安装git、gcc、g、cmake⼯具 下载源码 从github克隆Pytorch仓库 git clone --recursive https://github.com/pytorch/pytorch如果已经克隆过&#xff0c;则使⽤以下命令更新 git submodule sync git submodule update --init --recurs…

二维码图像去噪文献调研(1)--Real Image Denoising with Feature Attention

简介 &#xff08;1&#xff09; 论文&#xff08;包括期刊和发表时间&#xff09;&#xff1a; Real Image Denoising with Feature Attention&#xff08;ICCV 2019&#xff09; &#xff08;2&#xff09; 论文链接&#xff1a; https://arxiv.org/pdf/1904.07396.pdf &…

idea gui插件_给 IDEA 换了酷炫的主题,研发小姐姐看到:feel so high。。。

点击上方[全栈开发者社区]→右上角[...]→[设为星标⭐]IntelliJ IDEA介绍IDEA&#xff0c;全称 IntelliJ IDEA &#xff0c;是 Java 语言的集成开发环境&#xff0c; IDEA 在业界被公认为是最好的 java 开发工具之一&#xff0c;尤其在智能 代码助手、代码自动提示、重构、 J2E…

华为荣耀电脑第三方linux,【第三方Linux版】荣耀MagicBook Pro 16.1英寸全面屏如何?某东入手评测...

这款【第三方Linux版】荣耀MagicBook Pro 16.1英寸全面屏轻薄笔记本电脑(酷睿i5 8G 512G MX250 IPS)冰河银&#xff0c;看网上评测推荐的&#xff0c;后面网上种草了这款笔记本&#xff0c;用过一段日子了&#xff0c;分享使用感受如下&#xff1a;一、【第三方Linux版】荣耀Ma…

二维码提升对比度文献调研(1)--Fast Image Processing with Fully-Convolutional Networks

简介 (1) 论文 &#xff08;期刊和发表时间&#xff09; Fast Image Processing with Fully-Convolutional Networks (ICCV 会议 2017) (2) 论文链接 https://openaccess.thecvf.com/content_iccv_2017/html/Chen_Fast_Image_Processing_ICCV_2017_paper.html (3) 源代码链接 …

linux下 c语言 用write open二进制写文件,Linux下用C语言fopen、fread和fwrite函数对二进制文件的操作-Go语言中文社区...

一、前言在做一个镜头的初始化操作&#xff0c;需要加载一个648*522像素大小的文件&#xff0c;厂商提供的是一个excel表&#xff0c;如果要加载数据&#xff0c;可用加载txt文本的方式&#xff0c;我选用二进制方式加载文件&#xff1b;大家都知道电脑真正执行的不是高级语言&…

二维码提升对比度文献调研(2)--Zero-Reference Deep Curve Estimation for Low-Light Image Enhancement

简介 论文 &#xff08;期刊和发表时间&#xff09; Zero-Reference Deep Curve Estimation for Low-Light Image Enhancement (CVPR 会议 2020)论文链接 https://openaccess.thecvf.com/content_CVPR_2020/html/Guo_Zero-Reference_Deep_Curve_Estimation_for_Low-Light_Imag…

python打开是什么样子的图片_黑洞6问:黑洞内部是什么样子?黑洞图片发布,理论和实测的碰撞...

在科学领域&#xff0c;没有什么比你在第一次观察或实验结果中验证一个长期的理论预测时更令人兴奋的了。2012年&#xff0c;大型强子对撞机揭示了希格斯玻色子——标准模型中最后未发现的基本粒子的存在。 几年前&#xff0c;LIGO合作直接探测到了引力波&#xff0c;证实了对爱…

二维码提升对比度文献调研(3)--A Low-Complexity Algorithm for Contrast Enhancement of Digital Images

简介 &#xff08;1&#xff09;论文&#xff08;包括期刊和发表时间&#xff09;&#xff1a;A Low-Complexity Algorithm for Contrast Enhancement of Digital Images &#xff08;2&#xff09;论文链接&#xff1a; http://www.mecs-press.net/ijigsp/ijigsp-v10-n2/IJIG…

安卓checkbox无响应_【安卓手机】无法连接电脑的解决方法

转自&#xff1a;广西南宁平衡信息技术有限公司&#xff0c;作者&#xff1a;平衡LivY一般在对手机的数据采集过程中&#xff0c;尤其是安卓手机&#xff0c;最令人头疼的就是手机接入电脑后无法识别。相信以下窗口是大家在做手机取证的时候最不想看到的。那么这里大伙就会有疑…

linux s删除第一行,Linux文本处理三驾马车之一sed

sed对"行"操作动作含义a &#xff1a;新增&#xff0c; a 接字串&#xff0c;而这些字串会在新的一行出现(目前的下一行)&#xff5e;sed 1a\llll llllllll \n lllllll t.txtnl /etc/passwd | sed 2a drink teased -i $a# This is a test regular_express.txt ####文…