浅谈贝叶斯统计

来源:京师统计团总支学生会

编辑: ∑Gemini

浅谈贝叶斯统计

贝叶斯统计是英国学者托马斯·贝叶斯在《论有关机遇问题的求解》中提出一种归纳推理的理论,后被一些统计学者发展为一种系统的统计推断方法,称为贝叶斯方法。本文旨在通过实际的简单例子使大家对贝叶斯统计方法有更直观的认识并对其理念有更深刻的理解。

案例一

通过贝叶斯推理来辨别“买东西的人”和“随便逛逛的人”

商店里的售货员最关心的问题莫过于“这位顾客究竟是来买东西的,还是随便逛逛而已”。所以对于店员来说,通过顾客的行为来揣测他们的真实想法,是一项重要的本领。下文将具体介绍“将店员的判断方法数值化”的方法,该方法恰巧适用贝叶斯统计学。进而言之,通过该事例,我们也可以弄懂贝叶斯统计学的概念。

第一步:

通过经验设定“先验概率”

假设一个场景:面前有一位顾客,此时你需要做的是,推测该顾客究竟是“来买东西的人”,还是“随便逛逛的人”。只有做出正确的判断,才能采取正确的接待方法。

推算的第一步:将两种顾客(来买东西的顾客、随便逛逛的顾客)的比例进行数值分配。这句话的意思是:假设面前的这位顾客一定属于两种中的一种,以此为前提,该顾客为第一种或第二种的可能性分别为多少?将这个可能性用数值表示出来。

在贝叶斯统计学中,这种“某种类别的概率(比例)”有一个专有名词,叫作“先验概率”。“事前”的含义是:在获得某项信息之前。

此处的“信息”是指附加的状况,比如顾客忽然过来询问。通过“过来询问”这一信息,可以对顾客类别的推算进行修改,而“先验概率”是指,在“过来询问”或“不过来询问”的情况发生之前进行的概率判断。

根据自己的经验,每5位顾客中就有1位是“来买东西的”,也就是说,这一部分顾客占全体的20%(0.2),那么剩下“随便逛逛”部分的比例便为80%(0.8)。这两个数字,便是两类顾客的“先验概率”。

在这个事例中,在观察面前顾客的行为之前,判断“该顾客是属于概率0.2的买东西的人,还是概率0.8的随便逛逛的人”,这个过程被称为“某一类别的先验分布”,如图1所示。

图表中的大长方形被分割为两部分,两部分的面积所占比例分别为0.2和0.8,这正是分割时的诀窍。本文将在后面逐渐阐明:“面积”的概念在贝叶斯概率的计算中,起着重要的作用。

该图可以理解为:将整体分为两种不同的情况。这意味着,自己所处的环境为A或B中的一个,A情况下的顾客为“来买东西的人”,B情况下的顾客为“随便逛逛的人”,但不知道究竟是A还是B。只是先在头脑中构筑一个大致的印象。哲学上将这种见解称为“可能世界”,在进行逻辑推算或概率推算时,采用这种“划分互不相同的可能性”的思维方法,有利于整理思路。

在这里将长方形的面积设定为0.1和0.4,两部分的比例依然为1∶4,这与设定为0.2和0.8时的比例相同。那么,为何要将面积设置为0.2和0.8呢?这是因为,用数值来计算概率的情况下,需要在多种可能性中,选取“将各部分概率相加,总和为1”的那一种,这种情况被称为“标准化条件”。

第二步:

设置发生“向店员询问”事件的条件概率

在这一步,我们要做的是:为“来买东西的人”和“随便逛逛的人”这两类顾客分别设定“向店员询问”的概率。如果没有相关经验和数据作为支撑,这项工作是无法完成的。上一节讲到,即使没有相关经验,也可以设定先验概率。但此处的“各个分类的行动概率”,必须是基于一定的经验、实证、实验的数值。

图表中的数值,是为了计算简便而设定的,并非真实数据。

从图表中可以看出,“来买东西的”顾客向店员询问的概率是0.9,而“随便逛逛的”顾客向店员询问的概率只有0.3。

需要注意的是:图表从横向来看,0.9+0.1=1,0.3+0.7=1,两行都满足标准化条件;而纵向来看,0.9+0.3≠1,也就是说并不满足标准化条件。具体分析一下:横向的一行,表示某一类别的顾客可能采取的两种行动。比如第一行数字,表示“来买东西的人”向店员“询问”或“不询问”这两种行为,顾客有可能询问,也有可能不询问,最终采取的行动一定是其中之一,没有第三种可能性。而纵向来看,第一列数字表示,“来买东西的人”向店员询问的概率为0.9,“随便逛逛的人”向店员询问的概率为0.3,两个数字相加之和并不等于1。这是因为,对象范围包含了两个不同类别的顾客,并且也没有涵盖所有的行动。

图表中的数字,表示“某一特定类别采取各种行动的概率”,这在统计学中被称为“条件概率”。用“原因”的概念来解释,即“在原因明确的情况下,某一类别采取各项行动的结果概率”。

将两个类别的顾客,进一步按照“询问”和“不询问”的条件来分类,那么前文所述的两个大类别又可以细分为四个小类别,分别是:“来买东西的人询问店员”“随便逛逛的人询问店员”“来买东西的人不询问店员”“随便逛逛的人不询问店员”,如图表所示。

一共存在四种可能性:来买东西的人询问店员(左上区域)、来买东西的人不询问店员(左下区域)、随便逛逛的人询问店员(右上区域)、随便逛逛的人不询问店员(右下区域)。0各个区域所表示的概率与每个长方形的面积相等。长方形的面积可以用乘法求得,如图表所示。

第三步:

通过观察到的行为,排除“不可能的情况”

下面,让我们进一步进行推测。

作为一名店员,现在你面临的情况是:顾客上前来打招呼。这也意味着,你观察到了顾客的某一种行为。这为“可能世界”又增添了一条信息。

这条信息的内容是:“不询问店员”的可能性消失了。上一节中提到,在顾客类别包括“来买东西的人”和“随便逛逛的人”两类,顾客的行为包括“询问”和“不询问”两类的情况下,“可能世界”共分为4种。在现实世界中,因为已经观察到了“询问”这一行为,因此“不询问”这一行为覆盖的世界就不复存在了。这意味着,“可能世界”受到了限制。下面我们借助图形来理解这一问题。

因为“可能世界”变成了2个,从而我们可以推测获得新的数值。

在一部分可能性不复存在,而一部分可能性又在现实中受到了限制的情况下,会发生些什么呢?这正是所谓的——在推测中“概率发生变化”。

第四步:

寻求“来买东西的人”的“贝叶斯逆概率”

上一步,由于观察到“询问”这一行动,使得“可能世界”被限定在两个以内。也就是说,面前的顾客所属的世界,要么是“来买东西的人询问店员”,要么是“随便逛逛的人询问店员”,只有这两种可能性。显示其可能性的数值(概率),如图表所示。

图表 “不询问”的可能性消失。

根据观察到的行为,可能性被限定为两种,此时,所有情况的概率(长方形面积)之和已经不为1。因此,要保持比例关系,恢复标准化条件,从而使概率发生变化。

图表表示恢复标准化条件,计算后验概率

从上表中我们可以看出,上前询问的顾客为购买者的概率,可以推定为3/7。这个概率,被称为“贝叶斯逆概率”或“后验概率”。

在此,对“逆概率”一词中的“逆”的含义,进行简要说明。所谓的“逆”是指:用与之前相反的方法,来解析表示几个互不相同的“世界”的图形。截至上一节的观点是:顾客共分两种类别,每一种类别都会随机做出“询问”或“不询问”的行为,这一观点的前提是对图表进行纵向观察。这正是从“类别”这一原因,得到“行动”这一结果的处理方法。但是,现在让我们来横向观察图表。也就是说,“上前询问”的顾客可分为“来买东西的人”和“随便逛逛的人”两种类别,从中随机选择一种。从“询问”这一行动的结果追溯到“类别”这一原因。【结果→原因】这一过程,就是“逆概率”这一概念中“逆”的含义。

贝叶斯推理过程的总结

用图表对于之前提到的后验概率的计算方法进行总结,如图表所示。

那么,通过求后验概率,我们能够了解到什么呢?其实,只要抽出图表的开头、中间和结尾部分,并填入数值,结果就很明确了。

看这个图表便可了解到,在没有观察到任何行为时,面前的顾客是“来买东西的人”的概率为0.2(先验概率),但观察到“上前询问”这一行为之后,数值便更新为约0.43(后验概率)。也就是说,虽然并不能断定这位顾客就是“来买东西的人”,但这一结果的可能性提高到了以前的两倍,这便是“贝叶斯更新”。

案例二

推测送巧克力的女同事的心意

本文之前所阐述的贝叶斯推理的顺序为:

先验概率 → 条件概率 → 通过观察获取信息 → 后验概率

前例在设定最初的先验概率时,是以客观数据作为参考的。然而,贝叶斯推理的魅力正在于:即使没有事前的客观数据,也能进行推算。也就是说,可以主观设定先验概率,进行推算。这可以更进一步解释为:学会这个方法,才能更深刻地理解“贝叶斯推理的思想”,全面了解它的神奇之处。

下面,进行如下问题设定:

假设你是一名男性,有这样一位特殊的女同事,你很在意她是否对自己有好感。情人节那天,你收到了她送的巧克力。那么,你将如何推算“她喜欢自己”这一事件的概率呢?

此处的设问——“认为你是真命天子的概率”中的“概率”这一概念,让人越想越不明白。因此,本次的问题设定与通常情况下的统计、概率常识是有所不同的。不过,贝叶斯推理可以帮助我们解决这样的问题。这也正是贝叶斯推理的优势所在。本讲通过解释这一类问题,帮助您理解贝叶斯推理带有主观性的一个侧面。

第一步:

主观上设定你是否是“真命天子”的“先验概率”

按上节所述,这一事例的特殊性在于,通过客观统计数据无法获得先验概率。先验概率的概念在第一例中曾涉及,是指:事前能够判断的各个类别的相应概率。在这个案例中,有两种类别:一种是“把你视为最喜欢的人”,另一种是“没有把你列入考虑范围之内”。以下,简称为“真命天子”和“无关路人”。

此例中,并没有选取大量的统计学现象来处理,而是对某个特定的女同事的心情进行推测。因此,没有数据可用于先验概率的判断。

在这种情况下,一般会采用“理由不充分原理”的方法。通过这一原理我们可以进行如下思考:因为没有证据证明女同事把你视为“真命天子”,然而也没有证据认为她把你视为“无关路人”,因此暂且把这两种情况的概率视为相等。即把两种情况的先验概率分别设为0.5和0.5,如图表所示。

那么,你究竟属于这两个类中的哪一个呢?总之,答案在她的心中,你无法断定,只能推测罢了。既然统计方法无法使用,也没有证据证明哪一种更有优势,因此,两种情况的可能性理应对等划分,各为0.5。当然,也可以划分为其他比例,这个问题将在本例的最后进行说明。

第二步:

设法找到数据,设定“条件概率”

下一步是针对能够观察到的行动,设定不同类别的条件概率,而这需要在一定程度上的客观概率。也就是说,必须要获得统计性的数据,才能进行下一步工作。

对于统计结果进行分析的结果显示,存在如下关系:

整理得如下表格3-3:

第三步:

收到巧克力,排除掉“不可能的情况”

如今,你幸运地收到了来自心仪女同事的巧克力。在现实世界中,因为已经发生了她给你“送巧克力”的行为,“不送”的可能性就被排除在外,恢复标准化条件。从结果来看,如果你收到了女同事的巧克力,那么,你成为她的“真命天子”的事后准确率便为2/3,约等于66%。

在本文中,上述过程称为“贝叶斯推理”。贝叶斯推理可以总结为:通过观察行动(信息),将先验概率通过贝叶斯更新,转换为后验概率。对不同事件进行的推算称为“贝叶斯推理”,而将这些事件中的推算方法整合起来,便是“贝叶斯统计学”。

在本文的最后,对于“概率”的定义进行简要说明。

我们在初中、高中阶段学习的概率,是一个客观的概念。也就是说,对于“某现象的概率是多少”的问题来说,答案是唯一的,无论是谁回答,都会给出一个唯一、客观的数值。在“掷骰子出现1的概率为六分之一”的情况下,概率表示的是:丢出这个骰子后,出现的结果为1的可能性的程度。这个答案对于所有人来说,都是相同的。

然而,本文中提到的“概率”,并非上述的客观性概率。“女同事认为你是她真命天子的概率”这一情况下的“概率”,并不能像上述掷骰子事件的概率那样进行解释。这是因为:骰子可以丢很多次,但这位女同事是独一无二的。她认为你是真命天子还是无关路人,并不是从现在才开始发生的概率性事件,而是早已有了结论,只是你不知道罢了。

因此,“女性同事认为你是她的真命天子的概率”中的“概率”,应当解释为:你内心描绘的类似“信念程度”这样的概念。也就是说,并非“概率是多少”的问题,而应该理解为“你认为概率是多少”。

像这样,可以解释为“人的内心描绘的数值”的概率称为“主观概率”。也许很多人会认为主观概率是不可信的,但在统计学和经济学中,“主观概率”始终占有一席之地。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/484620.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

浅析虚拟语气 (Subjunctive mood)

浅析虚拟语气 (Subjunctive mood) 本文旨在通过一种时序逻辑上的联系,帮助读者更好的记忆和运用虚拟语气。文中提及的概念不一定正确,但一定程度上能辅助记忆,最终达到熟练运用的目的。(有些语法不用刨根问底,都是约定…

数论重大突破:120年后,希尔伯特的第12个数学难题借助计算机获得解决

来源:机器之心编辑:nhyilin德国数学家大卫 希尔伯特(David Hilbert)是二十世纪最伟大的数学家之一,被后人称为「数学世界的亚历山大」。他对数学领域做出了广泛和重大的贡献,研究领域涉及代数不变式、代数…

Linux进程通信的四种方式——共享内存、信号量、无名管道、消息队列|实验、代码、分析、总结

Linux进程通信的四种方式——共享内存、信号量、无名管道、消息队列|实验、代码、分析、总结 每个进程各自有不同的用户地址空间,任何一个进程的全局变量在另一个进程中都看不到,所以进程之间要交换数据必须通过内核,在内核中开辟…

美国人测评马斯克的星链服务: 现实太骨感,梦想已破灭

来源: 风闻社区、3D实验室最近看到外国人测评马斯克的starlink服务,满篇吐槽,无数缺陷,而且都是原理上无法克服的那种缺陷,跟大家分享一下。首先星链服务不是你想像的那种一卡在手,天下我有的服务。用它之前…

编译过程中的链接地址对最终编译镜像文件的影响

MDK和交叉编译工具编译时都会指定程序的下载的地址(其实就是告诉程序它将在那个地址上开始执行),这有什么意义吗? 其实这么设计有原因的,因为这里涉及到全局变量和全局函数指针的地址问题,加入当你在编译时…

三维空间中曲线绕任意轴旋转所得的旋转曲面求法

三维空间中曲线绕任意轴旋转所得的旋转曲面求法 对2023汤家凤考研高等数学讲义225页2.三维空间直线旋转曲面的解释和推广 ©️ sylvanding

彩图完美解释:麦克斯韦方程组

来源:微波射频网麦克斯韦方程组麦克斯韦方程组(英语:Maxwells equations)是英国物理学家麦克斯韦在19世纪建立的描述电磁场的基本方程组。它含有四个方程,不仅分别描述了电场和磁场的行为,描述了它们之间的…

基于阿里云服务网格流量泳道的全链路流量管理(二):宽松模式流量泳道

作者:尹航 在前文基于阿里云服务网格流量泳道的全链路流量管理(一):严格模式流量泳道中,我们介绍了使用服务网格 ASM 的严格模式流量泳道进行全链路灰度管理的使用场景。该模式对于应用程序无任何要求,只需…

中国世界工厂地位为什么不会动摇

来源:工信头条文:赵一之在贸易保护主义和疫情的双重影响下,中国作为世界工厂是否会面临大规模制造业外迁,是时常引起关注的问题。复杂产品的供应链彼此环环相扣,缺失任何一环,都会影响到整个行业。疫情指出…

一文彻底解决YOLOv5训练找不到标签问题

YOLOv5 训练找不到标签, No labels found in /path/train.cache 问题的解决方法(亲测可用) ❤️ 网上绝大部分教程所述解决方法都不靠谱,也没有分析问题发生的原因,本文彻底解决了YOLOv5训练时找不到标签,出现 No labels found in /path/trai…

yolov5踩坑记录:标签错位(PIL读取图片方向异常)

PIL踩坑记录:读取图片方向异常(yolov5标签错位) 奇怪的现象 今天用 YOLOv5 做项目时,对数据集的标记出现了奇怪的现象,在下述测试用例中可明显看到,标记框偏离了物体,故发文阐述原因和解决方法…

理解与理论:人工智能基础问题的悲观与乐观

来源:筑土为坛梅剑华,男,1980年生,湖北秭归人,山西大学哲学社会学院教授,博士生导师,先后赴美国罗格斯大学、匹兹堡大学、奥地利萨尔茨堡大学等访学,研究方向是语言哲学与心灵哲学、…

设计模式系列 - 原型模式

所谓原型模式是指为创建重复对象提供一种新的可能。 介绍 当面对系统资源紧缺的情况下,如果我们在重新创建一个新的完全一样的对象从某种意义上来讲是资源的浪费,因为在新对象的创建过程中,是会有系统资源的消耗,而为了尽可能的节…

图像二值化(Image Binarization):平均值法、双峰法、大津算法(OTSU)

图像二值化(Image Binarization):平均值法、双峰法、大津算法(OTSU) 编程实现图像的二值化,分析不同的阈值对二值化图像的影响。 问题描述 传统的机器视觉通常包括两个步骤:预处理和物体检测…

全球最快AI超级计算机开动,每秒4百亿亿浮点运算!正拼接最大宇宙3D地图

来源:venturebeat宇宙是在不断膨胀的吗?是的!而令宇宙不断膨胀的「罪魁祸首」就是暗能量。作为是宇宙中最神秘的物质,它看不见摸不着,为了捕捉它,人类在地球上建立了许多相关实验,但都成效甚微。…

基于YOLOv5的中式快餐店菜品识别系统

基于YOLOv5的中式快餐店菜品识别系统[金鹰物联智慧食堂项目] 摘要 本文基于YOLOv5v6.1提出了一套适用于中式快餐店的菜品识别自助支付系统,综述了食品识别领域的发展现状,简要介绍了YOLOv5模型的历史背景、发展优势和网络结构。在数据集预处理过程中&am…

谋局科技创新:两院院士大会释放重要信号

来源:经济参考报作者:班娟娟、钟源从坚持把科技自立自强作为国家发展的战略支撑,到加快建设科技强国,实现高水平科技自立自强;从加强原创性、引领性科技攻关,坚决打赢关键核心技术攻坚战,到强化…

图像加减运算

图像的加减运算 原创文章:转载请注明出处 ©️ Sylvan Ding 图像相加 图像相加常常被用来进行图片降噪处理。令 g(x,y)g(x,y)g(x,y) 是无噪声理想图像 f(x,y)f(x,y)f(x,y) 被高斯加性噪声 η(x,y)\eta (x,y)η(x,y) 污染后的图像,即 g(x,y)f(x,y)η…

随机森林是我最喜欢的模型

来源:机器之心TensorFlow 决策森林 (TF-DF) 现已开源,该库集成了众多 SOTA 算法,不需要输入特征,可以处理数值和分类特征,为开发者节省了大量时间。在人工智能发展史上,各类算法可谓层出不穷。近十几年来&a…

拉普拉斯锐化[原理及Python实现](含拉氏标定、拉普拉斯标定)

拉普拉斯锐化 [原理及Python实现](含拉氏标定、拉普拉斯标定) 原创文章;转载请注明出处:©️ Sylvan Ding 锐化处理的主要目的是突出灰度的过度部分。图像锐化的用途多种多样,应用范围从电子印刷和医学成像到工业…