最简单概率论的五个智慧

2ac9dcf4c2c327ad6f934ac1fd29b1a9.png

来源 :罗辑思维

在我认为人人都应该学一些概率知识,它现在是公民的必备知识。

现在的世界比过去复杂得多,其中有大量不确定性,是否理解概率,直接决定一个人的开化程度。

01

随机:有些事情是无缘无故地发生的

这个思想对我们的世界观有颠覆的意义。

古人没有这个思想,认为一切事物都是有因果的,甚至可能都是有目的的。人们曾经认为世界像一个钟表一样精确地运行。但真实世界不是钟表,它充满不可控的偶然。 

更严格地说,有些事情的发生,跟他之前发生的任何事情,都可以没有因果关系。不论我们做什么都不能让它一定发生,也不能让它一定不发生。 

一个人考了好大学,人们会说这是他努力的结果;一个人事业成功,人们会说这是他努力工作的结果。可是如果一个人买彩票中了大奖,这又是为什么呢?

答案是没有任何原因,这完全是一个随机事件。总会有人买彩票中奖,而这一期彩票中奖,跟他是不是好人,他在之前各期买过多少彩票,他是否关注中奖号码的走势,没有任何关系。 

若一个人总是买彩票,他中奖的概率会比别人大点吧?的确,他一生之中中一次奖的概率比那些只是偶然买一次彩票的人大。但是当他跟上千万个人一起面对一次开奖的时候,他不具备任何优势。他之前所有的努力,对他在这次开奖中的运气没有任何帮助。一个此前没有买过任何彩票的人,完全有可能,而且有同样大的可能,在某一次开奖中把最高奖金拿走。 

中奖,既不是他个人努力的结果,也不是“上天”对他有所“垂青”;不中,也不等于任何人与他做对。这就是“随机”,你没有任何办法左右结果。 

但大多数事情并不是完全的随机事件。偶然和必然结合在一起,就没那么容易理解了。人们经常错误的理解偶然,总想用必然去解释偶然。

体育比赛是最典型的例子。球队赢了球,人人有功,记者帮着分析取胜之道;输了球,人人有责,里里外外都要进行反思,甚至反思能上升到国民素质的层次。但比赛其实是充满偶然的事件,你所能做的就是尽可能争取胜利。哪怕准备的再好,总有一些因素是不确定的,也就是我们常说的运气。很少有记者把输球或赢球的原因归结于运气,人们被随机性所迷惑,狂喜狂怒从不淡定,甚至不惜人身攻击。实际上,现代职业化竞技体育中,参赛者之间的实力差距并不是天壤之别,决定比赛结果的偶然性因素非常大。强队也会输给弱队,这是现代体育的重要特征,也是魅力所在。若强队一定胜利,比赛还有什么悬念?所以偶然因素不值得较真,只要输少赢多依然还是强队。

理解随机性,我就知道很多事情发生就发生了,没有太大可供解读的意义。我们不能从这件事获得什么教训,不值得较真,甚至不值得采取行动。比如,再完美的交通工具也不可能百分百安全,我们会因为极小的事故概率不坐飞机吗?我们只需要确定事故概率比其他旅行方式小就可以了。甚至连这都不需要,只需要确定这个小概率事件我们能够容忍就可以了。避免一朝被蛇咬十年怕井绳。

2

误差

既然绝大多数事情都同时包含偶然因素和必然因素,我们自然就想排除偶然去发现背后的必然。

偶然的失败和成功都不必大惊小怪,我根据必然因素去发现判断,这总可以吧?

可以,但是必须先理解误差。

历史上最早的科学家曾经不承认实验可以有误差,认为所有的测量必须都是精确的,把任何误差归结为错误。后来人们才渐渐意识到偶然因素是永远存在的,即使实验条件再精确也无法完全避免随机干扰的影响,所以做科学实验往往要测量多次,用取平均值之类的统计手段得出结果。

多次测量确实是一个排除偶然因素的好办法。国足输掉比赛以后经常抱怨偶然因素,裁判不公、主力不在、不适应客场气候,草皮太软、草皮太硬,等等。关键是,如果经常输球,我还是可以得出国足是个弱队的结论。

即便科学实验也是如此,科学家哪怕是测量一个定义明确的物理参数,也不能给出最后的“真实答案”,他们总在测量结果上加一个误差范围比如最近发现的希格斯粒子质量为125.3±0.4(stat) ±0.5(sys) GeV意思是质量125.3,但其中有0.4的统计误差,还有0.5的系统误差。真实的质量其实只有一个,但这个数字是多少,我不知道,它可以是这个误差范围内的任何一个数字。事实上,甚至可能是误差范围外的一个数字。这是因为误差范围是一个概率计算的结果,这个范围的意思是说物理学家相信真实值落在这个范围以外的可能性非常非常小。

所以真实值非常不易得。而且,别忘了科学实验是非常理想化的,大多数事情根本没有机会多次测量。若只能测一次,那么对这一次测量的结果该怎么解读?

只能根据以往经验和类似案例,来估计一个大致的范围。

有了误差的概念,就要学会忽略误差范围内的任何波动。

例子:中国的统计数据,2013年全国居民收入的基尼系数为0.473,新闻报道说,该数据较2012年0.474略有回落,回落有多大?0.001,从统计角度来说,其实没有什么意义,可能测量的误差就大大超过0.001.

3

赌徒谬误

假如你在赌场玩老虎机,一上来运气不太好,连输好几把。这时候你是否有种强烈的感觉,你很快该赢了?

买股票、期货、彩票都是一样。连续好几把上来就亏损的情况下,是不是觉得下一把挣钱的概率很大?

这完全是一种错觉。赌博完全是独立的随机事件,这意味着下一把的结果和以前所有的结果都没有任何联系,已经发生了的事情不会影响将来。

“大数定律”说,如果进行足够多的抽奖,那么各种不同结果出现的频率就会等于他们的概率。

人们常常错误地理解为,随机就意味着均匀。如果过去一段时间内发生的事情不均匀,人们就错误的以为未来的事情会尽量往“抹平”的方向走。如果连输几把,那么下一把就应该会赢。

但大数定律的工作机制不是和过去搞平衡,它的真实意思是说如果未来进行非常多次的抽奖,你输非常多次、赢非常多次,以至于他们此前的一点点差异就会变得微不足道。

· 有个笑话说一个人乘坐飞机时总带着一颗炸弹,他认为这样就不会被恐怖分子炸飞机了,因为一架飞机上有两颗炸弹的可能性非常小。

· 战场上士兵有个说法,如果战斗中炸弹在你身边爆炸,你应该迅速跳进那个弹坑,因为两颗炸弹不大可能打到同一个地方。

这都是不理解独立随机事件导致的。

4

在没有规律的地方发现规律

理解了随机性和独立随机事件,我们可以得到一个结论:独立随机事件的发生是没有规律和不可预测的,这是一个非常重要的智慧。

彩票分析师,相信中奖号码存在走势,相信其中的规律,所以近期多次出现的组合可能会继续出现,或者按照这个趋势可以预测下一个号码。 

但这里根本没有规律,是完全随机的现象,即便存在缺陷,也需要大量的开奖后才能发现,而且缺陷的结果也很简单,无非是某个特定号码出现的可能性略大一些,完全谈不上什么复杂规律。 

明明没有规律,这些彩票分析师是怎么看出规律来的呢?也许他们不是故意骗人,而很可能他们真的相信自己找到了彩票的规律。

发现规律是人的本能。

春天过后是夏天,乌云压顶常下雨,大自然中很多事情的确是有规律的。我们的本能工作得如此之好,以至于我们在明明没有规律的地方也能找出规律来。人脑很擅长理解规律,但是很不擅长理解随机性。 

在没有规律的地方发现规律是很容易的事情,只要你愿意忽略所有不符合你这个规律的数据。而且如果数据够多,我们可以找到任何我们想要的规律。 

· 有人拿圣经做字符串游戏,声称这是圣经对后世的预言。问题是,这些预言可以完美的解释已经发生的事情,但在预测未发生的事情时就不好使了。关键是圣经中有很多很多字符,如果仔细寻找,尤其是借助计算机的话,总能找到任何想要的东西。

· 把圣经换成毛选也一样,你会发现毛选也早就预言了中国后世发生的所有大事。

未来是不可被精确预测的,这个世界也并不像钟表那样运行。

5

小数定律

现在我们知道,数据足够多的话,人们可以找到任何自己想要的重要规律,只要他不在乎这些规律的严格性和自洽性。那么在数据足够少的情况下又会如何?

如果数据足够少,有些规律会自己跳出来,你甚至不相信都不行。

人们抱着游戏或者认真的态度总结了世界杯足球赛的各种“定律”。比如——

· “巴西队的礼物”:只要巴西夺冠,下一届的冠军就将是主办大赛的东道主,除非巴西队自己将礼物收回。这一定律在2006年被破解。

· “1982轴心定律”:世界杯夺冠球队以1982年世界杯为中心呈对称分布,这个定律在2006年被破解。

还有一些未被破解的定律,比如——

· 凡是获得联合会杯或美洲杯,就别想在下一届世界杯夺冠。

· 中国队的“王治郅定律”:只要王治郅参加季后赛,八一队必然得总冠军,以及“0:2”落后无人翻盘定律。

如果仔细研究这些定律,会发现不易破解的定律其实都有一定的道理。王治郅和八一队都很强,0:2落后的确很难翻盘,而获得世界杯冠军是个非常不容易的事情,更别说同时获得联合会杯、美洲杯和世界杯。但不容易不等于不会发生,他们终究会被破解。

那些看似没有道理的神奇定律(正因为没道理,所以显得神奇),则大多数已经被破解。之所以神奇,是因为纯属巧合。世界杯总共才进行了80多年,20多届。只要数据足够少,我们总能发现一些没有破解的规律。

如果数据少,随机现象可以看上去很不随机。甚至非常整齐,感觉好像真有规律一样。

问题的关键是,随机分布不等于均匀分布。要想均匀分布,必须要样本总数非常大的时候才有效。一旦不均匀,人们就认为其中必有缘故(阴谋论),而事实却是这可能只是偶然事件。

· iPod最早推出“随机播放”功能的时候,用户发现有些歌曲会被重复播放,他们据此认为播放根本不随机。苹果公司只好放弃真正的随机算法,用乔布斯本人的话说,就是改进以后的算法使播放“更不随机以至于让人感觉更随机”。

如果统计数据很少,就很容易出现特别不均匀的情况。这个现象被诺奖得主丹尼尔·卡尼曼戏称为“小数定律”。卡尼曼说,如果我们不理解小数定律,就不能真正理解大数定律。

大数定律是我们从统计数字中推测真相的理论基础。大数定律说如果统计样本足够大,那么事物出现的频率就能无限接近他的理论概率——也就是他的“本性”。而小数定律说如果样本不够大,那么他就表现为各种极端情况,而这些情况可以跟他的本性一点关系都没有。

· 一个只有二十人的乡村中学某年突然有两人考上清华,跟一个有两千人的中学每年都有两百人考上清华,完全没有可比性。

如果统计样本不够大,就什么也说明不了。

正因为如此,我们才不能只凭自己的经验,哪怕加上家人和朋友的经验,去对事物做出判断。我们的经验非常有限。别看个例,看大规模统计。有的人听说两三个负面新闻就敢写文章把社会批得一文不值,这样的人非常无知。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

b67067dda6d3849b526254254396bf5c.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/482496.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

谷歌AI一次注释了10%的已知蛋白质序列,超过人类十年研究成果

来源:ScienceAI编辑 :泽南、张倩和 AlphaFold 不同,这次谷歌探索的是用深度学习给蛋白质打上功能标签。蛋白质是组成人体一切细胞、组织的重要成分。机体所有重要的组成部分都需要有蛋白质的参与。目前已知存在的蛋白质种类有数十亿&#xff…

你真的了解计算生物学和AI for Science吗?

来源:量子位Q1:AlphaFold2的最大意义是什么?A1:这个看似突破性的进展,其实是技术演进的必然结果。 此外,如果我们换个视角来看待这个问题,蛋白质结构预测仅仅是计算生物学这个大门类里面一个相对…

Stephen Wolfram专访Judea Pearl:从贝叶斯网络到元胞自动机

来源: 集智俱乐部编译:闫和东、徐培 编辑:邓一雪 导语2022年人工智能与数学国际研讨会(ISAIM 2022)恰逢著名计算机科学家、贝叶斯网络之父 Judea Pearl 85岁生日,会议期间Mathematica创始人 Stephen Wolfra…

day32 并发编程之锁

并发编程之锁 1. GIL全局解释器锁 2. GIL与普通的互斥锁 3. 死锁 4. 信号量 5. event事件 6. 线程q 1. GIL全局解释器锁 """ In CPython, the global interpreter lock, or GIL, is a mutex that prevents multiple native threads from executing Python bytec…

马斯克Neuralink被曝“虐杀实验猴”,140万元美金项目遭谴责

来源: 学术头条作者:刘芳编辑:黄珊2021 年 4 月,马斯克公布了一段猴子用意念玩乒乓球游戏的视频,一时间为他旗下的脑机接口公司 Neuralink 赚足了眼球。然而最近,这些被用来做脑机接口实验的猴子的经历&…

死前真的会有「跑马灯」,人类首次同步测量大脑濒死状态

来源:新智元编辑:袁榭 好困或许,人死前可能真会眼前出现人生跑马灯!最近,神经科学家在记录了一个濒临死亡的人类大脑的活动之后发现,人在死亡前后有节奏的脑电波模式与做梦、回忆记忆和冥想时出现的模式相似…

七牛图片盲水印

注意 暂时不支持从 dora 数据处理直接调该接口,只支持从 kodo 存储调用。即 cdn 域名不可开通图片瘦身调用形式 资源 http://i.iamlj.com/19-08-12/123936.png 处理参数 watermark/6/method/encode/text/aGVsbG8gcWluaXU 新图 http://i.iamlj.com/19-08-12/123936-w…

「最小细胞」的3D数字模型,计算揭示生命最基本的要求

来源:ScienceAI编辑:萝卜皮无论是海洋深处的奇异生物还是我们体内的细菌,地球上的所有生命都是由细胞组成的。但我们对这些细胞中最简单的细胞如何运作只有一个非常粗略的了解。伊利诺伊大学厄巴纳-香槟分校的一个团队创建了有史以来最完整的…

Yann LeCun最新发声:自监督+世界模型,让 AI 像人类与一样学习与推理

来源:AI科技评论作者:维克多、西西、王晔编辑:陈彩娴如何突破当代人工智能(AI)的瓶颈?不同学者存在不同观点。总体来看可以概括为两类,其一监督学习者,提倡通过改善数据标签质量&…

两大头号玩家 一个伟大愿景: 联邦学习的元生态建设美好世界

来源:IEEE标准协会新年伊始,世界领先的标准制定机构IEEE标准协会牵头,组织了2022年度联邦学习领域首场重量级尖峰交流活动——联邦学习首创团队带头人、谷歌研究院副总裁Blaise Agura y Arcas博士,与联邦学习亚洲奠基人、IEEE联邦…

物理学的过去、现在与未来

来源:中科院之声(ID:zkyzswx)、《物理》杂志、中国物理学会期刊网作者:冯端(我国著名物理学家、金属和晶体材料学家、教育家,中国科学院院士、第三世界科学院院士、第五届中国物理学会理事长,南…

《MIT科技评论》:2022年全球十大突破性技术

来源:6G俱乐部资料来源:《麻省理工科技评论》近日,《麻省理工科技评论》2022年“全球十大突破性技术”正式发布。此次发布的突破性技术包括:“新冠口服药”“实用型聚变反应堆”“终结密码”“AI蛋白质折叠”“PoS权益证明”“长时…

PNAS前沿:迈向作为多层学习的进化理论

来源:集智俱乐部作者:郭瑞东编辑:邓一雪导语进化、学习与物理系统的重整化有何相似之处?PNAS的论文“构建将进化视作多层学习的理论”一文,经由统一的理论框架,分析进化过程中的环境预测误差,及…

【前瞻】Nature:2022年7大“颠覆性”技术

来 源:中国科学报 作 者:文乐乐 近日,《自然》对“可能在未来一年对科学产生影响”的7项技术进行了综述。这7项技术分别是完整版基因组、蛋白质结构解析、量子模拟、精准基因组调控、靶向基因疗法、空间多组学、基于CRISPR的诊断。完整版基因…

重磅!Nature子刊发布稳定学习观点论文:建立因果推理和机器学习的共识基础...

来源:AI科技评论整理:AI科技评论2月23日,清华大学计算机系崔鹏副教授与斯坦福大学Susan Athey(美国科学院院士,因果领域国际权威)合作,在全球顶级期刊Nature Machine Intelligence(影…

卸载mysql

先停止所有mysql有关进程。 打开控制台:依次输入以下命令 sudo rm /usr/local/mysqlsudo rm -rf /usr/local/mysql*sudo rm -rf /Library/StartupItems/MySQLCOMsudo rm -rf /Library/PreferencePanes/My*vim /etc/hostconfig and removed the line MYSQLCOM-YES-rm -rf ~/Libr…

​数据集拥有自己的世界观?不,其实还是人的世界观

来源: AI科技评论编译:Antonio编辑:陈彩娴伴随深度学习的不断日常化,数据集中的偏见(bias)和公正性(fairness)已经成为一个热门研究方向。偏见在AI领域是一个很棘手的话题&#xff1…

图灵奖获得者Yann LeCun:未来几十年AI研究的最大挑战是「预测世界模型」

来源:机器学习研究组订阅LeCun 认为,构造自主 AI 需要预测世界模型,而世界模型必须能够执行多模态预测,对应的解决方案是一种叫做分层 JEPA(联合嵌入预测架构)的架构。该架构可以通过堆叠的方式进行更抽象、…

可重构人工智能设备展现出智能化前景

PURDUE UNIVERSITY来源:IEEE电气电子工程师一项新的研究发现,一种适应性强的新设备可以转换成人工智能硬件所需的所有关键电子元件,在机器人和自治系统中有潜在的应用。以大脑为灵感或“神经形态”的计算机硬件旨在模仿人脑从经验中自适应学习…

gin+vue的前后端分离开源项目

该项目是ginvue的前后端分离项目,使用gorm访问MySQL,其中vue前端是使用vue-element-admin框架简单实现的; go后台使用jwt,对API接口进行权限控制。此外,Web页面在token过期后的半个小时内,用户再次操作会自…