![4555f4838b8460313631c861b6854333.png](https://img-blog.csdnimg.cn/img_convert/4555f4838b8460313631c861b6854333.png)
初级或中级算法岗面试题主要有四类:数理统计基础、机器学习模型原理、编程能力、项目经验。项目经验因人而异,所以仅总结前三个方面的基础知识,分享给朋友。(高级或资深算法岗面试内容不在本文范围内)
1.大数定律
弱大数定律:独立同分布的n个随机变量,当n充分大时,n个随机变量的均值依概率收敛于数学期望值,即可以用均值代替数学期望值。
伯努利大数定理:独立重复试验次数足够大时,事件A发生的频率收敛于概率。注:以上为口头简述,非标准化的数学表述。
2.中心极限定理
n个独立同分布的随机变量,当n充分大时,其均值服从正态分布。注:以上为口头简述,非标准化的数学表述。
3.条件概率/分布律(乘法公式)
P(A|B)=P(AB)/P(B),演化式P(A|B)*P(B)=P(B|A)*P(A)
4.全概率公式
P(A)= P(A|B1)+P(A|B2)+P(A|B3)+…+P(A|Bn),其中A为样本空间的事件,B1、B2、B3…Bn为样本空间的一个划分。
5.贝叶斯公式
P(Bi|A)= P(A|Bi)*P(Bi)/[P(A|B1)+P(A|B2)+P(A|B3)+…+P(A|Bn)],其中A为样本空间的事件,B1、B2、B3…Bn为样本空间的一个划分。
6. 常见三大正态抽样分布
![e70615c928fe3903c04d0d757dce4413.png](https://img-blog.csdnimg.cn/img_convert/e70615c928fe3903c04d0d757dce4413.png)
![673baf1d4f58bb9f04f2eecb25ce7d0f.png](https://img-blog.csdnimg.cn/img_convert/673baf1d4f58bb9f04f2eecb25ce7d0f.png)
![2fd942dfc2390c14569a36655b38fa60.png](https://img-blog.csdnimg.cn/img_convert/2fd942dfc2390c14569a36655b38fa60.png)
7. 参数检验(总体分布已知的情况下,对参数取值的检验)
![e70615c928fe3903c04d0d757dce4413.png](https://img-blog.csdnimg.cn/img_convert/e70615c928fe3903c04d0d757dce4413.png)
![30dd8ce157e1edcadbe47235d8ed5aae.png](https://img-blog.csdnimg.cn/img_convert/30dd8ce157e1edcadbe47235d8ed5aae.png)
![e4f895e7689b873eba924d29872628ef.png](https://img-blog.csdnimg.cn/img_convert/e4f895e7689b873eba924d29872628ef.png)
![a6031379b96ed4862b13cb16570c4d6b.png](https://img-blog.csdnimg.cn/img_convert/a6031379b96ed4862b13cb16570c4d6b.png)
8. 非参数检验(总体分布形式未知情况下的检验)
![072463ac3f6cc8c4b04034be55034279.png](https://img-blog.csdnimg.cn/img_convert/072463ac3f6cc8c4b04034be55034279.png)
![89dfebe3ff14cd5240f1d75470afdc54.png](https://img-blog.csdnimg.cn/img_convert/89dfebe3ff14cd5240f1d75470afdc54.png)
(3) 偏度、峰度检验
![8cea50d31223f17ec41fe04ac5d3dd62.png](https://img-blog.csdnimg.cn/img_convert/8cea50d31223f17ec41fe04ac5d3dd62.png)
9. 置信区间
![d0add79a0800121879d3963c1af6772e.png](https://img-blog.csdnimg.cn/img_convert/d0add79a0800121879d3963c1af6772e.png)
![aa8df82175cd099a7b503114fb2af929.png](https://img-blog.csdnimg.cn/img_convert/aa8df82175cd099a7b503114fb2af929.png)
![92c5d2455ab1810fb7765d82c01c8faa.png](https://img-blog.csdnimg.cn/img_convert/92c5d2455ab1810fb7765d82c01c8faa.png)
![30c9c9f063f75b77a1c8ecac95969b5d.png](https://img-blog.csdnimg.cn/img_convert/30c9c9f063f75b77a1c8ecac95969b5d.png)
注:单侧置信区间省略
10. 模型拟合优度
![8f67217743e3719075738ae29a280bbe.png](https://img-blog.csdnimg.cn/img_convert/8f67217743e3719075738ae29a280bbe.png)
![a19c4fbcd5b877c4aaaeeec6780aedc9.png](https://img-blog.csdnimg.cn/img_convert/a19c4fbcd5b877c4aaaeeec6780aedc9.png)
![336c672d7a6f9dd37149cb93f9ea2f51.png](https://img-blog.csdnimg.cn/img_convert/336c672d7a6f9dd37149cb93f9ea2f51.png)
(4)A/Btest Score
(5)残差检验:一般要求残差分布接近正态分布。
写在最后:原理和思想很重要,一定要理解透彻!!!
“数学算法的世界”专注数据分析、数据科学技能传播,后期会陆续推出数据分析、数据科学面试题汇总系列文章,敬请关注!
![625ef2e1a7e65efd174faa32ca2ca9c7.png](https://img-blog.csdnimg.cn/img_convert/625ef2e1a7e65efd174faa32ca2ca9c7.png)
往期回顾
在数据分析/科学中的竞争力如何?一张图帮你读懂数据科学需要掌握的技能
抖音日活3.2亿,可能有 3.3亿用户在同一天内使用抖音吗?(泊松分布的Python实现)
常见数据分析(Python)面试题(一)
什么影响了你的工资?方差分析告诉你
我放弃了国企工作,转行做了数据分析