初级或中级算法岗面试题主要有四类:数理统计基础、机器学习模型原理、编程能力、项目经验。项目经验因人而异,所以仅总结前三个方面的基础知识,分享给朋友。(高级或资深算法岗面试内容不在本文范围内)
1.大数定律
弱大数定律:独立同分布的n个随机变量,当n充分大时,n个随机变量的均值依概率收敛于数学期望值,即可以用均值代替数学期望值。
伯努利大数定理:独立重复试验次数足够大时,事件A发生的频率收敛于概率。注:以上为口头简述,非标准化的数学表述。
2.中心极限定理
n个独立同分布的随机变量,当n充分大时,其均值服从正态分布。注:以上为口头简述,非标准化的数学表述。
3.条件概率/分布律(乘法公式)
P(A|B)=P(AB)/P(B),演化式P(A|B)*P(B)=P(B|A)*P(A)
4.全概率公式
P(A)= P(A|B1)+P(A|B2)+P(A|B3)+…+P(A|Bn),其中A为样本空间的事件,B1、B2、B3…Bn为样本空间的一个划分。
5.贝叶斯公式
P(Bi|A)= P(A|Bi)*P(Bi)/[P(A|B1)+P(A|B2)+P(A|B3)+…+P(A|Bn)],其中A为样本空间的事件,B1、B2、B3…Bn为样本空间的一个划分。
6. 常见三大正态抽样分布
7. 参数检验(总体分布已知的情况下,对参数取值的检验)
8. 非参数检验(总体分布形式未知情况下的检验)
(3) 偏度、峰度检验
9. 置信区间
注:单侧置信区间省略
10. 模型拟合优度
(4)A/Btest Score
(5)残差检验:一般要求残差分布接近正态分布。
写在最后:原理和思想很重要,一定要理解透彻!!!
“数学算法的世界”专注数据分析、数据科学技能传播,后期会陆续推出数据分析、数据科学面试题汇总系列文章,敬请关注!
往期回顾
在数据分析/科学中的竞争力如何?一张图帮你读懂数据科学需要掌握的技能
抖音日活3.2亿,可能有 3.3亿用户在同一天内使用抖音吗?(泊松分布的Python实现)
常见数据分析(Python)面试题(一)
什么影响了你的工资?方差分析告诉你
我放弃了国企工作,转行做了数据分析