年底了,技术群组织了一场机器学习算法岗技术&面试讨论会,邀请了一些同学分享他们的面试经历,讨论会会定期召开,如果你想加入我们的讨论群或者希望要更详细的资料,文末加入。
喜欢本文记得收藏、关注、点赞
文章目录
- 字节
- 一面
- 二面
- 三面
- HR面
- 淘天
- 一面
- 二面
- 滴滴
- 一面
- 二面
- 三面-50min
- 快手
- 一面
- 二面
- 滴滴
- 网易
- 一面
- 二面
- 蔚来
- 滴滴
- 小红书
- 数据相关
- 机器学习相关
- 深度学习相关
- 技术交流
字节
岗位:数据分析
一面
1.自我介绍
2.一个数据分析的项目—要求:增长策略
1)背景是什么?
2)指标分子分母是什么
3)衡量指标是什么?
3.三个指标来评估抖音的发展状况
4.人均播放量下降,应该如何排查 --经典题
5.是否增加一个广告位,如何衡量正向,负向的影响
6.如何确定AB测试的最小样本量?公式里的具体参数
7.如何判断实验组是好是坏?什么指标?做什么检验
8.什么时候用Z检验,T检验
9.广告收入增长,但用户留存下降,如何判断是否上线?量化收益?
10.LTV如何与广告收入结合?
11。如何计算用户LTV
12.如何计算LT,生命周期
13.SQL题
14.自己的职业规划
15.觉得自己做数分最大的优势是什么?
一面对于基础知识的考察还是比较细的,面试官也比较严厉,没有反问机会
二面
1.之前有过实习经历吗 ——昂?没看简历?
2.除了业务以外,在做数据分析还有哪些需要提升的地方 --啊?是不是被人反问的问题
3.抖音人均使用时长下降
4.同学如何评价你
5.你自己怎么形容你自己
6.知乎:添加功能应该添加哪一个?
7.知乎:去掉一个功能
8.预估上海有多少二手房门店的数量(多种方法)
二面的考察比较侧重业务,但是几乎没什么挖的,感觉有一点点套路化。面试官比较亲切。
三面
1.自我介绍
2.总实习的时长有多长,哪段时间最长
3.每个实习公司都是做什么的
4.从数据分析的角度来看,你认为哪个公司的环境更好
5.介绍一个项目
6-8挖项目
9.对行业的了解
10-13挖行业思考与相关分析
14.从带你的人学到的东西是什么? —重点题
15.在学校成绩是怎么样的
16.对自己的未来规划是怎么样的
三面应该是大佬级别的人,很有领导范😉整体面试思路很有逻辑:实习(宏观到微观,主观到具体项目)-行业(从主观把握,观察思考,具体实操)-个人发展潜力(自省能力,学习能力和职业预期)。
HR面
1.自我介绍
2.实习过程中最有成就感的一件事 --HR的拿手问题张口就来
3.有没有想要放弃的时候 --这熟悉的感觉他又来了
4.还投递了哪些公司?为什么会投递这个公司 --啊哈哈哈
5.为什么投递字节?认为字节和自己有哪些相似之处 --欸嘿嘿嘿?
6.认为商业分析和数据分析有哪些区别 --old question
淘天
岗位:数据分析
一面
1.自我介绍
2.实习内容
3.实习团队架构
4.map reduce原理
5.数据倾斜有没有遇到过?怎么解决
6.ab实验原理、流程、如何分析
7.假设检验原理
8.口述sql题目:求连续登陆三天的用户
9.假设检验概率论场景题:求置信区间
10.常用的机器学习算法
11.随机森林原理
12.求职意向,数科还是数研,安排下一轮面试官(回数研后第二天结束流程)
13.反问
二面
1.自我介绍
2.实习深挖:项目技术难点怎么解决的?有什么效果?收获
3.怎么分析指标下滑
4.spark的宽窄依赖
5.手撕:3道二叉树
6.反馈推进下一面 但是前面人太多
7.反问
滴滴
岗位:数据分析师
一面
自我介绍
SQL题目,1-7日的留存率,就是当天登录后在接下来一周内登录过的人
异动分析,如果这个留存率增加30%,怎么分析。追问怎么判断主要因素
AB,问设置的步骤,怎么确定样本量,如果实验不显著怎么办。。。
py做过什么项目,提了一下模型
二面
异动分析,订单呼叫量下降怎么归因
你觉得自己做数据分析师有什么优势,为什么选择这个行业
3-5年内希望自己在这个行业成为一个什么样的人
介绍部门,问喜欢的工作氛围
实习中最有成就感的事情
给我的建议
三面-50min
自我介绍
细问实习
主要是归因,指标体系、AB那些
怎么判断能不能在一个新城市开展业务
怎么估计一个新城市的业务需求量
手上offer
快手
分享一下去年成功面试进快手的面试经验,希望对大家有帮助
一面
1)自我介绍
2)深挖过往实习经历:
1.数据异动问题:假如一直关心的指标在某个时间点下跌很多,怎么分析呢?
2.评估方式问题:大型活动无法上ab实验,那么如何评估活动的效果呢?
3.指标选择问题:如何构建关键的指标链路,如何展示?
3)统计知识考察:
1.如何通俗地解释p值的意义?
2.解释一类错误和二类错误
3.了解染色逻辑吗?
4)偏智力题:
一次可选择上一级或者两级台阶,上到10级的方法有几种(斐波那契数列)
二面
-
自我介绍
-
问数仓项目,你在这个项目中负责什么,两个项目的数仓模型你觉得有什么区别
项目中是如何取数的,埋点是基于什么协议http,数据是直接存储到mysql中的吗(存储到本地再导入mysql) -
数仓分层,为什么这么分,有什么好处,建模方式都有什么,有哪些事实表类型,事务性事实表细分还能分什么血缘分析组件,OLAP组件还用过什么
-
MR和Spark的shuffle,
-
Doris底层了解吗,和别的引擎对比
-
了解其他最新大数据框架没
手撕2道sql
连续登陆7天的用户id
互相关注用户
滴滴
岗位:数据分析
开局问业务:小桔能源-加油决策中心-数据分析
1、自我介绍
2、问tx实习里的tapd是什么
3、结合tx实习问MECE法则分析的思路
4、问MAU指标拆解的过程和逻辑
5、问实习中是怎么做数据清洗的
6、问懂不懂ETL?
7、提问,滴滴,比如说7月份它的一个用户的D a u下降30%,你看你会怎么去分析?
8、问机器学习模型
9、问k均值算法,k怎么确定
10、sql题,一个打车订单表:
(1)用户的下单的城市超过2个的用户I d
(2)半个月的打车订单,算第二周的留存率
(3)sql的执行顺序
11、换我问
网易
岗位:数据分析
面的是传媒技术部的数据分析,对接的是网易新闻
一面
1.简历深挖。挖得太细了,很多角度都是从未设想过的,不得不说业务做的多的人看细节真的很独到
2.机器学习相关。随机森林、逻辑回归原理,如何做特征筛选,评价指标
3.口述三道SQL
4.一道python数据清洗的题目,屏幕共享直接写
5.反问,介绍业务,然后给我提了点二面的建议
二面
1.AB实验样本不平衡怎么办
2.其他主要是问简历和聊天
面试官没有架子,氛围很好
蔚来
岗位:数据分析(实习)
已拿到offer,是自动驾驶云端部的数据平台的实习岗位;
第一面 是直属mentor ,主要围绕简历深挖问了上段实习数据分析的case 和可视化的工作经历,并且问了对于BI的理解 。
做了一道SQL笔试, 中等难度,主要用了累计求和的窗口。
第二面 是leader面, 问了SQL优化以及数据平台的理解; 又做了SQL 。 两轮SQL题难度中等 。不是很难
问了rank,dense_rank,和row_number() 的区别
终面HR面,常规结构化面试。
面试当天就收到结果啦~~
是我很喜欢的部门,office就在中关村附近 。期待入职~
滴滴
岗位:数据分析(实习)
岗位是数据分析 但是更偏向数据科学 但是对于AB实验要求很高 要了解因果推断
AB实验/统计学基础/业务思维缺一不可(没有手写sql)
-
自我介绍
-
介绍一段经历 有追问 会直接点出问题
反思:对于实习的经历不仅要非常熟悉且知道问题在哪/有无改善空间
有一点比较好玩 lz这段经历给n个面试官讲过 之前的没有一个人点出过问题
介绍另一段实习:这里进行了实习中某个用到的指标讨论
反思:如果是实习中的项目借鉴了过往公司项目的指标一定要反思指标合理性 大厂DA定义的也不一定完全准确 -
统计学基础
面试官还是很好的 自己说一个方向然后他追问
反思:对于公式/推导/原理不能只有个模糊的印象 遇到技术大佬直接凉 -
业务问题
滴滴的优缺点 就缺点问如何识别
包括怎么识别这个问题/怎么改善 -
回到AB
但是此时lz心态已麻 内心os:我看看你还能问出什么花来 -
反问
工作内容(lz直说搜过他)
对比uber的surge price 为什么滴滴不这么做
小红书
岗位:数据分析
数据相关
项目中不平衡数据如何处理
项目中数据量的大小
项目中数据的特征介绍
什么是hard样本什么是easy样本
机器学习相关
Boosting 和 bagging的区别
决策树的分裂的计算(ID3, C4.5,CART)
Adaboost 和 GBDT 的区别
Adaboost 和 GBDT的损失函数
Xgboost 和 GBDT的区别
Boosting 和 Random Forest Tree 的区别
梯度下降和随机梯度下降的区别
逻辑回归,svm和树模型的区别
项目中为什么选择GBDT而不是adaboost
采用什么作为模型好坏的评判标准(accuracy, f1-macro)
降维的方法
树模型如何调参
如何检测模型是否过拟合
如何减少过拟合现象的产生
深度学习相关
Attention 和 self attention的区别
介绍一下Transformer
Bert提升了transformer的哪些东西
BERT比RNN好在哪里
RNN, LSTM, BERT的优缺点
梯度消失和梯度爆炸产生的原因
如何解决梯度消失和梯度爆炸
介绍一下推荐系统的算法(协同过滤,基于内容的推荐)
技术交流
独学而无优则孤陋而寡闻,技术要学会交流、分享,不建议闭门造车。
建立了技术交流与面试交流群,面试真题、答案获取,均可加交流群获取,群友已超过2000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友。
方式①、微信搜索公众号:Python学习与数据挖掘,后台回复:交流
方式②、添加微信号:dkl88194,备注:交流
资料
我们打造了《数据分析实战案例宝典》,特点:从0到1轻松学习,方法论及原理、代码、案例应有尽有,所有案例都是按照这样的节奏进行表述。