【数据分析岗】8家知名企业秋招(含实习)面试题汇总

年底了,技术群组织了一场机器学习算法岗技术&面试讨论会,邀请了一些同学分享他们的面试经历,讨论会会定期召开,如果你想加入我们的讨论群或者希望要更详细的资料,文末加入。

喜欢本文记得收藏、关注、点赞

文章目录

    • 字节
      • 一面
      • 二面
      • 三面
      • HR面
    • 淘天
      • 一面
      • 二面
    • 滴滴
      • 一面
      • 二面
      • 三面-50min
    • 快手
      • 一面
      • 二面
    • 滴滴
    • 网易
      • 一面
      • 二面
    • 蔚来
    • 滴滴
    • 小红书
      • 数据相关
      • 机器学习相关
      • 深度学习相关
    • 技术交流

字节

岗位:数据分析

一面

1.自我介绍

2.一个数据分析的项目—要求:增长策略

1)背景是什么?

2)指标分子分母是什么

3)衡量指标是什么?

3.三个指标来评估抖音的发展状况

4.人均播放量下降,应该如何排查 --经典题

5.是否增加一个广告位,如何衡量正向,负向的影响

6.如何确定AB测试的最小样本量?公式里的具体参数

7.如何判断实验组是好是坏?什么指标?做什么检验

8.什么时候用Z检验,T检验

9.广告收入增长,但用户留存下降,如何判断是否上线?量化收益?

10.LTV如何与广告收入结合?

11。如何计算用户LTV

12.如何计算LT,生命周期

13.SQL题

14.自己的职业规划

15.觉得自己做数分最大的优势是什么?

一面对于基础知识的考察还是比较细的,面试官也比较严厉,没有反问机会

二面

1.之前有过实习经历吗 ——昂?没看简历?

2.除了业务以外,在做数据分析还有哪些需要提升的地方 --啊?是不是被人反问的问题

3.抖音人均使用时长下降

4.同学如何评价你
5.你自己怎么形容你自己

6.知乎:添加功能应该添加哪一个?

7.知乎:去掉一个功能

8.预估上海有多少二手房门店的数量(多种方法)

二面的考察比较侧重业务,但是几乎没什么挖的,感觉有一点点套路化。面试官比较亲切。

三面

1.自我介绍

2.总实习的时长有多长,哪段时间最长

3.每个实习公司都是做什么的

4.从数据分析的角度来看,你认为哪个公司的环境更好

5.介绍一个项目

6-8挖项目

9.对行业的了解

10-13挖行业思考与相关分析

14.从带你的人学到的东西是什么? —重点题

15.在学校成绩是怎么样的

16.对自己的未来规划是怎么样的

三面应该是大佬级别的人,很有领导范😉整体面试思路很有逻辑:实习(宏观到微观,主观到具体项目)-行业(从主观把握,观察思考,具体实操)-个人发展潜力(自省能力,学习能力和职业预期)。

HR面

1.自我介绍

2.实习过程中最有成就感的一件事 --HR的拿手问题张口就来

3.有没有想要放弃的时候 --这熟悉的感觉他又来了

4.还投递了哪些公司?为什么会投递这个公司 --啊哈哈哈

5.为什么投递字节?认为字节和自己有哪些相似之处 --欸嘿嘿嘿?

6.认为商业分析和数据分析有哪些区别 --old question

淘天

岗位:数据分析

一面

1.自我介绍

2.实习内容

3.实习团队架构

4.map reduce原理

5.数据倾斜有没有遇到过?怎么解决

6.ab实验原理、流程、如何分析

7.假设检验原理

8.口述sql题目:求连续登陆三天的用户

9.假设检验概率论场景题:求置信区间

10.常用的机器学习算法

11.随机森林原理

12.求职意向,数科还是数研,安排下一轮面试官(回数研后第二天结束流程)

13.反问

二面

1.自我介绍

2.实习深挖:项目技术难点怎么解决的?有什么效果?收获

3.怎么分析指标下滑

4.spark的宽窄依赖

5.手撕:3道二叉树

6.反馈推进下一面 但是前面人太多

7.反问

滴滴

岗位:数据分析师

一面

自我介绍

SQL题目,1-7日的留存率,就是当天登录后在接下来一周内登录过的人

异动分析,如果这个留存率增加30%,怎么分析。追问怎么判断主要因素

AB,问设置的步骤,怎么确定样本量,如果实验不显著怎么办。。。

py做过什么项目,提了一下模型

二面

异动分析,订单呼叫量下降怎么归因

你觉得自己做数据分析师有什么优势,为什么选择这个行业

3-5年内希望自己在这个行业成为一个什么样的人

介绍部门,问喜欢的工作氛围

实习中最有成就感的事情

给我的建议

三面-50min

自我介绍

细问实习

主要是归因,指标体系、AB那些

怎么判断能不能在一个新城市开展业务

怎么估计一个新城市的业务需求量

手上offer

快手

分享一下去年成功面试进快手的面试经验,希望对大家有帮助

一面

1)自我介绍

2)深挖过往实习经历:
1.数据异动问题:假如一直关心的指标在某个时间点下跌很多,怎么分析呢?
2.评估方式问题:大型活动无法上ab实验,那么如何评估活动的效果呢?
3.指标选择问题:如何构建关键的指标链路,如何展示?

3)统计知识考察:
1.如何通俗地解释p值的意义?
2.解释一类错误和二类错误
3.了解染色逻辑吗?

4)偏智力题:
一次可选择上一级或者两级台阶,上到10级的方法有几种(斐波那契数列)

二面

  1. 自我介绍

  2. 问数仓项目,你在这个项目中负责什么,两个项目的数仓模型你觉得有什么区别
    项目中是如何取数的,埋点是基于什么协议http,数据是直接存储到mysql中的吗(存储到本地再导入mysql)

  3. 数仓分层,为什么这么分,有什么好处,建模方式都有什么,有哪些事实表类型,事务性事实表细分还能分什么血缘分析组件,OLAP组件还用过什么

  4. MR和Spark的shuffle,

  5. Doris底层了解吗,和别的引擎对比

  6. 了解其他最新大数据框架没

手撕2道sql

连续登陆7天的用户id

互相关注用户

滴滴

岗位:数据分析

开局问业务:小桔能源-加油决策中心-数据分析

1、自我介绍

2、问tx实习里的tapd是什么

3、结合tx实习问MECE法则分析的思路

4、问MAU指标拆解的过程和逻辑

5、问实习中是怎么做数据清洗的

6、问懂不懂ETL?

7、提问,滴滴,比如说7月份它的一个用户的D a u下降30%,你看你会怎么去分析?

8、问机器学习模型

9、问k均值算法,k怎么确定

10、sql题,一个打车订单表:
(1)用户的下单的城市超过2个的用户I d
(2)半个月的打车订单,算第二周的留存率
(3)sql的执行顺序

11、换我问

网易

岗位:数据分析

面的是传媒技术部的数据分析,对接的是网易新闻

一面

1.简历深挖。挖得太细了,很多角度都是从未设想过的,不得不说业务做的多的人看细节真的很独到

2.机器学习相关。随机森林、逻辑回归原理,如何做特征筛选,评价指标

3.口述三道SQL

4.一道python数据清洗的题目,屏幕共享直接写

5.反问,介绍业务,然后给我提了点二面的建议

二面

1.AB实验样本不平衡怎么办

2.其他主要是问简历和聊天

面试官没有架子,氛围很好

蔚来

岗位:数据分析(实习)

已拿到offer,是自动驾驶云端部的数据平台的实习岗位;

第一面 是直属mentor ,主要围绕简历深挖问了上段实习数据分析的case 和可视化的工作经历,并且问了对于BI的理解 。
做了一道SQL笔试, 中等难度,主要用了累计求和的窗口。

第二面 是leader面, 问了SQL优化以及数据平台的理解; 又做了SQL 。 两轮SQL题难度中等 。不是很难
问了rank,dense_rank,和row_number() 的区别

终面HR面,常规结构化面试。

面试当天就收到结果啦~~

是我很喜欢的部门,office就在中关村附近 。期待入职~

滴滴

岗位:数据分析(实习)

岗位是数据分析 但是更偏向数据科学 但是对于AB实验要求很高 要了解因果推断

AB实验/统计学基础/业务思维缺一不可(没有手写sql)

  1. 自我介绍

  2. 介绍一段经历 有追问 会直接点出问题
    反思:对于实习的经历不仅要非常熟悉且知道问题在哪/有无改善空间
    有一点比较好玩 lz这段经历给n个面试官讲过 之前的没有一个人点出过问题
    介绍另一段实习:这里进行了实习中某个用到的指标讨论
    反思:如果是实习中的项目借鉴了过往公司项目的指标一定要反思指标合理性 大厂DA定义的也不一定完全准确

  3. 统计学基础
    面试官还是很好的 自己说一个方向然后他追问
    反思:对于公式/推导/原理不能只有个模糊的印象 遇到技术大佬直接凉

  4. 业务问题
    滴滴的优缺点 就缺点问如何识别
    包括怎么识别这个问题/怎么改善

  5. 回到AB
    但是此时lz心态已麻 内心os:我看看你还能问出什么花来

  6. 反问
    工作内容(lz直说搜过他)
    对比uber的surge price 为什么滴滴不这么做

小红书

岗位:数据分析

数据相关

项目中不平衡数据如何处理

项目中数据量的大小

项目中数据的特征介绍

什么是hard样本什么是easy样本

机器学习相关

Boosting 和 bagging的区别

决策树的分裂的计算(ID3, C4.5,CART)

Adaboost 和 GBDT 的区别

Adaboost 和 GBDT的损失函数

Xgboost 和 GBDT的区别

Boosting 和 Random Forest Tree 的区别

梯度下降和随机梯度下降的区别

逻辑回归,svm和树模型的区别

项目中为什么选择GBDT而不是adaboost

采用什么作为模型好坏的评判标准(accuracy, f1-macro)

降维的方法

树模型如何调参

如何检测模型是否过拟合

如何减少过拟合现象的产生

深度学习相关

Attention 和 self attention的区别

介绍一下Transformer

Bert提升了transformer的哪些东西

BERT比RNN好在哪里

RNN, LSTM, BERT的优缺点

梯度消失和梯度爆炸产生的原因

如何解决梯度消失和梯度爆炸

介绍一下推荐系统的算法(协同过滤,基于内容的推荐)

技术交流

独学而无优则孤陋而寡闻,技术要学会交流、分享,不建议闭门造车。

建立了技术交流与面试交流群,面试真题、答案获取,均可加交流群获取,群友已超过2000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友。

方式①、微信搜索公众号:Python学习与数据挖掘,后台回复:交流
方式②、添加微信号:dkl88194,备注:交流

资料
我们打造了《数据分析实战案例宝典》,特点:从0到1轻松学习,方法论及原理、代码、案例应有尽有,所有案例都是按照这样的节奏进行表述。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/673805.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

力扣精选算法100道—— 连续数组(前缀和专题)

连续数组&#xff08;前缀和专题&#xff09; 目录 &#x1f6a9;了解题意 &#x1f6a9;算法原理 ❗为什么hash设置成<0,-1>键值对 ❗与和为K的子数组比较hash的键值对 &#x1f6a9;代码实现 &#x1f6a9;了解题意 我们看到给定数组里面只有0和1&#xff0c;我们…

植物生长调节剂行业调研:预计2029年将达到1.2亿美元

未来增长的重点势必在以中国为代表的亚太地区。尤其在我国农业现代化、无人化发展需求下&#xff0c;提升种植的效率和品质是必然需求&#xff0c;我国市场规模增速也将高于全球平均水平。植物生长调节剂的应用具有成本低、收效快、效益高、节省劳动力的优点&#xff0c;不仅对…

Elasticsearch:使用 LangChain 文档拆分器进行文档分块

使用 Elasticsearch 嵌套密集向量支持 这个交互式笔记本将&#xff1a; 将模型 “sentence-transformers__all-minilm-l6-v2” 从 Hugging Face 加载到 Elasticsearch ML Node 中使用 LangChain 分割器将段落分块成句子&#xff0c;并使用嵌套密集向量将它们索引到 Elasticse…

fghbbbbbbbbbb

欢迎关注博主 Mindtechnist 或加入【Linux C/C/Python社区】一起探讨和分享Linux C/C/Python/Shell编程、机器人技术、机器学习、机器视觉、嵌入式AI相关领域的知识和技术。 磁盘满的本质分析 专栏&#xff1a;《Linux从小白到大神》 | 系统学习Linux开发、VIM/GCC/GDB/Make工具…

Flink Checkpoint过程

Checkpoint 使用了 Chandy-Lamport 算法 流程 1. 正常流式处理&#xff08;尚未Checkpoint&#xff09; 如下图&#xff0c;Topic 有两个分区&#xff0c;并行度也为 2&#xff0c;根据奇偶数 我们假设任务从 Kafka 的某个 Topic 中读取数据&#xff0c;该Topic 有 2 个 Pa…

【Linux】gdb调试与make/makefile工具

目录 导读 1. make/Makefile 1.1 引入 1.2 概念 1.3 语法规则 1.4 示例 2. Linux调试器-gdb 2.1 引入 2.2 概念 2.3 使用 导读 我们在上次讲了Linux编辑器gcc\g的使用&#xff0c;今天我们就来进一步的学习如何调试&#xff0c;以及makefile这个强大的工具。 1. mak…

人工智能基础部分24-人工智能的数学基础,汇集了人工智能数学知识最全面的概况

、 大家好&#xff0c;我是微学AI&#xff0c;今天给大家介绍一下人工智能基础部分24-人工智能的数学基础&#xff0c;汇集了人工智能数学知识最全面的概况&#xff0c;深度学习是一种利用多层神经网络对数据进行特征学习和表示学习的机器学习方法。要全面了解深度学习的数学基…

FlinkSql通用调优策略

历史文章迁移&#xff0c;稍后整理 使用DataGenerator 提前进行压测&#xff0c;了解数据的处理瓶颈、性能测试和消费能力 开启minibatch&#xff1a;"table.exec.mini-batch.enabled", "true" 开启LocalGlobal 两阶段聚合&#xff1a;"table.exec.m…

Leetcode 2641. 二叉树的堂兄弟节点 II

本题为修改给定二叉树中结点的值&#xff0c;修改的规则为&#xff1a;将原来的值替换为该结点所有堂兄弟结点值的和。 其实我们可以延申一下题意&#xff0c;怎样去计算该结点所有堂兄弟结点值的和&#xff1f;其实只需要先计算每一层所有结点的和&#xff0c;再减掉其本身的…

《学成在线》微服务实战项目实操笔记系列(P1~P62)【上】

《学成在线》项目实操笔记系列【上】&#xff0c;跟视频的每一P对应&#xff0c;全系列12万字&#xff0c;涵盖详细步骤与问题的解决方案。如果你操作到某一步卡壳&#xff0c;参考这篇&#xff0c;相信会带给你极大启发。同时也欢迎大家提问与讨论&#xff0c;我会尽力帮大家解…

nginx登录用户验证配置

我们的nginx端口一般都是对外开放的&#xff0c;所以有一定程度上有被别人扫描的风险&#xff0c;所以为了减少被扫描的风险&#xff0c;我们可以配置一个nginx的用户登录验证&#xff1b; 用户验证登录需要nginx的一个模块&#xff1a;ngx_http_auth_basic_module 我们使用…

进程间通信(4):消息队列

先进先出&#xff0c;保证信息的有序性。 函数&#xff1a;msgget(搭配ftok)、msgsnd、msgrcv、msgctl 实现流程&#xff1a; 1、创建消息队列IPC对象 msgget 2、通信(内置函数&#xff1a;msgsnd、msgrcv) 3、删除消息队列IPC对象 msgctl write.c /* * 文件名称&…

PyTorch 2.2 中文官方教程(八)

训练一个玛丽奥玩游戏的 RL 代理 原文&#xff1a;pytorch.org/tutorials/intermediate/mario_rl_tutorial.html 译者&#xff1a;飞龙 协议&#xff1a;CC BY-NC-SA 4.0 注意 点击这里下载完整的示例代码 作者&#xff1a; 冯元松, Suraj Subramanian, 王浩, 郭宇章。 这个…

谈谈安全对抗的本质

前言 红队和蓝队的兄弟们都辛苦了&#xff0c;趁夜深人静的时候写了一点东西&#xff0c;算是一点心得与体会&#xff0c;谈谈安全对抗的本质&#xff0c;仅供大家参考。 今年的活动&#xff0c;笔者和去年一样&#xff0c;镇守公司&#xff0c;运筹帷幄之中&#xff0c;决胜千…

2/7 算法每日N题(二分+双指针)

第一题&#xff1a; class Solution { public:int search(vector<int>& nums, int target) {int left 0, right nums.size() - 1;while(left < right){int mid (right - left) / 2 left;int num nums[mid];if (num target) {return mid;} else if (num >…

Google DeepMind最新研究,将视觉语言大模型作为强化学习的全新奖励来源

论文题目&#xff1a;Vision-Language Models as a Source of Rewards 论文链接&#xff1a;https://arxiv.org/abs/2312.09187 在大型语言模型&#xff08;LLM&#xff09;不断发展的进程中&#xff0c;强化学习扮演了重要的角色&#xff0c;ChatGPT就是在GPT-3.5的基础上经过…

上海泗博HART转ModbusTCP网关HME-635应用案例之组态王和超声波液位计通信

如今工业现场的应用也逐渐把现场的不同应用协议转换成以太网&#xff0c;以此来提升现场的通信速度和质量。Modbus TCP是工业以太网协议的一种&#xff0c;也是现场应用中最常使用的。本应用案例是基于Modbus TCP的组态王和基于HART的超声波液位计之间数据通讯的具体应用。 应用…

c#cad 创建-点(六)

运行环境 vs2022 c# cad2016 调试成功 一、代码说明 创建一个点的命令方法。代码的主要功能是在当前活动文档中创建一个点&#xff0c;并将其添加到模型空间块表记录中。 代码的主要步骤如下&#xff1a; 获取当前活动文档、数据库和编辑器对象。使用事务开始创建点的过程…

【Git版本控制 05】多人协作

目录 一、邀请开发用户 二、新建远程分支 三、拉取远程分支 四、推送远程分支 五、合并远程分支 六、多分支协作 一、邀请开发用户 在windows环境下&#xff0c;再clone同⼀个项⽬仓库&#xff0c;来模拟⼀起协作开发的另⼀名⼩伙伴。 际开发中&#xff0c;每个⽤⼾都有…

vue的8大生命周期

第072个 查看专栏目录: VUE ------ element UI 专栏目标 在vue和element UI联合技术栈的操控下&#xff0c;本专栏提供行之有效的源代码示例和信息点介绍&#xff0c;做到灵活运用。 提供vue2的一些基本操作&#xff1a;安装、引用&#xff0c;模板使用&#xff0c;computed&a…