推荐收藏!数据分析岗最走心的面经!

年底了,技术群组织了一场机器学习算法岗技术&面试讨论会,邀请了一些同学分享他们的面试经历,讨论会会定期召开,如果你想加入我们的讨论群或者希望要更详细的资料,文末加入。

喜欢本文记得收藏、关注、点赞 ,下文是我们邀请的一位同学的写的


都说2023年是互联网寒冬,亲身真正经历后来看,深圳寒冬这说法完全不过分。深圳互联网厂太少了,动不动就是锁hc。

历时近2个月,本人面了大部分深圳、一点点上海岗位,把所有的面经做了整合后分享给其他群里的其他伙伴,以此感谢这两个月从技术群也获得的他人经验,也是对最后获得的offer的还愿啦~

写在开头的建议:

真心建议面试前/投简历时先了解清楚在招的岗位是否和自己的能力、职业规划匹配!!如果JD信息不明确,建议先提前沟通清楚,避免面试过程发现不是自己想做的,会很浪费精力(面不过影响情绪,面过也容易被养鱼),还错过了投其他岗位的黄金时间。综合我自己本阶段的几次面试经历,有些公司对数据分析岗的定位是当数据工程来用,工作内容偏数仓搭建、数据治理等;有些是纯业务分析(偏BI),还有一些偏数挖。

自我介绍部分大概准备3分钟,涵盖自己简历上最近一份工作的内容、项目。面试官大多不会提前看简历的,所以自我介绍的时候其实是给对方留时间看你的简历,这样有助于对方基于简历问你的项目。我试过自我介绍的时间太短,面试官只够看我一个项目的内容,后面就只问了我这个项目的一些信息后就开始考他们的业务题了,完全没有机会让你展示自己以前的丰功伟绩。。。后面调整后,和面试官对于简历上的项目聊的也更多了。

准备一个自己做过的比较完整的数分项目/数分例子的介绍。包括项目背景、自己负责什么、怎么做了、效果怎么样。(最好能完整的讲一个故事出来,有些公司会在意和业务方的合作模式,做个主动推动的数分。。)

还是得稍微刷下sql题的。。。太久没用有点生疏第一次被考的时候懵了。。。主要是窗口函数,考来考去都是它。基本上字节、虾皮、富途都会考。

2个月里,一边面试一边完善自己的知识库(大概是过去和未来3年的知识巅峰吧hhh),前前后后面试了10+公司吧。。

面经正文:

字节

(我共面了3个部门的岗位,有不合适的,也有到谈薪阶段的,面试题都混来在一起了。字节的hr有多热情,面试官就有多无情hhh。只要不是能力问题,都会被秒换部门继续约面。。所以要有不怕挂的精神,毕竟面试官觉得你适不适合也是很玄学的事)

基于我的项目里的指标体系的建设讲解:为什么选择渗透率而不是DAU?双边市场的指标,认为哪方更重要,为什么?

怎么选择北极星指标

举个自己做数据分析有落地的例子(挑自己的一个项目,把前因后果讲清楚)

aha moment的拐点分析,为什么选择留存指标作为y轴?

项目里的分群划分标准和方式。

推荐效果指标不好,产品说推荐算法不准,没有把内容精准推给用户;算法说是内容质量问题,怎么评估这个问题?

AB两个人,A有100个硬币,B有99个硬币,正1分,负0分,最后得分A>B的概率。(答案:1/2。参考答案)

如果要提升复购率怎么做分析?

项目里做了实时看板,问看板的设计逻辑?

怎么判断用户流失?流失周期怎么设定?

新用户发券ROI怎么衡量?——其实是想引申出ab实验设计、最小样本量设计(众所周知字节喜欢问ab,不过这个ab问的很有技巧。)

在印尼公交车站上广告牌,怎么衡量广告牌的转化提升?—— DID,PSM(在其他区域寻找相似人群的数据,DID对比),用新增购买UV来做衡量指标

效果评估有什么方法,怎么去除干扰因素?

不做abtest的话,对于新业务有什么评估方式?

最近常用的app,分析优势、劣势(可以挑个自己的产品好好准备下,被给自己挖坑,我挖了个我觉得推荐的内容不丰富/重复的坑,然后跳进去出不来了。。。)

针对问题(推荐的内容重复),如何通过数据分析进行证明。衡量指标怎么选择?

针对问题(推荐的内容重复),有什么改进的方法建议,推荐侧&产品侧。。(太产品了这个问题,我和运营打交道比较多)

富途

问项目(指标体系、用户分群之类的,只记得研究概率题,忘了其他。。)

公司里面男性有60人,女性有40人,男性穿皮鞋的人数有25人,穿运动鞋的人数有35人,女性穿皮鞋的人数有10人,穿高跟鞋的人数有30人。现在你只知道有一个人穿了皮鞋,请预测一下ta的性别。(我认为都是已知条件所以没用条件概率,后面用条件概率算发现答案也一样)

A,B两个人打赌,让第三人C来抛硬币,C负责拿一个硬币不停地抛,A说“只要有先出现一次正面再出现一次反面的情况就算我赢”,B说“只要出现了连续的两次反面就算我赢”,然后C开始抛,只要没出现他们所说的任何一种情况就要继续抛,出现了任一个结果则停止,请计算A的胜率。(提示后答了3/4。答案参考)

设计一个指标量化某只股票的舆情情况(已知每条咨询内容的舆情分)

富途还面了一个偏工程的岗,后面发现岗位不对口,不过面试官小姐姐很nice,讲清楚岗位不对口后两个人在唠嗑hhh互相了解对方数仓建设情况。。。

平安金融(三面的面试官和我说面试通过了很期待我加入,但还有第四面要和她的领导聊,给我打了预防针这个流程会很长。。。长到我听说平安在锁hc和裁员。。。长到我都入职其他公司了。。。也没通知第四面。。。面试题没怎么记,主要还是针对项目问)

指标体系搭建

用户分群的项目举例做了什么,模型是怎么落地和评估的

业务题:想从300亿收入提升至500亿 ,怎么做?

业务题:怎么对大客户做分析和运营?

顺丰

项目引申:指标建设-效果评估

psm:怎么解决无法穷尽因子的问题,证明两个群体相似,达到类ABtest?

答用SMD做平衡性检验,除此还有什么办法?

业务题,某个时间点的销售提升率同比上年下降了,怎么做分析?(一步步引导你往下挖,直到你找到了原因)

怎么去衡量不同因子的影响权重?

SQL题,就是处理以上业务题对应的表,怎么生成2个时间序列?

虾皮

(也面了两个部门,也有不对口的。。心累)

北极星指标设计等

举一个数据分析有落地的案例(来了又来了)

介绍一个做用户增长的案例(又。。)

SQL题:怎么计算连续登陆三次失败后登陆成功的比例?login_table(dt, userid, flag, timestamp) ——窗口函数&left join (或者lag/lead)

看板题:设计地铁站的运营看板

业务分析题:怎么提升某个地铁站的用户满意度?(重点是要去收集数据做分析。)

oppo

(JD上的要求就是面试官的问题,而且两面问的问题差不多。面试有多简单,后面的hr流程就有多败好感了。。好多人都反馈被养鱼)

数据埋点怎么设计

异常的识别和归因,怎么高效识别异常,怎么做归因分析

数据指标体系建设案例介绍和理解

xgb和lgbm的不同点

ab实验的举例,最小样本考虑,效果可行度检验(还是介绍自己的项目)

举例数据分析对业务的影响

对数据分析师的理解

技术交流

独学而无优则孤陋而寡闻,技术要学会交流、分享,不建议闭门造车。

建立了技术交流与面试交流群,面试真题、答案获取,均可加交流群获取,群友已超过2000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友。

方式①、微信搜索公众号:Python学习与数据挖掘,后台回复:交流
方式②、添加微信号:dkl88194,备注:交流

资料
我们打造了《数据分析实战案例宝典》,特点:从0到1轻松学习,方法论及原理、代码、案例应有尽有,所有案例都是按照这样的节奏进行表述。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/673531.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Springboot项目报文加密(AES、RSA、Filter动态加密)

Springboot项目报文加密(AES、RSA、Filter动态加密) 一、痛点1.1、初版报文加密二、前期准备2.1、AES加密2.2、RSA加密2.3、国密算法概述2.4、国密SM22.5、国密SM32.6、国密SM42.7、JAVA中的拦截器、过滤器2.8、请求过滤器2.9、响应过滤器2.10、登录验证码2.11、BCrypt非对称…

C++ STL

STL 标准模版库 STL 从广义上分为容器 算法 迭代器 容器 (算法之间通过迭代器进行无缝链接) STL几乎所有的代码都采用了模版类或者模版函数 STL六大组件 分别是容器 算法 迭代器 仿函数 适配器(配接器)空间配置器 容器 各种…

【Git版本控制 04】标签管理

目录 一、创建标签 二、查看标签 三、推送标签 四、删除标签 一、创建标签 标签tag,是对某次 commit 的⼀个标识,相当于起了⼀个别名。 相较于难以记住的 commit id , tag 很好的解决这个问题,因为 tag ⼀定要给⼀个让⼈容易…

使用ChatGpt和文心一言辅助文章创作

近期在写数字水浒系列文章,使用了ChatGpt和文心一言进行辅助创作,整体感受不错,提高了工作效率。 在使用过程中,感觉文心的中文能力更强一些,主要体现在: 1 语料库更大,比如对水浒传了解的更多…

Text2SQL研究-Chat2DB体验与剖析

文章目录 概要业务数据库配置Chat2DB安装设置原理剖析 小结 概要 近期笔者在做Text2SQL的研究,于是调研了下Chat2DB,基于车辆订单业务做了一些SQL生成验证,有了一点心得,和大家分享一下.: 业务数据库设置 基于车辆订…

Linux第43步_移植ST公司uboot的第4步_uboot测试

uboot移植结束后,需要进行测试。 1、烧录程序 1)、将STM32MP157开发板的网络接口与路由器的网络接口通过网线连接起来。 2)、将开发板的串口和电脑通过USB线连接起来。 3)、将开发板的USB OTG接口和电脑通过USB线连接起来。 4)、将开发板上拨码开关拨到“000”…

鸿蒙(HarmonyOS)项目方舟框架(ArkUI)之ScrollBar组件

鸿蒙(HarmonyOS)项目方舟框架(ArkUI)之ScrollBar组件 一、操作环境 操作系统: Windows 10 专业版、IDE:DevEco Studio 3.1、SDK:HarmonyOS 3.1 二、ScrollBar组件 鸿蒙(HarmonyOS)滚动条组件ScrollBar&…

Leetcode3020. 子集中元素的最大数量

Every day a Leetcode 题目来源:3020. 子集中元素的最大数量 解法1:哈希 枚举 用一个哈希表统计数组 nums 中的元素及其出现次数。 暴力枚举数组中的数,作为 x,然后不断看 x2,x4,⋯ 在数组中的个数。直到个数不足 2 个为止&a…

搭建macOS开发环境-1:准备工作

请记住: 最重要的准备工作永远是:备份数据 !!! 通过图形界面检查 Mac 的 CPU 类型: 在搭载 Apple 芯片的 Mac 电脑上,“关于本机”会显示一个标有“芯片”的项目并跟有相应芯片的名称: 通过命令行检查Mac的CPU类型 …

使用vite创建vue+ts项目,整合常用插件(scss、vue-router、pinia、axios等)和配置

一、检查node版本 指令:node -v 为什么要检查node版本? Vite 需要 Node.js 版本 18,20。然而,有些模板需要依赖更高的 Node 版本才能正常运行,当你的包管理器发出警告时,请注意升级你的 Node 版本。 二、创…

七、Nacos源码系列:Nacos服务发现

目录 一、服务发现 二、getServices():获取服务列表 2.1、获取服务列表 2.2、总结图 三、getInstances(serviceId):获取服务实例列表 3.1、从缓存中获取服务信息 3.2、缓存为空,执行订阅服务 3.2.1、调度更新,往线程池中…

【Spring】Tomcat服务器部署

📝个人主页:五敷有你 🔥系列专栏:Spring⛺️稳中求进,晒太阳 单体项目部署 本地工作 项目在本地开发完毕之后进行一些必要参数的修改。 比如: 数据库的JDBC的配置文件,还有前端页面的…

项目02《游戏-06-开发》Unity3D

基于 项目02《游戏-05-开发》Unity3D , 接下来做 背包系统的 存储框架 , 首先了解静态数据 与 动态数据,静态代表不变的数据,比如下图武器Icon, 其中,武器的名称,描述&#xff…

Swift Combine 发布者publisher的生命周期 从入门到精通四

Combine 系列 Swift Combine 从入门到精通一Swift Combine 发布者订阅者操作者 从入门到精通二Swift Combine 管道 从入门到精通三 1. 发布者和订阅者的生命周期 订阅者和发布者以明确定义的顺序进行通信,因此使得它们具有从开始到结束的生命周期: …

课时17:本地变量_命令变量

2.2.3 命令变量 学习目标 这一节,我们从 基础知识、简单实践、小结 三个方面来学习。 基础知识 基本格式 定义方式一:变量名命令注意: 是反引号定义方式二:变量名$(命令)执行流程:1、执行 或者 $() 范围内的命令…

pycharm像jupyter一样在控制台查看后台变量

更新下:这个一劳永逸不用一个一个改 https://blog.csdn.net/Onlyone_1314/article/details/109347481 右上角运行

Spring IoC容器(四)容器、环境配置及附加功能

本文内容包括容器的Bean 及 Configuration 注解的使用、容器环境的配置文件及容器的附加功能(包括国际化消息、事件发布与监听)。 1 容器配置 在注解模式下,Configuration 是容器核心的注解之一,可以在其注解的类中通过Bean作用…

DevOps落地笔记-20|软件质量:决定系统成功的关键

上一课时介绍通过提高工程效率来提高价值交付效率,从而提高企业对市场的响应速度。在提高响应速度的同时,也不能降低软件的质量,这就是所谓的“保质保量”。具备高质量软件,高效率的企业走得更快更远。相反,低劣的软件…

消息中间件之RocketMQ源码分析(八)

RocketMQ中的消息过滤 RocketMQ设计了消息过滤,来解决大量无意义流量的传输:即对于客户端不需要的消息, Broker就不会传输给客户端,以免浪费宽带,RocketMQ4.2.0支持Tag过滤、SQL92过滤、Filter Server过滤 Tag过滤 第一步:用户发…

蓝桥杯Web应用开发-CSS3 新特性【练习三:文本阴影】

文本阴影 text-shadow 属性 给文本内容添加阴影的效果。 文本阴影的语法格式如下: text-shadow: x-offset y-offset blur color;• x-offset 是沿 x 轴方向的偏移距离,允许负值,必须参数。 • y-offset 是沿 y 轴方向的偏移距离&#xff0c…