2024年最全网易大数据面试题及参考答案(3万字长文持续更新)

目录

如何评价新用户的留存指标有哪些?

游戏业务中有哪些常用指标?

怎么制定游戏业务的目标

游戏业务中哪三个业务最重要

数据分析指标的阈值怎么确定

怎么衡量你在业务部门的贡献

如何衡量一个活动的ROI

跟领导汇报游戏业务,你会选择哪5个指标,为什么

介绍一下Hadoop架构的组件?

简单介绍map reduce和Spark它们之间有什么区别,哪个性能方面更好以及适用于哪一些场景?

MapReduce

Spark

性能比较

两个活动对比 一个活动留存较高,给出可能的原因,会用到哪些数据

月活不变周活下降,原因?怎么验证?

用户粘性不高怎么解决?

数据分析的认识?

数据分析职业的规划?

数据挖掘和数据分析的区别?你的偏好?

一款游戏,月活没变,周活下降,分析原因

如果现在给出几个日志记录的字段(时间、登录状态、id等等),你能提取什么信息分析什么结论

某款游戏的DAU突然下降你会怎么分析

数据库三范式知道么?

增量表和全量表优缺点?

内部表和外部表区别?

left join和full join区别?

Flume的应用场景?

如何实现的数据采集?

离线数仓整个体系的分层?

从原始数据层ODS到汇总数据仓DWD再到应用数据层中间的数据处理是怎么做的?

spark集群低带宽怎样从大数据量中找中位数

如果各层时使用的是hive sql进行数据处理的,那么应该有类似于ETL任务调度,那这种调度在终端中是怎么实现的?

离线数据调度都是手动写好脚本定时来执行?

有没有用过spark做一些处理?

数仓全量和增量是怎么做的?

客户端和服务端的日志采集最终是写到Kafka,那么kafka再到Hadoop的中间过程是怎么实现的?

介绍一下Kafka的集群架构?

BI工具在业务上又是干嘛用的?

mqsql数据库的索引机制?

索引是基于什么实现的?

离线数仓什么样的数据会放到mysql里面?

MySQL的事务和基本原则

MySQL的默认事务隔离级别

不同的隔离级别会出现哪一些问题,简单描述一下?

为什么会造成数据的脏读和幻读?

Java的JVM机制

Spring Boot机制

shell中的vim如何退出,退出会保存吗?

怎么查一个CPU占用较高的线程?

讲个干货Flink的内存管理模型

Flink checkpoints和barrier是同时进行的吗?

迪卡尔积会产生什么问题?

迪卡尔积会产生数据倾斜吗?

为什么数据存入HDFS还要再倒入NoSQL,为什么HDFS对OLAP支持不友好?

Spark任务执行全过程

数据倾斜了怎么办?

在数据仓库中,如果一个数据,维度很多,怎么展示?

维护多个版本需要较多的成本,该怎么解决这个问题

介绍一下Hadoop,简单说了一下Hadoop的组成和定义

介绍一下MR的原理(工作流程,Map-Shuffle-Reduce)

Hadoop数据倾斜的解决方案(Combiner、局部聚合加全局聚合、自定义分区、增加JVM内存)

HiveSQL 数据倾斜和 Spark 数据倾斜

MR 和 Spark 有哪些区别,分别适用什么场景

数仓怎么设计的

数仓ODS层存在的意义

数仓DWD和DIM怎么设计的,有什么指标

数仓DWS层存放的哪些指标

HBase RowKey 设计原则

Flume、Flink CDC 和 DataX 的区别

开发统计某app用户各功能使用时长,整个流程怎么实现,怎么优化,怎么横向拓展

统计评估各个网页的重要性,采取的算法思路,Spark代码实现

网易云课堂突然订阅量下降,怎么定位分析原因

在各个平台投放简历,怎么评估效果

Kafka结构,怎样防止脑裂,为什么最新版本不用zookeeper来维护offset

SQL 提取连续两天登录的用户


如何评价新用户的留存指标有哪些?

在评估新用户的留存时,通常会关注一系列关键指标来衡量用户在不同时间段内的留存情况。这些指标包括但不限于:

  • 次日留存率(D1):指用户在首次使用后的第二天仍继续使用的比例。这是一个非常重要的早期信号,可以用来快速判断产品的吸引力和用户体验是否良好。

  • 七日留存率(D7):表示用户在首次使用后第七天仍然活跃的比例。与次日留存相比,这个指标更能够反映用户对产品的真实兴趣和忠诚度。

  • 三十日留存率(D30):衡量用户在注册或下载应用后的第30天仍然活跃的比例。这是评估长期用户价值的一个重要指标,因为只有真正喜欢并持续使用产品的用户才会在这个阶段仍然留存下来。

  • 长期留存率:除了上述短期留存率之外,还需要关注更长周期的留存率,比如90天、180天乃至一年以上的留存率。这些数据对于理解用户的生命周期价值至关重要。

为了更好地

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/49506.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【openavis】明厨亮灶算法仓

明厨亮灶算法仓主要用于学校食堂,餐厅等饮食卫生安全监管场景,目前包含的算法如下: 算法类型 算法卡片 明厨亮灶算法仓 老鼠检测 垃圾桶未盖 厨师服检测 厨师帽检测 口罩检测 手套检测 动火离人 1. 算法规格介绍: 算…

基于STM32瑞士军刀--【FreeRTOS开发】学习笔记(一)|| RISC / 底层代码执行步骤 / 汇编指令

本篇文章基于韦东山老师讲课笔记和自己理解编写。 RISC ARM芯片属于精简指令集计算机(RISC:Reduced Instruction Set Computing),它所用的指令比较简单,有如下特点: ① 对内存只有读、写指令 ② 对于数据的运算是在CPU内部实现 …

【MySQL进阶之路 | 高级篇】MVCC解决读写问题

1. 什么是MVCC MVCC (Multiversion Concurrency Control),多版本并发控制。顾名思义,MVCC是通过数据行的多个版本管理来实现数据库的并发控制。这项技术使得在InnoDB的事务隔离级别下执行一致性读操作有了保证。换言之,就是为了查询一些正在…

你在找提升效率的解决方案还是追求效果的解决方案

企业在寻求“解决方案”时,最好先想清楚,你是想提升某项工作的效率,还是要改善某项工作的效果? 提升效率的解决方案主要是为了在保证质量的前提下提升某项确定工作的完成速度。以政务解决方案为例:当任何人都能通过移…

[C++] 小游戏 斗破苍穹2.12.2版本 zty出品

大家好&#xff0c;今天zty带来的是斗破苍穹的 2.12.2 版本&#xff0c;这个版本改进了许多皇冠竞技场的bug&#xff0c; 和一些文字仅存在一瞬间便消失了&#xff0c;废话不多说&#xff0c;请看code 先赞后看 养成习惯 CODE #include<stdio.h> #include<iostrea…

因即果,果即因

“有因才有果”、“先有因&#xff0c;后有果”&#xff0c;是人们通常的认知。 事实上有时可以理解为先有果再有因&#xff0c;为了某个果而造了某个因。 时间的方向可以理解为双向的——事情先发生了&#xff0c;然后给一个解释。 例如&#xff0c;某个人为了实现某个目标…

HAL STM32 SPI/ABZ/PWM方式读取MT6816磁编码器数据

HAL STM32 SPI/ABZ/PWM方式读取MT6816磁编码器数据 &#x1f4da;MT6816相关资料&#xff08;来自商家的相关资料&#xff09;&#xff1a; 资料&#xff1a;https://pan.baidu.com/s/1CAbdLBRi2dmL4D7cFve1XA?pwd8888 提取码&#xff1a;8888&#x1f4cd;驱动代码编写&…

某量JS逆向

https://chat.sensetime.com/wb/chat 目录 一、发起请求 二、观察发现只有入参 __data__ 进行了加密&#xff0c;返回是明文 三、 观察JS调用栈 四、从JS中搜索 __data__ 五、使用XHR对Ajax请求进行断点 六、再次发起请求就会断点拦住请求 七、对XHR入口分析 八、逐个…

【C++】选择结构- 嵌套if语句

嵌套if语句的语法格式&#xff1a; if(条件1) { if(条件1满足后判断是否满足此条件) {条件2满足后执行的操作} else {条件2不满足执行的操作} } 下面是一个实例 #include<iostream> using namespace std;int main4() {/*提示用户输入一个高考分数&#xff0c;根据分…

学习C语言第12天(数组练习)

1.走台阶问题 设一个函数fit(n)是求n阶台阶有几种走法 第一步迈1个台阶 那有fit(n-1)种走法 第一步迈连个台阶 有fit(n-2)种走法 所以n阶台阶一共有fit(n-1)fit(n-2)种走法 斐波那契数列int fit(int n) {if (n < 2)return n;elsereturn fit(n - 1) fit(n - 2); } in…

花几千上万学习Java,真没必要!(二十九)

1、基本数据类型包装类&#xff1a; 测试代码1&#xff1a; package apitest.com; //使用Integer类的不同方法处理整数。 //将字符串转换为整数&#xff08;parseInt&#xff09;和Integer对象&#xff08;valueOf&#xff09;&#xff0c; //将整数转换回字符串&#xff08;…

LeetCode19 删除链表的倒数第N个结点

前言 题目&#xff1a; 19. 删除链表的倒数第N个结点 文档&#xff1a; 代码随想录——删除链表的倒数第N个结点 编程语言&#xff1a; C 解题状态&#xff1a; 成功解答&#xff01; 思路 最直接的想法就是先获取到链表的整体长度&#xff0c;减去倒数的个数&#xff0c;正向…

【计算机网络】DNS命令练习与抓包分析实验

一&#xff1a;实验目的 1&#xff1a;掌握DNS缓存的清除方法&#xff0c;了解DNS缓存的作用和影响。 2&#xff1a;熟悉nslookup和dig等DNS查询工具的使用&#xff0c;理解DNS查询的基本原理和过程。 3&#xff1a;通过抓包和分析&#xff0c;深入了解DNS查询和响应消息的格…

html+css 实现悬浮按钮

前言&#xff1a;哈喽&#xff0c;大家好&#xff0c;今天给大家分享htmlcss 绚丽效果&#xff01;并提供具体代码帮助大家深入理解&#xff0c;彻底掌握&#xff01;创作不易&#xff0c;如果能帮助到大家或者给大家一些灵感和启发&#xff0c;欢迎收藏关注哦 &#x1f495; 文…

Python+Flask+MySQL+日线指数与情感指数预测的股票信息查询系统【附源码,运行简单】

PythonFlaskMySQL日线指数与情感指数预测的股票信息查询系统【附源码&#xff0c;运行简单】 总览 1、《股票信息查询系统》1.1 方案设计说明书设计目标工具列表 2、详细设计2.1 登录2.2 程序主页面2.3 个人中心界面2.4 基金详情界面2.5 其他功能贴图 3、下载 总览 自己做的项…

pytorch 源码阅读(3)——torch.fx

0 概述 FX 是一个供开发者用来转换 nn.Module 实例的工具包。FX 包含三个主要组件&#xff1a;符号跟踪器&#xff08;symbolic_traced&#xff09;、中间表示&#xff08;intermediate representation&#xff0c;IR&#xff09;和Python 代码生成&#xff08;Code generatio…

【iOS】——属性关键字

属性关键字的类型 在iOS中属性关键字分为四种类型&#xff1a; 可访问性: readonly ,readwrite原子性 &#xff1a; atomic &#xff0c;nonatomic内存管理 &#xff1a; retain/strong/copy&#xff0c; assign/unsafe_unretained&#xff0c;weak方法命名&#xff1a;sette…

W3C XML Schema 活动

关于《W3C XML Schema 活动》的信息&#xff0c;我找到了一些相关资料。XML Schema 是一种基于 XML 的DTD&#xff08;文档类型定义&#xff09;替代物&#xff0c;它提供了对应用程序、文档结构、属性和数据类型的更好支持。XML 1.0 版本支持可定义文档结构的DTD&#xff0c;而…

Linux 动静态库

一、动静态库 1、库的理解 库其实是给我们提供方法的实现&#xff0c;如上面的对于printf函数的实现就是在库中实现的&#xff0c;而这个库也就是c标准库&#xff0c;本质也是文件&#xff0c;也有对应的路径 2、区别 静态库是指编译链接时&#xff0c;把库文件的代码全部加入…

前端canvas——赛贝尔曲线

曲线之美&#xff0c;不在于曲线本身&#xff0c;而在于用的人。 所以就有了这期赛贝尔曲线。 新规矩&#xff0c;先上个GIT。 效果图 开局一张图&#xff0c;代码全靠编。 代码 画骨 先想着怎么画一个心形吧&#xff0c;等你想好了&#xff0c;就知道怎么画了。 首先就还…