拼多多笔试

拼多多2022数据分析笔试(0822)

一、选择题

1.已知样本量n,样本均值及方差求置信区间

2.决策树

3.峰度系数

4.协方差

5.第一、第二熵变

6.充分统计量

7.xgboost

8.方差分析中的多重比较

二、编程题

1. 一张用户点击路径的表,找出某一日用户路径为店铺页-商详页-下单页的用户数(本人用的是笛卡尔积三张表where限制条件通过)

CREATE TABLE log_info (
      uid varchar(255)
    , page_name varchar(255)
    , starttime varchar(255)
    , rnk int
    , dt date
    )
;

INSERT INTO log_info
    (uid,page_name,starttime,rnk,dt)
VALUES
    ('un670', '首页', '2021-08-10 08:01:00',1,'2021-08-10'),
    ('un670', '商详页', '2021-08-10 08:01:10',2,'2021-08-10'),
    ('un670', '店铺页', '2021-08-10 08:01:20',3,'2021-08-10'),
    ('un670', '商详页', '2021-08-10 08:01:30',4,'2021-08-10'),
    ('un670', '下单页', '2021-08-10 08:01:40',5,'2021-08-10'),
    ('un123', '首页', '2021-08-10 00:02:00',1,'2021-08-10'),
    ('un123', '商详页', '2021-08-10 00:03:00',2,'2021-08-10'),
    ('un123', '店铺页', '2021-08-10 00:04:00',3,'2021-08-10'),
    ('un123', '商详页', '2021-08-10 00:05:00',4,'2021-08-10'),
    ('un123', '商详页', '2021-08-10 00:06:00',5,'2021-08-10')
;

2021-08-10|1

2. 一张活跃商品表,找出2021-08-02和2021-08-03新增活跃商品数,新增活跃商品数定义为今日活跃但昨日不活跃的商品(本人用(date,goods_id) not in (选出今日活跃昨日也活跃的商品)作为限制通过)

-- CREATE DATABASE test;
-- use test;
CREATE TABLE act_goods_d(
     stat_date  DATE
    ,goods_id   BIGINT
);
    
INSERT INTO act_goods_d
    (stat_date, goods_id)
VALUES
 ('2021-08-01', 27923)
,('2021-08-01', 23456)
,('2021-08-01', 86534)
,('2021-08-02', 27923)
,('2021-08-02', 23456)
,('2021-08-02', 23545)
,('2021-08-03', 23456)
,('2021-08-03', 23545)
,('2021-08-03', 98213)
;

2021-08-02|1
2021-08-03|1

3. 一张用户点击表,一张用户下单表,找出某一日点击商品数和引导下单量,引导下单量定义为在同一日点击商品到下单的单量,注意点击时间要早于下单时间,比较简单,要用的date_format

CREATE TABLE flow_clk_i_d (
     clk_time   VARCHAR(30)
    ,uid        BIGINT
    ,goods_id   BIGINT
);
INSERT INTO flow_clk_i_d
    (clk_time, uid, goods_id)
VALUES
 ('2021-08-06 11:30:50', 2111, 27023)
,('2021-08-07 12:30:56', 2133, 27023)
,('2021-08-07 15:46:23', 2132, 21346)
,('2021-08-07 15:50:56', 2132, 27053)
,('2021-08-07 20:46:23', 2133, 21348)
,('2021-08-07 20:50:56', 2132, 27023)
,('2021-08-08 20:46:23', 2132, 21346)
;
 
CREATE TABLE ordr_goods_i_d (
     ordr_time VARCHAR(30)
    ,ordr_id   BIGINT
    ,uid       BIGINT
    ,goods_id  BIGINT
);
INSERT INTO ordr_goods_i_d
    (ordr_time, ordr_id, uid, goods_id)
VALUES
 ('2021-08-07 10:48:29', 641841, 2132, 21346)
,('2021-08-07 15:48:29', 642841, 2132, 21346)
,('2021-08-07 12:46:45', 753473, 2132, 27023)
,('2021-08-07 12:46:45', 763473, 2133, 27123)
;

2021-08-07|2|1

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/22252.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

FL Studio21.2.8中文版水果音乐制作的革新之旅!

在数字化浪潮的推动下,音乐制作领域经历了翻天覆地的变化。从最初的模拟技术到如今的全数字化处理,音乐制作的门槛被大幅降低,越来越多的音乐爱好者和专业人士开始尝试自行创作和编辑音乐。在这个过程中,各种专业音乐制作软件成为…

勒索软件分析_目标文件扫描行为分析

BlackBasta首先通过 FindFirstVolumeW 与 FindNextVolumeW 实现系统中第一个卷的搜索和其余卷的遍历,之后通过 GetVolumePathNamesForVolumeNameW 检索指定卷的驱动器号和挂载的文件夹路径列表,然后通过 GetVolumeInformationW 获取关于指定卷的信息,具体代码如下所示。 Fin…

Numpy切片操作

基本切片: arr[start:stop:step]: 从索引start开始到stop结束(不包括stop),步长为step。 省略切片: arr[:]: 复制整个数组。arr[:5]: 选择数组的前5个元素。arr[5:]: 选择从索引5开始到数组末尾的元素。 步长切片: arr[::2]: 选择数组中的每个…

几何(geometry)

题目描述 小可可最近在学习平面几何! 给定平面上的 n n n个点 ( x 1 , y 1 ) , ( x 2 , y 2 ) , … , ( x i , y i ) (x_1,y_1),(x_2,y_2),…,(x_i,y_i) (x1​,y1​),(x2​,y2​),…,(xi​,yi​)。 根据题目要求,输出下列两个值其中一个: 任意两点间欧几里得距…

yolov8逐步分解(9)_训练过程之Epoch迭代过程

yolov8逐步分解(1)--默认参数&超参配置文件加载_yolov8 加载yaml配置 预测-CSDN博客 yolov8逐步分解(2)_DetectionTrainer类初始化过程_train and val are required in all data yamls.-CSDN博客 yolov8逐步分解(3)_trainer训练之模型加载_yolov8 加载模型-CSDN博客 YOL…

TCP 建链(三次握手)和断链(四次握手)

TCP 建链(三次握手)和断链(四次挥手) 背景简介建链(三次握手)断链(四次挥手)序号及标志位延伸问题为什么建立连接需要握手三次,两次行不行?三次握手可以携带数…

智领未来,安全无忧:智能网联汽车监控大屏的守护之旅

在繁忙的都市中,驾驶者往往面临着诸多安全隐患。传统的驾驶辅助系统虽然能够提供一定的帮助,但在复杂多变的交通环境中,其局限性也逐渐显现。而智能网联汽车安全监控大屏,正是为了解决这一问题而诞生的。 山海鲸可视化大屏 大屏采…

基础篇04——多表查询

多表关系 一对多 多对多 多对多是通过中间表实现的 -- 创建学生表 create table student (id int auto_increment primary key comment ID,name varchar(10) comment 姓名,no varchar(3) comment 学号 ) comment 学生表;insert into student values (null, 黛绮丝, 001),(…

SLAM中四元数、流形、李群、李代数是啥?

知识点得逻辑关系如下 引言 非线性问题由于复杂的数学结构,多样的解空间,局部极值等问题求解难度大大增加。所以在求解时需要把非线性问题转化为更容易处理的形式,例如 数值优化方法:数值优化方法包括梯度下降、共轭梯度法、牛顿…

Spring boot实现基于注解的aop面向切面编程

Spring boot实现基于注解的aop面向切面编程 背景 从最开始使用Spring,AOP和IOC的理念就深入我心。正好,我需要写一个基于注解的AOP,被这个注解修饰的参数和属性,就会被拿到参数并校验参数。 一,引入依赖 当前sprin…

寒武纪:“国产平替”道阻且长

英伟达的一季报反映了AI装备竞赛白热化,科技巨头们正疯狂加码投资。 不过,因为众所周知的原因,英伟达最先进的产品卖不到国内,虽然说一定程度上限制了咱们AI的发展,但也给国产AI芯片公司们提供了机会,其中就包括我们今…

K8S==ingress简单搭建和使用

基础环境 D:\DOCKER_REPO\K8S>kubectl version Client Version: v1.29.2 Kustomize Version: v5.0.4-0.20230601165947-6ce0bf390ce3 Server Version: v1.29.2 D:\DOCKER_REPO\K8S>kubectl get nodes NAME STATUS ROLES AGE VERSION docker-…

null、未定义或未声明的变量之间有什么区别?

在 JavaScript 中,null、未定义的变量和未声明的变量之间存在以下区别: null:null 是一个特殊的值,表示"没有值"或"无"。它是一个关键字,可以被显式地赋值给一个变量。使用 typeof null 会返回 "object"(这是 JavaScript 的一个已知的设计缺陷)…

01_深度学习基础知识

1. 感知机 感知机通常情况下指单层的人工神经网络,其结构与 MP 模型类似(按照生物神经元的结构和工作原理造出来的一个抽象和简化了模型,也称为神经网络的一个处理单元) 假设由一个 n 维的单层感知机,则: x 1 x_1 x1​ 至 x n x_n xn​ 为 n 维输入向量的各个分量w 1 j…

【大学物理】Interference,diffraction,polarization:光学

nature of light definition speed of light reflection dispersion huygenss principle:惠更斯原理

OBD诊断协议

上周领导需要做个OBD相关的功能,我对OBD没有啥概念,于是周末就了解下这到底是个啥东西。了解过后发现很简单,其实就是个UDS协议的简化版,OBD是英文On-Board Diagnostics的缩写,中文翻译为“车载自动诊断系统”&#xf…

链表反转--理解链表指针的基本操作

链表反转--理解链表指针的基本操作 链表反转的方法--主要是理解链表指针链表心得类节点是对象和指针区别: 链表反转的方法–主要是理解链表指针 根据值创建新列表 用一个链表指针代替整个新链表 两个链表的赋值 递归求解反向链表 用一个链表代替前后链表数…

Qt应用程序发布

一、静态编译发布 1.0:以Release模式构建工程 1.1:查看当前构建生成路径,并将所生成的.exe单独拷贝出来 1.2:将可执行文件*.exe拷贝至任一目标文件夹:D:\Temporary\QQIF 2:查看安装Qt时发布工具windeployqt.exe所在的目录 windeployqt.exe在Qt开发套件的bin目录下。Qt的每…

功能模块图 自动绘制

功能模块图展示了系统中各个功能模块及其之间的关系。我们可以使用Python代码生成一个简单的功能模块图。 假设我们有一个在线购物系统,功能模块图包括以下模块: 用户管理商品管理订单管理支付管理购物车管理这些模块的关系如下: 用户管理模块依赖于订单管理和购物车管理模…