(四)SQL面试题(连续登录、近N日留存)学习简要笔记 #CDA学习打卡

目录

一. 连续登录N天的用户数量

1)举例题目

2)分析思路

3)解题步骤

(a)Step1:选择12月的记录,并根据用户ID和登录日期先去重

(b)Step2:创建辅助列a_rk(每个userID下的日期排序值)

(c)Step3:创建辅助列起步时间b_createdTime(用登录日期减去排序值,得到新时间列

(d)Step4:根据起步时间列统计连续登录天数

(e)Step5:根据统计结果查询连续登录人数(题目要求连续7天)

二. 近N日留存的用户数及留存率

1)举例题目

2)分析思路

3)解题步骤

(a)Step1:根据用户id和登录日期先去重

(b)Step2:创建新列first_time,获取每个userID下的最早登录日期

(c)Step3:创建辅助列delta_time,用登录日期列减去最早登录日期first_time,得到留存天数

(d)Step4:按first_time列统计不同留存天数对应的次数和即某日的近N日留存数

(e)Step5:用某日的近N日留存数除以首日登录人数即留存率


一. 连续登录N天的用户数量

1)举例题目

现有用户登录表(user_active_Iog)一份,里面有2个字段:userlD(用户ID),createdTime(登录时间
戳),需要统计2021年12月连续登录7天的用户数量。

2)分析思路

题目要求的核心是连续登录,那么我们思考,何为连续登录呢? 顾名思义,连续登录就是指登录的日期连续,那么用数据库的语言来表达的话,我们该描述表达日期连续呢? 我们简化一下数据来考虑这个问题,一般我们有2个办法:

方法A:构造一个连续数字构成的辅助列,用原始日期减去辅助列的数字,得到一个新日期,根据这个新日期来判断是否连续。

方法2:构造一个连续日期构成的辅助列,用原始日期减去这个辅助列的日期,得到一个新数字,最后根据这个数字来判断连续。 

一般我们为了方便统计某一起始时间连续登录了多少天,多半采用方案A。

3)解题步骤

我们接着看,刚才知道了如何在SQL里面如何描述连续登录,接下来我们逐步按照题目要求拆解即可:

(a)Step1:选择12月的记录,并根据用户ID和登录日期先去重

(注:单个用户一天有多行登录数据的情况,只保留1行)

运行结果如下:

(b)Step2:创建辅助列a_rk(每个userID下的日期排序值)

运行结果如下:

(c)Step3:创建辅助列起步时间b_createdTime(用登录日期减去排序值,得到新时间列

运行结果如下:

(d)Step4:根据起步时间列统计连续登录天数

运行结果如下:

(e)Step5:根据统计结果查询连续登录人数(题目要求连续7天)

运行结果如下:

二. 近N日留存的用户数及留存率

1)举例题目

现有用户登录表(user_active log)一份,里面有2个字段:userID(用户ID),createdTime(登录时间 戳),需要统计近1、2、3、5、7、30日留存用户数量及留存率。

2)分析思路

题目要求的核心是近N日留存,那么我们思考,何为近N日留存呢?顾名思义,就是指距离某个日期的间隔为N,那么用数据库的语言来表达的话,我们该描述表达近N日留存呢?

我们简化一下数据来考虑这个问题:构造一个起始日期构成的辅助列,用原始日期减去辅助列的日期,得到一个新数字N,根据这个新数字,结合起始日期来判断某个日期的近N日留存。

3)解题步骤

(a)Step1:根据用户id和登录日期先去重

运行结果如下:

(b)Step2:创建新列first_time,获取每个userID下的最早登录日期

运行结果如下:

(c)Step3:创建辅助列delta_time,用登录日期列减去最早登录日期first_time,得到留存天数

运行结果如下:

(d)Step4:按first_time列统计不同留存天数对应的次数和即某日的近N日留存数

运行结果如下:

(e)Step5:用某日的近N日留存数除以首日登录人数即留存率

运行结果如下:

Bye!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/1128.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数字接龙(蓝桥杯)

文章目录 数字接龙【问题描述】解题思路DFS 数字接龙 【问题描述】 小蓝最近迷上了一款名为《数字接龙》的迷宫游戏,游戏在一个大小为N N 的格子棋盘上展开,其中每一个格子处都有着一个 0 . . . K − 1 之间的整数。游戏规则如下: 从左上…

使用Python进行云计算:AWS、Azure、和Google Cloud的比较

👽发现宝藏 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。【点击进入巨牛的人工智能学习网站】。 使用Python进行云计算:AWS、Azure、和Google Cloud的比较 随着云计算的普及&am…

【网络】Burpsuite学习笔记

文章目录 1.介绍1.1 正常客户端与服务端通信&BurpSuite代理后1.2 下载激活参考地址1.3 代理设置1.4 Proxy SwitchyOmega 使用1.4.1 新建情景模式1.4.2 设置代理1.4.2 应用选项 1.5 FoxyProxy 使用1.6 安装证书1.6.1 方式一1.6.2 方式二1.6.3 浏览器安装证书1.6.4 或者直接双…

Docker - 入门基础

原文地址,使用效果更佳! Docker - 入门基础 | CoderMast编程桅杆https://www.codermast.com/dev-tools/docker/docker-basic.html Docker架构 Docker 使用的是客户端-服务端(C/S)架构模式,使用远程 API 来管理和创建…

llama-factory SFT 系列教程 (四),lora sft 微调后,使用vllm加速推理

文章目录 文章列表:背景简介llama-factory vllm API 部署融合 lora 模型权重 vllm API 部署HuggingFace API 部署推理API 部署总结 vllm 不使用 API 部署,直接推理数据集 tenplatevllm 代码部署 文章列表: llama-factory SFT系列教程 (一)&a…

Python编程的循环结构小示例(二)

Python编程的循环结构小示例(二) 无限循环 在 Python 中,可以使用 while True 来创建一个无限循环。下面是一个简单的示例代码,演示了如何使用 while True 创建一个无限循环: while 1:mystr input(请输入一个字母或…

JUC面试——⭐⭐Java中的四种引用类型/Threadlocal

四种引用类型 Java 中对象的引用分为四种级别,这四种级别由高到低依次为:强引用、软引用、弱引用和虚引用。 基础知识 强引用:普通使用的引用 强引用是造成 Java 内存泄漏的主要原因之一 软引用: GC内存不够时回收 适用于&…

翻译 《The Old New Thing》 - What is the Alt+Tab order?

What is the AltTab order? - The Old New Thing (microsoft.com)https://devblogs.microsoft.com/oldnewthing/20031020-00/?p42093 Raymond Chen 2003年10月20日 AltTab 列表中的图标顺序是如何确定的? 是什么决定了在 AltTab 列表中图标出现的顺序?…

第十五届蓝桥杯题解-数字接龙

题意:经过所有格子,并且不能进行交叉,走的下一个格子必须是当前格子值1%k,输出路径最小的那一条(有8个方向,一会粘图) 思路:按照8个方向设置偏移量进行dfs,第一个到达终…

.NET 设计模式—备忘录模式(Memento Pattern)

简介 备忘录模式,又称之为快照模式(Snapshop Pattern),是一种行为型设计模式,,它允许在不破坏对象封装性的前提下,捕获并保存一个对象的内部状态,以便在需要时恢复该对象到原先的状态。备忘录模式可以为我们…

一台服务器同时启动两个版本jdk

之前Java项目都是1.8的jdk,在服务器部署正常使用,服务器配置环境变量jdk1.8版本。最近一次我用了jdk17版本,部署服务器后,遇见了jdk版本不一致报错 报错内容: 52指向jdk1.8,61指向jdk17,大概就是jdk版本不…

[Java基础揉碎]集合

目录 集合的理解和好处 数组 集合的理解和好处 继承图 ​编辑 简单实例 Collection接口和常用方法 1) add:添加单个元素 2) remove:删除指定元素 3) contains:查找元素是否存在 4) size:获取元素个数 5) isEmpty:判断是否为空 ​编辑 6) clear:清空 7) addAll:添…

acwing算法提高之图论--二分图

目录 1 介绍2 训练3 参考 1 介绍 本专题用来记录二分图的题目。 以下条件互相等价: 一个图是二分图。染色法过程中不存在矛盾。图中不存在奇数环。 二分图本质上是一个无向图的问题! 2 训练 题目1:257关押罪犯 C代码如下, …

数组双指针

力扣26 快慢指针 去掉重复元素 数组 public int removeDuplicates(int[] nums) {int slow 0;int fast 1;int count 0;if (nums.length 1) {return 1;} else {while (fast < nums.length) {if (nums[slow] nums[fast]) {// 若相等 则 fast向前走 slow不动fast;}else{// …

「51媒体」新闻媒体邀约如何进行媒体宣传(方法)

传媒如春雨&#xff0c;润物细无声&#xff0c;大家好&#xff0c;我是51媒体网胡老师。 新闻媒体邀约进行媒体宣传是一个策略性的过程&#xff0c;旨在吸引媒体的注意力并促使其对特定事件、产品发布或企业活动进行报道。以下是一些关键步骤和策略&#xff1a; 制定媒体传播方…

【做一名健康的CSDNer】程序员脱单真的很难吗?

脱单的难易程度并不取决于一个人是否是程序员&#xff0c;而是受到多种因素的影响&#xff0c;包括个人的社交能力、生活方式、个性特点、外貌形象、兴趣爱好等。程序员这个职业群体并不例外。 对于程序员来说&#xff0c;可能面临的挑战包括&#xff1a; 工作时间&#xff1a;…

<计算机网络自顶向下> TCP拥塞

目录 TCP拥塞控制机制 TCP拥塞感知 TCP速率控制方法 TCP拥塞控制和流量控制的联合动作 TCP拥塞控制策略 TCP吞吐量 TCP公平性 TCP拥塞控制机制 端到端的拥塞控制机制 路由器不向主机提供有关拥塞的反馈信息 路由器负担较轻 符合网络核心简单的TCP/IP架构原则 端系统根据自…

Oracle使用内部包自定义创建表空间和用户

如果之前有类似的表空间,可以使用dbms自动生成对应的表空间和数据文件 select dbms_metadata.get_ddl(TABLESPACE,ts.tablespace_name) from dba_tablespaces ts; 可以使用类似的 SQL> set echo off SQL> spool /data/logs/create_tablespace.log SQL> select dbms…

python读取pdf表格并合并为excel

import pdfplumber import pandas as pd import os from openpyxl import load_workbook from datetime import datetime # page_chars最尾部的非空字符 def tail_not_space_char(page_chars):i -1while page_chars[i].get(text).isspace():i i - 1# print(page_chars[i].get…

asp.net core rabbitmq的基本使用

要在 .NET Core 应用程序中实现使用 RabbitMQ 发送和接收消息的简单示例&#xff0c;首先需要在开发机器上安装 RabbitMQ 服务器并运行它。接下来&#xff0c;我们将创建两个控制台应用程序&#xff1a;一个用于发送消息&#xff08;生产者&#xff09;&#xff0c;另一个用于接…