Sql刷题日志(day6)

一、笔试

1、insert ignore:在插入数据时忽略主键冲突或其他唯一性约束冲突。

如果插入的记录会导致主键冲突(如 actor_id 已存在),该语句不会报错,而是直接忽略插入操作

语法:

INSERT IGNORE INTO table_name (column1, column2, ...)
VALUES (value1, value2, ...);

拓展:

  • INSERT INTO 是最基本的插入语句,用于向表中插入新数据。如果插入的数据违反了主键或唯一约束,INSERT INTO 会报错并中断操作。
INSERT INTO table_name (column1, column2, ...)
VALUES (value1, value2, ...);
  • REPLACE 是 MySQL 中的一个扩展语句,用于插入数据。如果插入的数据违反了主键或唯一约束,REPLACE先删除旧记录,然后插入新记录
REPLACE INTO table_name (column1, column2, ...)
VALUES (value1, value2, ...);

特性/行为 INSERT INTO、REPLACE、INSERT IGNORE

2、FORCE INDEX 语句进行强制索引查询

SELECT ... FROM table_name FORCE INDEX (index_name) WHERE ...;

3、修改表结构

ALTER TABLE 是用于修改表结构的 SQL 语句,常见的操作包括:

  • 添加列:ADD COLUMN
  • 删除列:DROP COLUMN
  • 修改列:MODIFY COLUMN
  • 重命名列:CHANGE COLUMN
列位置(AFTERFIRST):在 MySQL 中,可以通过 AFTERFIRST 指定新列的位置。

4、创建触发器:create trigger trigger_name

CREATE TRIGGER trigger_name
BEFORE/AFTER {INSERT/UPDATE/DELETE} ON table_name
FOR EACH ROW
BEGIN-- SQL 语句
END;

5、修改表名:rename to

ALTER TABLE old_table_name RENAME TO new_table_name;

6、substr:提取字符串

SUBSTR(expression, start, length)
/*expression:要提取子字符串的原始字符串。
start:提取子字符串的起始位置(从 1 开始计数)。
length:要提取的子字符串的长度。
SUBSTR(first_name,-2,2)从倒数第2个字符开始,提取长度为2的子字符串
*/

7、group_concat:对分组后的结果进行字符串的拼接操作

GROUP_CONCAT(column [SEPARATOR 'separator']) FROM table_name
/*GROUP BY grouping_column;
column:需要连接的字符串列。
separator:(可选)指定连接字符串时使用的分隔符。
grouping_column:用于分组的列。
*/

二、面试

1、短视频业务需要哪些指标,哪三个指标最重要?

  • 短视频本身的数据,比如短视频发布时间、视频时长、发布渠道。这个都是视频发布后即有的固定属性。 
  • 短视频消费侧相关的数据,比如累计播放量、点赞率、完播率。
  • 短视频供给侧相关数据,投稿用户数、连续投稿用户数、优质投稿人涨粉率等。

我认为最重要的三个指标有:播放量、点赞量和收藏量。这三个指标可以反映出短视频消费的健康情况。也是我认为最应该关注的指标。 

答案解析:先说明自己了解短视频生态的构成,再举出三个重要指标即可。

2、业务指标有哪些,怎么衡量你所在的业务部门的贡献?

业务指标分为:

  • 用户数据指标,例如新增用户数、活跃用户数、留存率等; 
  • 行为数据指标,例如PV、UV、K因子(一个用来衡量产品或服务的传播能力或病毒式增长潜力的指标);
  • 产品数据指标,例如GMV,ARPU,付费率; 
  • 付费推广指标,例如CPC、CPA、ROI等。

可以采用ab-test来衡量策略落地的效果,通过假设检验来衡量策略的显著与否。 

答案解析:引导面试官去询问ab实验的具体步骤,面试前需要准备好ab实验的细节

3、因为异常订单,消费者与商家两者纠纷处理?

1) 第一时间向用户和商家了解情况,要求提供关键证据 

2) 根据制度尽最大可能满足用户的诉求 

3) 用户诉求合理则损失由商家承担,否则拒绝

4、淘宝想发展短视频业务,请你对行业进行分析,并分析淘宝短视频的竞争力等

淘宝短视频竞争力:淘宝本身自带大型流量,为短视频业务提供了重要的基础;当前字节跳动快手主要以音乐、情景剧、段子等内容为主,淘宝若想入局,就要找到突破口,打造与快抖不同的产品。由于淘宝用户都是有电商心智的用户,因此可以把产品营销、产品功能使用介绍等内容作为视频内容主攻口,在短视频中进行品牌宣传,实现引流变现。

5、介绍一个和卡中心业务比较相关的项目(深挖:难点、负责板块、项目论文成果等)

以信用评分卡模型为例,参与的流程有数据获取、数据预处理、探索性数据分析、变量选择、模型开发、模型评估、信用评分和系统建立。 

(1)用到的数据主要包括以下几个方面: 基本属性:包括了借款人当时的年龄。 偿债能力:包括了借款人的月收入、负债比率。 信用往来:两年内35-59天逾期次数、两年内60-89天逾期次数、两年内90天以上逾期次数。 财产状况:包括了开放式信贷和贷款数量、不动产贷款或额度数量。 贷款属性:商业贷款、公积金贷款。 其他因素:包括了借款人的家属数量(不包括本人在内)。 时间窗口:自变量的观察窗口为过去两年,因变量表现窗口为未来两年。 

(2)变量选择阶段,通过WOE分析方法来确定指标是否符合经济意义,通过相关性分析和IV筛选确定所需变量。 

(3)模型建立阶段使用python中的statsmodels包实现逻辑回归,在各变量通过显著性检验后验证了模型的预测能力,使用在建模开始阶段预留的test数据进行检验。通过ROC曲线和AUC来评估模型的拟合能力,结果显示AUC值为0.85,说明模型的预测效果还是不错的。 

(4)在信用评分阶段将Logistic模型转换为标准评分卡的形式,选取基础分值、 PDO(比率翻倍的分值)和好坏比基本参数,个人总评分为基础分加各部分得分。整合模型及代码,建立自动评分系统,并用滚动数据进行模型迭代。

5、对拼多多业务的理解

拼多多作为平台为商户提供商品的展示、向消费者提供个性化推荐服务,并从中收取商品销售佣金。而“拼购”模式是指:一个顾客发现某商品,发现一起买更便宜,于是找到自己的亲朋好友进行拼单,达到一单购买的人数后拼单成功,拼单的每个用户都可以拼单价购买(通常价格能比原价便宜10%~20%),而如果24小时内没有足够的人数,则拼单失败。由于拼购价格更低,很多时候甚至出现了1元包邮,2元包邮的情况出现;再加上早期微信流量扶持,因此拼多多起步阶段确实达到拼购链接漫天飞的效果。

6、更倾向于业务方向还是技术方向

业务是根本,技术是工具,技术主要为业务服务

基于此,数据分析最需要的能力是:问题拆解能力、业务理解能力、数据敏感性与洞察力,将业务问题抽象为数据问题的能力,将数据信息转换为业务改进方向的能力。 

对于技术,向下需要掌握数据库、数据仓库、SQL等基本知识,向上有各种算法、模型,但只有适合业务的、可理解的方法和模型才是最好的。

7、如何做一个能出圈的业务。如果做出这样一个业务,怎么验证出圈与否?

每个公司都会有自己的主营业务,在业务快速发展多年以后也会进入红海,陷入存量竞争的时代,此刻就应该考虑扩展业务,做一个能出圈的业务。

在设想出圈的业务时应首先思考与主营业务相关的业务有哪些,并从中进行筛选受众面广的业务,并且考虑其中能够与主营业务形成互补的业务,然后选择进行尝试。 

那么如何验证出圈与否呢,不仅可以从获客渠道出发,通过新业务的获客渠道是否突破原有业务的边界。而且可以从客群维度予以区分,出圈的业务面向客群应与主营业务不同,与主营业务能形成互补,拥有大量潜在的客群可扩展。

8、你做的分析报告有问题,业务方不满意怎么办

首先看问题出在什么地方,是双方由于沟通导致数据口径、结果呈现方式、分析方向有问题,还是由于自身在树立框架的时候方向出错,导致没有得到业务方想得到的数据结果和结论的问题。

  • 如果是前者的问题,就需要再和业务方进行详细沟通,将每一个维度、每一个指标的口径和呈现方式都聊清楚;
  • 如果是后者的问题,那么可能需要请教一些比较资深的同事来帮你重新梳理一下需求,重新找到正确的方向

9、如何衡量一个活动的ROI(投资回报率)

解决了什么问题:活动的目标&背景是什么,可以对应到哪些核心指标,可以具体细拆到哪些指标 这个活动有哪些难点,它的受众有哪些特性,流程具体是怎样设计的 ,活动是否可以长期进行 

最终测算的指标需要结合活动的类型以及活动最终的目的来决定:

  • 活动属于拉新下载类型的,需要考虑的是活动带来的新用户数、下载量以及活动的收益成本比,ROI的计算公式是:收益/成本 
  • 活动属于品牌宣传类的,可以看活动页面的浏览量、文章的阅读量、评论数、点赞数和分享数等  
  • 活动属于促销类的,那么gmv就是重要的指标活动属于提升用户粘性的,可能留存率、平均使用时长等都是结果指标

10、你在分析的时候有没有和业务的人沟通?去发现一些问题风险?

与业务进行沟通是数据分析师的必备技能,许多业务现状需要与业务人员确认。同时,在大环境不断变化的情况下,对于不同的业务场景,数据分析师需要不断与业务人员讨论迭代策略方案。真理越辩越明,道理越讲越清,在与业务人员沟通过程中许多现存的风险点就会不自然地暴露出来。这时结合数据和业务的力量就能保证项目持续稳定的向前推进。

11、如何给多多买菜这个业务建立一些指标。

  • 在“用户”层面,需要监控的指标包括“总用户数”、“活跃用户数”、“用户留存率”、“用户付费转化率”等。这些指标能较为明显地反映平台中的用户的参与情况。当这些指标处于一个高位时,说明平台业务做的比较好。
  • 在“产品”层面,需要监控的指标包括“品类覆盖率”、“销量类指标”、“库存类指标”等,重点研究当前的产品(货物)是否有足够的覆盖面和销量,同时不会积压过多额库存(生鲜类产品保存期较短)。 
  • 在“平台”层面,需要监控的指标包括“GMV”、“ROI”、“市场占有率”等,主要是看当前平台的规模如何,投资回报率是否在可以接受的范围(是在烧钱阶段还是已经获得盈利),平台被用户所接触并使用的范围有多大。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/80829.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java多线程入门案例详解:继承Thread类实现线程

本文通过一个简单案例,讲解如何通过继承 Thread 类来实现多线程程序,并详细分析了代码结构与运行机制。 一、前言 在 Java 中,实现多线程主要有两种方式: 继承 Thread 类 实现 Runnable 接口 本文以继承 Thread 类为例&#x…

Netty在线客服系统落地方案

本文不讲然后代码方面的东西,只聊方案!! 这方案基于 Spring Boot 2.6、Netty、MyBatis Plus、Redis 构建的一套支持 单体应用 的在线客服系统。 系统支持客户自由与后台客服实时聊天、客服未在线钉钉提醒通知客服、消息已读未读标记、消息已…

SDK游戏盾、高防IP、高防CDN三者的区别与选型指南

在网络安全防护领域,SDK游戏盾、高防IP和高防CDN是常见的解决方案,但各自的功能定位、技术实现和适用场景差异显著。本文将通过对比核心差异,帮助您快速理解三者特点并选择适合的防护方案。 一、核心功能定位 SDK游戏盾 功能核心&#xff1a…

GRPO有什么缺点,如何改进?

一、GRPO的核心原理与设计目标 Group Relative Policy Optimization(GRPO)是DeepSeek团队提出的一种强化学习算法,旨在解决传统PPO(Proximal Policy Optimization)在大语言模型(LLM)训练中的资源消耗问题。其核心创新在于 通过组内相对奖励替代价值函数(Critic Model)…

登高架设作业指的是什么?有什么安全操作规程?

登高架设作业是指在高处从事脚手架、跨越架架设或拆除的作业。具体包括以下方面: 脚手架作业 搭建各类脚手架,如落地式脚手架、悬挑式脚手架、附着式升降脚手架等,为建筑施工、设备安装、高处维修等作业提供安全稳定的工作平台。对脚手架进行…

前端实现商品放大镜效果(Vue3完整实现)

前端实现商品放大镜效果(Vue3完整实现) 前言 在电商类项目中,商品图片的细节展示至关重要。放大镜效果能显著提升用户体验,允许用户在不跳转页面的情况下查看高清细节。本文将基于Vue3实现一个高性能的放大镜组件,完整…

【C++11特性】Lambda表达式(匿名函数)

一、函数对象 在C中,我们把所有能当作函数使用的对象当作函数对象。 一般来说,如果我们列出一个对象,而它的后面又跟有由花括号包裹的参数列表,就像fun(arg1, arg2, …),这个对象就被称为函数对象。函数对象大致可分为…

大模型在肝硬化腹水风险预测及临床方案制定中的应用研究

目录 一、引言 1.1 研究背景与意义 1.2 研究目的与创新点 1.3 研究方法与数据来源 二、肝硬化及大模型相关理论基础 2.1 肝硬化概述 2.2 大模型技术原理 2.3 大模型在医疗领域的应用现状 三、大模型预测肝硬化腹水术前风险 3.1 术前风险因素分析 3.2 大模型预测术前…

MCP:如何通过模型控制推理助力AI模型实现“深度思考”?

MCP:如何通过模型控制推理助力AI模型实现“深度思考”? | Echo_Wish专栏 大家好,我是Echo_Wish,一个在人工智能和Python领域深耕的技术达人。今天咱们聊一个相对前沿的技术话题——MCP (Model Control Propagation),它是如何帮助AI模型“深度思考”,让机器变得更加智能的…

c++初识

C 基础入门 本人写了很多c的服务器和客户端代码,这篇文章主要是想帮助初学者快速入门c.这样就能快速阅读我的源码,其实不难c只是比c多了些特性,其实不难,你们就理解为有更多的方式修改函数和调用函数的方式和重写函数 C 基础入门…

JVM 生产环境问题定位与解决实战(八):实战篇——正则表达式回溯引发的CPU 100%

本文已收录于《JVM生产环境问题定位与解决实战》专栏,完整系列见文末目录 1. 引言 在上一篇文章中,我们深入剖析了OSSClient泄漏引发的FullGC风暴全链路排查过程。本文聚焦另一个经典线上问题——正则表达式回溯导致的CPU 100%。在Java应用中&#xff0…

100天精通Python挑战总览 | 零基础到应用实战!

目录 ✨ 为什么发起100天挑战?✨整体学习路线规划第一阶段|基础篇(第1天 - 第50天)第二阶段|应用篇(第51天 - 第100天)Web开发篇爬虫篇数据分析篇AI入门篇 🏆为什么这么划分&#xf…

C++编译之(5)-cmake/CMakeLists.txt的编译使用教程

C++编译之(5)-cmake/CMakeLists.txt的编译使用教程 上一节,点这里 1、如何查看cmake的配置参数 那么如何查看当前配置的参数呢,我们可以使用-L参数 cmake .. -L # cmake .. -LAH完全使用命令行,则可以通过多次重复使用cmake … -DOPTION1=ON -D OPTION2=ON配置制定选项;并…

2025五一杯数学建模竞赛思路助攻预定

2025五一杯数学建模竞赛思路助攻预定(思路内容见文末名片) 一、概况 数学建模竞赛是一项模拟面对实际问题寻求解决方案的活动,是一次近似 于“真刀真枪”的创新探索性实践训练。在丰富并活跃学生课外生活活动的同 时,数学建模竞…

2025年绿色材料与制造技术国际学术会议(GMMT 2025)

重要信息 时间:2025年6月23-25日(英国时间) 地点:英国剑桥线下会场中国线上分会场 官网:www.icgmmt.com 部分 征稿主题 可生物降解材料垃圾和废物的资源化绿色涂料与涂层 生物基聚合物的合成与应用 自然纤维增强复…

鸿蒙NEXT开发正则工具类RegexUtil(ArkTs)

import { FormatUtil } from ./FormatUtil;/*** 正则工具类* author CSDN-鸿蒙布道师* since 2025/04/27*/ export class RegexUtil {/*** 英文字母、数字和下划线*/static readonly REG_GENERAL "^\\w$";/*** 数字*/static readonly REG_NUMBERS "^\\d$"…

Spring系列六:JdbcTemplate

JdbcTemplate 🦒看一个实际需求🦒官方文档🦒基本介绍🦒使用实例📕需求说明📕代码演示 🦒看一个实际需求 实际需求: 如果程序员就希望使用spring框架来做项目, spring框架如何处理对数据库的操作…

来聊聊JVM中安全点的概念

文章目录 写在文章开头详解safepoint基本概念什么是安全点?为什么需要安全点JVM如何让线程跑到最近的安全点线程什么时候需要进入安全点JVM如何保证线程高效进入安全点如何设置安全点用一次GC解释基于安全点的STW实践-基于主线程休眠了解安全点的工作过程代码示例基于日志印证…

搭建 Spark YARN 模式集群指南

在大数据处理领域,Apache Spark 凭借其卓越的性能和易用性广受青睐。而 YARN(Yet Another Resource Negotiator)作为 Hadoop 的资源管理框架,能高效管理集群资源。将 Spark 与 YARN 结合,以 YARN 模式搭建集群&#xf…

WPF之Label控件详解

文章目录 1. 引言2. Label控件基础2.1 类继承结构2.2 Label类定义 3. Label控件的核心属性3.1 Content属性3.2 Target属性3.3 其他常用属性 4. 标签样式与模板自定义4.1 简单样式设置4.2 使用Style对象4.3 触发器使用4.4 使用ControlTemplate完全自定义 5. Label与表单控件交互…