SQL面试题练习 —— 无效搜索

目录

  • 1 题目
  • 2 建表语句
  • 3 题解

题目来源:百度。

1 题目


现有一份用户搜索日志,包含用户ID,时间,用户搜索内容。定义 无效搜索:如果用户下一次搜索内容中包含本次搜索内容,则认为本次搜索为无效搜索。请查询用户无效搜索记录。

样例数据

+---------+---------------------+------------------------+
| user_id |     search_time      |     search_content      |
+---------+---------------------+------------------------+
|       1 | 2022-01-01 10:00:00 |          apple           |
|       1 | 2022-01-01 11:30:00 |    banana and apple      |
|       1 | 2022-01-01 12:45:00 |        fruit salad       |
|       1 | 2022-01-01 15:00:00 |         apple pie        |
|       1 | 2022-01-01 16:20:00 |   applesauce recipe      |
|       2 | 2022-01-01 10:00:00 |        cat food          |
|       2 | 2022-01-01 11:30:00 |   wet vs dry cat food    |
|       2 | 2022-01-01 12:45:00 | homemade cat food recipe |
|       2 | 2022-01-01 14:00:00 | cat food brands to avoid |
|       2 | 2022-01-01 16:20:00 | best cat food for i...   |
|       3 | 2022-01-01 10:00:00 |          book            |
|       3 | 2022-01-01 11:30:00 |  books like Harry Potter|
|       3 | 2022-01-01 13:00:00 |best selling books ...   |
|       3 | 2022-01-01 14:30:00 |   bookstores near me    |
|       3 | 2022-01-01 15:45:00 |    how to publish a book|
+---------+---------------------+------------------------+

2 建表语句


--建表语句
CREATE TABLE user_search_log (user_id STRING,search_time TIMESTAMP,search_content STRING
) STORED AS PARQUET;
--插入数据
INSERT INTO user_search_log
VALUES('1', '2022-01-01 10:00:00', 'apple'),('1', '2022-01-01 11:30:00', 'banana and apple'),('1', '2022-01-01 12:45:00', 'fruit salad'),('1', '2022-01-01 15:00:00', 'apple pie'),('1', '2022-01-01 16:20:00', 'applesauce recipe'),('2', '2022-01-01 10:00:00', 'cat food'),('2', '2022-01-01 11:30:00', 'wet vs dry cat food'),('2', '2022-01-01 12:45:00', 'homemade cat food recipe'),('2', '2022-01-01 14:00:00', 'cat food brands to avoid'),('2', '2022-01-01 16:20:00', 'best cat food for indoor cats'),('3', '2022-01-01 10:00:00', 'book'),('3', '2022-01-01 11:30:00', 'books like Harry Potter'),('3', '2022-01-01 13:00:00', 'best selling books of all time'),('3', '2022-01-01 14:30:00', 'bookstores near me'),('3', '2022-01-01 15:45:00', 'how to publish a book');

3 题解


(1)查询出下一行数据,并把下一行搜索内容作为新字段放到本行

select user_id,search_time,search_content,lead(search_content) over (partition by user_id order by search_time asc) as next_search_content
from user_search_log

执行结果

+----------+------------------------+---------------------------------+---------------------------------+
| user_id  |      search_time       |         search_content          |       next_search_content       |
+----------+------------------------+---------------------------------+---------------------------------+
| 1        | 2022-01-01 10:00:00.0  | apple                           | banana and apple                |
| 1        | 2022-01-01 11:30:00.0  | banana and apple                | fruit salad                     |
| 1        | 2022-01-01 12:45:00.0  | fruit salad                     | apple pie                       |
| 1        | 2022-01-01 15:00:00.0  | apple pie                       | applesauce recipe               |
| 1        | 2022-01-01 16:20:00.0  | applesauce recipe               | NULL                            |
| 2        | 2022-01-01 10:00:00.0  | cat food                        | wet vs dry cat food             |
| 2        | 2022-01-01 11:30:00.0  | wet vs dry cat food             | homemade cat food recipe        |
| 2        | 2022-01-01 12:45:00.0  | homemade cat food recipe        | cat food brands to avoid        |
| 2        | 2022-01-01 14:00:00.0  | cat food brands to avoid        | best cat food for indoor cats   |
| 2        | 2022-01-01 16:20:00.0  | best cat food for indoor cats   | NULL                            |
| 3        | 2022-01-01 10:00:00.0  | book                            | books like Harry Potter         |
| 3        | 2022-01-01 11:30:00.0  | books like Harry Potter         | best selling books of all time  |
| 3        | 2022-01-01 13:00:00.0  | best selling books of all time  | bookstores near me              |
| 3        | 2022-01-01 14:30:00.0  | bookstores near me              | how to publish a book           |
| 3        | 2022-01-01 15:45:00.0  | how to publish a book           | NULL                            |
+----------+------------------------+---------------------------------+---------------------------------+

在 MySQL 中,INSTR 函数的语法如下:INSTR(string, substring)string 是要搜索的字符串。
substring 是要查找的子字符串。INSTR 函数返回子字符串在字符串中首次出现的位置(从 1 开始)。如果未找到子字符串,则返回 0。

(2)比较搜索内容是否为下一次搜索内容的子字符串,给判断逻辑打标记(如果是返回1,否则返回0)

select user_id,search_time,search_content,lead(search_content) over (partition by user_id order by search_time asc)                                      as next_search_content,If(instr(lead(search_content) over (partition by user_id order by search_time asc), search_content) > 0, 1,0)                                                                                                          as flag
from user_search_log

执行结果

+----------+------------------------+---------------------------------+---------------------------------+-------+
| user_id  |      search_time       |         search_content          |       next_search_content       | flag  |
+----------+------------------------+---------------------------------+---------------------------------+-------+
| 1        | 2022-01-01 10:00:00.0  | apple                           | banana and apple                | 1     |
| 1        | 2022-01-01 11:30:00.0  | banana and apple                | fruit salad                     | 0     |
| 1        | 2022-01-01 12:45:00.0  | fruit salad                     | apple pie                       | 0     |
| 1        | 2022-01-01 15:00:00.0  | apple pie                       | applesauce recipe               | 0     |
| 1        | 2022-01-01 16:20:00.0  | applesauce recipe               | NULL                            | 0     |
| 2        | 2022-01-01 10:00:00.0  | cat food                        | wet vs dry cat food             | 1     |
| 2        | 2022-01-01 11:30:00.0  | wet vs dry cat food             | homemade cat food recipe        | 0     |
| 2        | 2022-01-01 12:45:00.0  | homemade cat food recipe        | cat food brands to avoid        | 0     |
| 2        | 2022-01-01 14:00:00.0  | cat food brands to avoid        | best cat food for indoor cats   | 0     |
| 2        | 2022-01-01 16:20:00.0  | best cat food for indoor cats   | NULL                            | 0     |
| 3        | 2022-01-01 10:00:00.0  | book                            | books like Harry Potter         | 1     |
| 3        | 2022-01-01 11:30:00.0  | books like Harry Potter         | best selling books of all time  | 0     |
| 3        | 2022-01-01 13:00:00.0  | best selling books of all time  | bookstores near me              | 0     |
| 3        | 2022-01-01 14:30:00.0  | bookstores near me              | how to publish a book           | 0     |
| 3        | 2022-01-01 15:45:00.0  | how to publish a book           | NULL                            | 0     |
+----------+------------------------+---------------------------------+---------------------------------+-------+

(3)限制标签为1,查询出最后结果

select user_id,search_time,search_content
from (select user_id,search_time,search_content,if(instr(lead(search_content) over (partition by user_id order by search_time asc), search_content) > 0, 1,0) as flagfrom user_search_log) t
where flag = 1;

执行结果

+----------+------------------------+-----------------+
| user_id  |      search_time       | search_content  |
+----------+------------------------+-----------------+
| 1        | 2022-01-01 10:00:00.0  | apple           |
| 2        | 2022-01-01 10:00:00.0  | cat food        |
| 3        | 2022-01-01 10:00:00.0  | book            |
+----------+------------------------+-----------------+

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/36308.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

以入站营销为核心,撬动To B业务增长新杠杆

传统的营销模式已逐渐失效,企业需要寻找新的营销策略来吸引客户并推动业务增长。Outbound marketing(出站营销)作为一种传统的营销方式,虽然在过去发挥了重要作用,但在数字化时代,其局限性也日益明显。 数字…

use embeddings stored in vector db to reduce work for LLM generating response

题意:使用存储在向量数据库中的嵌入来表示,以减少大型语言模型(LLM)生成响应的工作量。 问题背景: Im trying to understand what the correct strategy is for storing and using embeddings in a vector database, …

重温react-08

react中的createContext使用方式 简介一下,就是组件之间可以互相通信的比较好用的传值方式,话不多说直接上代码。 以下介绍的是类组件中的方式,在函数组件中不是如此使用的。 定义一个通用的方法 import { createContext } from "react…

论文学习 --- RL Regret-based Defense in Adversarial Reinforcement Learning

前言 个人拙见,如果我的理解有问题欢迎讨论 (●′ω`●) 原文链接:https://www.ifaamas.org/Proceedings/aamas2024/pdfs/p2633.pdf 研究背景 深度强化学习(Deep Reinforcement Learning, DRL)在复杂和安全关键任务中取得了显著成果,例如自动驾驶。然而,DRL策略容易受…

【杂记-浅谈IPv6过渡技术之6to4网络技术】

IPv6过渡技术之 6to4网络技术 一、6to4网络概述二、6to4网络配置 一、6to4网络概述 6to4是一种IPv6转换技术,它允许IPv6流量通过IPv4网络传输。6to4网络的地址可以表示为2002:IPv4地址::/48,其中前48位(2002:a.b.c.d)由分配给路由…

python调用c++ ctype list传数组与for if 列表推导式

python调用c ctype list传数组 关于ctype与python list的转换很简单,大家记住下面两条就够用了,后面是练习 list传进C数组 import numpy as np from ctypes import * mylist [101, -101, ..., 101, -101]##your list mycbytearray (c_byte * len(my…

优刻得首个「国产千卡智算集群」落地,支持智源千亿大模型训练

在人工智能引领的时代浪潮中,算力已成为技术进步与创新的核心驱动力。面对当下AI算力需求的飙升、高端AI芯片供应受限的挑战,加之OpenAI带来的技术封锁,唯有坚定不移的发展自主可控的国产技术方案,持续壮大国产智算集群规模&#…

在postgrel中使用hints

在 PostgreSQL 中,可以使用查询提示(Query Hints)来影响查询优化器的行为,但需要注意的是,PostgreSQL 并不像一些商业数据库那样有丰富的提示语法,而是提供了一些基本的方式来引导优化器。 使用查询提示的基本方式 使用 /*+ … / 注释提示: PostgreSQL 支持在 SQL 查询…

参数调优论文

基于Java EE的性能调优方法研究 - 中国知网 (cnki.net) 基于机器学习的Hadoop参数调优方法 - 中国知网 (cnki.net) 基于机器学习的数据库系统自动调参研究 - 中国知网 (cnki.net) 基于强化学习的文件系统性能自动调优及参数安全评估技术 - 中国知网 (cnki.net) 基于贝叶斯优…

如何在ArcGIS Pro中提取行政区划

我们在《2024版有审图号的SHP行政区划》一文中,为你分享过全国省市县级的行政区划。 现在再为你分享一下,如何在ArcGIS Pro中提取目标范围行政区划的方法,你还可在以文末查看领取该行政区划数据的方法。 直接选择 在菜单栏上点击一下选择下…

这谁顶得住啊!AI绘画模型竟然可以画出质量逼真的黑丝!

今天看到一个有趣的AI绘画玩法,用SD画黑丝!话不多说,开始今天的实战演练。 首先做好准备工作:部署好本地Stable Diffuison 然后就轮到今天的主角上场了 黑丝Lora模型:perfectpantyhose 这是一款叫perfectpantyhose…

【最佳实践】前端如何搭建自己的cli命令行工具,让自己编码的时候如虎添翼

作为前端开发人员,搭建自己的前端CLI工具是一个有趣且有意义的事情。以下是一篇详细的教程,包括使用场景和案例。 使用场景 假设你是一个前端团队的一员,需要频繁地在不同的项目中执行一些标准化的任务,比如: 根据模…

重建大师引擎数0,本地引擎设置改不了,空三在跑,这样是正常的吗?

答:任务目录和引擎监控目录并没有按照网络集群设置,需要调整为网络路径。 重建大师是一款专为超大规模实景三维数据生产而设计的集群并行处理软件,输入倾斜照片,激光点云,POS信息及像控点,输出高精度彩色网…

TikTok API接口——获取视频评论信息

一、引言 TikTok,作为全球最受欢迎的短视频社交平台之一,不仅为用户提供了展示才华和分享生活的舞台,也为品牌和企业提供了与年轻用户互动的新渠道。在这个信息爆炸的时代,了解用户的声音、掌握舆论动向显得尤为重要。通过TikTok…

alibaba easyexcel 导出excel使用

需求 传统导出&#xff0c;一般都是通过Workbook > Sheet > Row > Cell 获取详细Cell 设置值&#xff0c;比较麻烦&#xff0c;偶然遇到alibaba easyexcel 直接通过注解设置哪些需要导出 哪些忽略&#xff0c;发现特别好用。 pom依赖 <dependency><groupId…

千年织锦:中国古代包文化的辉煌历程与现代传承

追溯至远古&#xff0c;我们的祖先就开始利用自然界的恩赐——皮革、植物纤维等&#xff0c;制作出最原始的包袋。随着时间的推移&#xff0c;技艺的提升&#xff0c;包的材质逐渐丰富起来&#xff0c;从粗糙到精致&#xff0c;从简单到复杂&#xff0c;每一次材质的革新都是人…

CentOS 7.9 CDH6.3.2集群生产环境实战部署指南

一、环境准备 1、系统环境&#xff1a; # cat /etc/os-release 2、准备工作&#xff1a; 部署资源分配 节点centos 7.9&#xff08;生产&#xff09;节点规划Postgresql部署组件备注pgsql32c、128G、2TB国产数据库Postgresql&#xff08;翰高&#xff09;可根据实际情况调整…

Wordpress图像编辑插件-palleon v3.8.1中文版语言包

Palleon是一个强大的WordPress图像编辑器&#xff0c;可以与您的WordPress网站无缝集成&#xff0c;让您快速高效地工作。它拥有为你的WordPress网站创建令人惊叹的图像所需的一切。 Palleon让您完全控制图像&#xff0c;允许您逐个像素进行更改。您可以轻松地裁剪、调整图像大…

漏洞利用开发基础学习记录

文章目录 简介Win32缓冲区溢出内容难点 SEH 溢出内容难点 Egg Hunters内容难点 Unicode 溢出内容难点 x86-64 缓冲区溢出内容难点 参考资料 简介 本文基于ERC.Xdbg漏洞分析文章进行初步归纳整理&#xff0c;主要有Win32 缓冲区溢出、SEH 溢出、Egg Hunters、Unicode 溢出、x86…

基于盲信号处理的人声分离

1.问题描述 在实际生活中&#xff0c;存在一种基本现象称为“鸡尾酒效应”&#xff0c;该效应指即使在非常嘈杂的环境中&#xff0c;人依然可以从噪声中提取出自己所感兴趣的声音。 在实际应用中&#xff0c;我们可能需要对混合的声音进行分离&#xff0c;此时已知的只有混合…