SQL进阶技巧:如何按照固定尺寸(固定区间)对数据进行打分类标签?

目录

0 问题引入

应用案例1

应用案例2

 小结


0 问题引入

   在日常数据分析中,经常会遇到数据产品经理或数据分析师提出这样的需求,比如按照某一给定的区间或数据范围对数据进行分类标签,而遇到这样的问题,好多同学感觉SQL做起来有点困难或无从下手,其实面对这样的问题笔者早在其他文章中已经进行总结,笔者将这类问题归结为分桶问题,而分桶问题又分为两类,一类是桶个数一定,但是桶尺寸不固定的分桶,一类是桶尺寸一定,但是桶个数不一定的分桶,针对这两种分桶的方式,我们分别给出如下解决方案。

第一类:桶个数一定,桶尺寸不定,用函数 ntile(),ntile函数中传的参数即为需要分桶的个数。具体需要根据需求分析出桶个数,比如需求中求按照收入前10%的人群进行圈选,此时就需要对收入字段进行分桶,分多少桶?由于需求中已经给出10%的数字,那么桶的个数即为10,桶号为1的标签即为所要的结果。

第二类:桶个数不固定,桶尺寸固定,这类问题,往往用公式法。此类的需求往往都是给定一定的区间,比如按照某个固定区间的范围,0-10,11-20,21-30...等等,这类问题需要先分析清楚固定区间的长度是多少,如上述区间长度即为10,那么我们可以用如下公式:

                                               

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/872224.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[C++] 匿名命名空间

匿名命名空间是C中的一种特性,它允许你在不指定名称的情况下声明一个命名空间。这种命名空间主要用于局部作用域,例如在一个源文件的顶层,来限制符号的作用范围,从而避免全局命名空间中的命名冲突。 匿名命名空间中的所有声明都自…

.gitignore配置文件不生效的问题

一、问题描述: 在已经提交过的git管理的项目中,新增加一个.gitignore文件,或者修改.gitignore文件之后,新增的忽略内容不生效 二、问题原因: gitignore文件只能作用于Untracked Files的文件,也就是那些从…

【通信协议-RTCM】MSM语句(1) - 多信号GNSS观测数据消息格式

注释: RTCM响应消息1020为GLONASS星历信息,暂不介绍,前公司暂未研发RTCM消息类型版本的DR/RTK模块,DR/RTK模块仅NMEA消息类型使用 注释: 公司使用的多信号语句类型为MSM4&MSM7,也应该是运用最广泛的语句…

暑期备考2024上海初中生古诗文大会:单选题真题和独家解析

现在距离2024年初中生古诗文大会初选还有不到4个月(11月3日正式开赛),我们继续来看10道选择题真题和详细解析。为帮助孩子自测和练习,题目的答案和解析统一附后。 本专题持续分享。 一、上海初中古诗文大会历年真题精选(参考答案…

探索IP形象设计:快速掌握设计要点

随着市场竞争的加剧,越来越多的企业开始关注品牌形象的塑造和推广。在品牌形象中,知识产权形象设计是非常重要的方面。在智能和互联网的趋势下,未来的知识产权形象设计可能会更加关注数字和社交网络。通过数字技术和社交媒体平台,…

等保测评是什么 怎么做

在信息安全日益受到重视的今天,等保测评已成为企事业单位不可或缺的安全合规活动。然而,对于等保测评的理解和实施,仍存在诸多误区。本文将对等保测评的周期、法律责任、网络环境、测评对象、费用及常见误区进行深入解析,以期帮助…

源码安装zabbix5.0.36完整版

源码安装zabbix5.0.36完整版 环境:CentOS Linux release 7.9,cpu:16,mem:32G软件包如下: zabbix-5.0.36.tar.gz mysql-8.0.28-linux-glibc2.17-x86_64-minimal.tar.xz nginx-1.6.2.tar.gz 1. 配置前准备 systemctl stop firewa…

[MySQL][表的增删查改][二][Retrieve][SELECT][WHERE]详细讲解

目录 1.Retrieve1.基本语法2.SELECT列1.全列查询2.查询字段为表达式3.为查询结果指定别名4.结果去重 3.WHERE条件1.比较运算符2.逻辑运算符3.示例 4.结果排序1.基本语法2.示例 5.筛选分页结果 1.Retrieve 1.基本语法 SELECT [DISTINCT] * | {column [, column] ...} [FROM ta…

基于pytesseract的OCR图片识别

简介 pytesseract是基于谷歌的tesseract的OCR包,支持识别一些简单的数字、字母、中文。 安装 安装引擎 下载地址:https://digi.bib.uni-mannheim.de/tesseract/ 一般是Windows 64位系统最新版: 如果要识别中文,注意选中中文…

【微服务】Spring Cloud Config解决的问题和案例

文章目录 强烈推荐引言解决问题1. 配置管理的集中化2. 配置的版本控制3. 环境特定配置4. 配置的动态刷新5. 安全管理敏感数据6. 配置的一致性 组件1. **配置服务器(Config Server)**2. **配置客户端(Config Client)** 配置示例配置…

十一、(正点原子)Linux异步通知

一、简介 我们首先来回顾一下“中断”,中断是处理器提供的一种异步机制,我们配置好中断以后就可以让处理器去处理其他的事情了,当中断发生以后会触发我们事先设置好的中断服务函数,在中断服务函数中做具体的处理。 Linux …

JVM常见知识点总结

最近在看关于JVM的一些知识点,之前也有了解过,可是时间一长就总会忘,索性按照自己的记忆方式去回顾一下知识点。 首先,jvm是Java程序运行的环境,全称为Java Virtual Machine 当我们写好的Java文件经过javac编译后就变成…

Java求最大公约数和最小公倍数

求最大公约数和最小公倍数,Java实现代码如下: public class LcmDemo {public static void main(String[] args) {int num1 18;int num2 30;System.out.println("最大公约数:" gcd(num1, num2));System.out.println("最小公…

Java SE—基本数据类型(详细讲解)

📝个人主页🌹:誓则盟约 ⏩收录专栏⏪:Java SE 🤡往期回顾🤡:Python 神器:wxauto 库——解锁微信自动化的无限可能 🌹🌹期待您的关注 🌹&#x1f3…

使用Docker Compose进行多容器应用部署

在现代软件开发中,容器化技术改变了我们部署和管理应用程序的方式。Docker作为容器化技术的领导者,提供了一个轻量级且高效的方式来打包和运行应用程序。而Docker Compose则进一步简化了多容器应用的管理,它允许你使用一个docker-compose.yml…

售前工程师的AI大模型转型之路

随着人工智能技术的飞速发展,大模型(Large Language Models, LLMs)正逐渐成为IT行业的热点。对于售前工程师来说,转行大模型领域不仅意味着新的机遇,也面临着诸多挑战。本文将探讨售前工程师转行大模型领域的机遇与挑战…

关于UTF-64格式的反思

目标 为了让不同语言表达相同意思,所需的编码长度差不多,有了UTF-64编码。 现实 可是,今天刚发现:虽然不同语言用UTF-8表达相同意思,编码长度差很多,但是,压缩之后就差不多了。代码如下&…

嵌入式人工智能(6-树莓派4B按键输入控制LED)

1、按键 按键的原理都是一样,通过按键开关的按下导通,抬起断开的情况,GPIO引脚来检测其是否有电流流入。GPIO有input()方法,对于GPIO引脚检测电流,不能让其引脚悬空,否则引脚会受周边环境电磁干扰产生微弱…

SpringBoot之健康监控(Actuator)

1,基本介绍 Spring Actuator 是 Spring Boot 提供的一个扩展模块,用于监控和管理应用程序的生产环境。它通过 HTTP 端点暴露了大量的监控和管理功能,使得开发者可以在运行时查看应用程序的运行状况、配置信息、性能指标等。 主要功能&#…

探索未来视界:LC201小尺寸红外热成像机芯引领行业新变革

在当今科技飞速发展的时代,红外热成像技术正以前所未有的方式革新着诸多行业,而灵卡技术推出的LC201小尺寸红外热成像机芯,正是这一变革的先锋。专为体积和功耗敏感领域设计,LC201以超紧凑的22x22mm尺寸、轻量化设计,及…