mysql 重复单号 统计

              任务: 增加重复件统计分析: 统计展示选择时间范围内重复1次、重复2次、重复3次、重复4次、重复5次及以上的数据量

        

17、统计出现的重复次数

        增加重复件统计分析: 统计展示选择时间范围内重复1次、重复2次、重复3次、重复4次、重复5次及以上的数据量。

1,建表

DROP TABLE IF EXISTS repeat_num;
CREATE TABLE repeat_num(id INT NOT NULL AUTO_INCREMENT,create_date DATE,content VARCHAR(500),nums VARCHAR(500),PRIMARY KEY(id)
);

2,插入数据

INSERT INTO repeat_num VALUES
(1, '2024-01-01', '投诉', '1'),
(2, '2024-01-02', '举报', '1,2'),
(3, '2024-01-03', '申告', '1,2,3'),
(4, '2024-01-04', '提醒', '1,2,3,4'),
(5, '2024-01-05', '告知', '1,2,3,4,5'),
(6, '2024-01-06', '预警', '1,2,3,4,5,6'),
(7, '2024-01-07', '投诉', '2,3'),
(8, '2024-01-08', '举报', '3'),
(9, '2024-01-09', '举报', '4,5,6'),
(10, '2024-01-10', '举报', '2,5,1,3'),
(11, '2024-01-11', '举报', '7,8,9'),
(12, '2024-01-12', '申诉', '1,2,3,4,5,6,8'),
(13, '2024-01-13', '申诉', '2,6'),
(14, '2024-01-14', '申诉', '1,3,4,5,6'),
(15, '2024-01-15', '申诉', '1,3,5,6,7,8,9'),
(16, '2024-01-16', '申诉', '5,7,8,9,10,11,13'),
(17, '2024-01-17', '申诉', '7,8,9,10'),
(18, '2024-01-18', '提醒', '7,8,9,10,14'),
(19, '2024-01-19', '告知', '5,7,8,9,10'),
(20, '2024-01-20', '告知', '4,5,6,7,8,9,11,12'),
(21, '2024-01-21', '预警', '3,5'),
(22, '2024-01-22', '预警', '8,9,11');

3,sql

1,先结算长度:
 -- 先计算原来的长度,然后用replace 替换到目标值,得到的长度,相减就是目标长度。 如果目标是多字符串的
SELECT LENGTH('1,2,3,4,5,6') - 
LENGTH(REPLACE('1,2,3,4,5,6', ',', '')) AS count_commas;

多字符间隔处理:

-- 多字符的,计算结果要除以自身长度
SELECT  (LENGTH('best wish for you! best wish for you!') - 
LENGTH( REPLACE ('best wish for you! best wish for you', 'for', '')))/ 
LENGTH('for')  AS repeat_num;-- 向下取整
SELECT  FLOOR((LENGTH('best wish for you! best wish for you!') - 
LENGTH( REPLACE ('best wish for you! best wish for you', 'for', '')))/ 
LENGTH('for'))  AS repeat_num;

2,计算重复次数:
 SELECT *, (LENGTH(nums) - LENGTH(REPLACE(nums, ',', ''))  + 1) 
AS  repeat_count FROM repeat_num ;

3,进行统计:
-- 统计:
SELECT repeat_count, SUM(repeat_count) repeat_sum
FROM (SELECT *, (LENGTH(nums) - LENGTH(REPLACE(nums, ',', ''))  + 1) AS  repeat_count FROM repeat_num  
) AS temp GROUP BY repeat_count;

4,统计以上的:
-- 统计 重复1次、重复2次、重复3次、重复4次、重复5次及以上 -- 以上的,又要聚合统计,得单独写
SELECT  repeat_count, SUM(repeat_count) repeat_sumFROM (SELECT *, (LENGTH(nums) - LENGTH(REPLACE(nums, ',', ''))  + 1) AS  repeat_count FROM repeat_num  ) AS temp WHERE repeat_count <= 5GROUP BY repeat_countUNION  SELECT  6 AS repeat_count, SUM(repeat_count) repeat_sumFROM (SELECT *, (LENGTH(nums) - LENGTH(REPLACE(nums, ',', ''))  + 1) AS  repeat_count FROM repeat_num  ) AS temp WHERE repeat_count > 5;

2,用函数的方式:

知识点:

        SUBSTRING(s,n,len)带有len参数的格式,从字符串s返回一个长度同 len字符相同的子字符串,起始于位置n,也可能对n使用一个负值。假若这样,则子字符串的位置起始于字符串结尾的n字符,即倒数第n个字符,而不是字符串的开头位置。

【例 1】使用SUBSTRING函数获取指定位置处的子字符串,输入语句如下:

 SELECT SUBSTRING('breakfast', 5) AS coll,SUBSTRING('breakfast', 5,3) AS co12,
SUBSTRING('lunch', -3) AS co13,
SUBSTRING('lunch', -5, 3)AS col4;

SUBSTRING('breakfast',5)返回从第5个位置开始到字符串结尾的子字符串,结果为“kfast”; SUBSTRING(breakfast',5,3)返回从第5个位置开始长度为3的子字符串,结果为“kfa”;

SUBSTRING("unch',-3)返回从结尾开始第3个位置到字符串结尾的子字符串,结果为“nch”; SUBSTRING('lunch',-5,3)返回从结尾开始第5个位置,即字符串开头起,长度为3的子字符串,结果为“lun”。

用SUBSTRING去处理,不断去遍历,判断值符合条件的,就记录下。

函数:
DELIMITER //CREATE FUNCTION count_by_symbols(str VARCHAR(255), symbol VARCHAR(10))RETURNS INTBEGINDECLARE cnt INT DEFAULT 0;DECLARE idx INT DEFAULT 1;DECLARE len INT;SET len = CHAR_LENGTH(str);WHILE idx <= len DOIF SUBSTRING(str, idx, 1) = symbol THENSET cnt = cnt + 1;END IF;SET idx = idx + 1;END WHILE;RETURN cnt;END //DELIMITER ; 

使用

 SELECT  count_by_symbols('a|lin|yan@sd|fd|ds|f', "|") AS count_symbol_num;

如果新建函数保存

报错

This function has none of DETERMINISTIC, NO SQL, or READS SQL DATA in its declaration and binary logging is enabled (you *might* want to use the less safe log_bin_trust_function_creators variable)

SET GLOBAL log_bin_trust_function_creators = 1;

调用:
SELECT *, (count_by_symbols(nums, ',')   + 1) AS  repeat_num FROM repeat_num ;

统计:
SELECT  repeat_count, SUM(repeat_count) repeat_sumFROM (SELECT *, (count_by_symbols(nums, ',')   + 1) AS  repeat_count FROM repeat_num  ) AS temp WHERE repeat_count <= 5GROUP BY repeat_countUNION  SELECT  6 AS repeat_count, SUM(repeat_count) repeat_sumFROM (SELECT *, (count_by_symbols(nums, ',')   + 1) AS  repeat_count FROM repeat_num  ) AS temp WHERE repeat_count > 5;

总结:

        推荐用第一种方式,第二种,得看环境是否支持自定义函数或者过程。这种还好,如果要根据repeat_num去聚合的话,这种要聚合的话,这个要进行统计,就很麻烦了,用sql的话,得变成行转列,然后再进行统计。java的话,得把内容进行分离后,再重新聚合。

        上一篇: 《mysql 日环比 统计》

        下一篇: 《mysql 索引》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/1712.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

人工智能常见的分类算法

在机器学习中&#xff0c;分类算法是用于预测数据集中实例所属类别的重要技术。本文将详细介绍七种常见的分类算法&#xff0c;包括决策树、支持向量机、朴素贝叶斯、最大熵、K最近邻算法、神经网络和深度学习&#xff0c;并提供相应的示例。 1. 决策树&#xff08;Decision T…

【机器学习】各大模型原理简介

目录 ⛳️推荐 前言 一、神经网络&#xff08;联结主义&#xff09;类的模型 二、符号主义类的模型 三、决策树类的模型 四、概率类的模型 五、近邻类的模型 六、集成学习类的模型 ⛳️推荐 前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风…

uniapp H5的弹窗滚动穿透解决

目录 方案一 事件修饰符 overscroll-behavior 修饰符 overscroll-behavior 属性 看个案例 兼容 方案二 overflow&#xff1a;hiden 有一层遮罩蒙层覆盖在body上时&#xff0c;当我们滚动遮罩层&#xff0c;它下面的内容也会跟着一起滚动&#xff0c;看起来好像是上面的…

冯唐成事心法笔记

文章目录 卷首语 管理是一生的日常&#xff0c;成事是一生的修行PART 1 知己 用好自己的天赋如何管理自我用好你的天赋成大事无捷径如何平衡工作和生活做一个真猛人做自己熟悉的行业掌控情绪如何对待妒忌和贪婪如何战胜自己&#xff0c;战胜逆境真正的高手都有破局思维有时候…

本地环境测试

1. 在 Anaconda Navigator 中&#xff0c;打开 Jupyter Notebook &#xff0c;在网页中&#xff0c;点击进入本地环境搭建中创 建的工作目录&#xff0c;点击右上角的 New- 》 Folder &#xff0c;将新出现的 Untitled Folder 选中&#xff0c;并使用左上角 的 Rename 按钮重…

白蚁自动化监测系统解放方案

一、系统介绍 白蚁自动化监测系统是基于物联网的各项白蚁监测点数据的采集形成智能控制系统。提供白蚁实时预警及解决方案&#xff0c;真正实现区域内白蚁种群消灭。白蚁入侵&#xff0c;系统第一时间自动报警&#xff0c;显示入侵位置&#xff0c;实现抓获白蚁于现场的关键环…

【Linux】认识文件(三):缓冲区

【Linux】认识文件&#xff08;三&#xff09;&#xff1a;缓冲区 一.啥是缓冲区&#xff1f;二.缓冲区现象三.缓冲区的刷新方法四.缓冲区在哪&#xff1f;五.为什么要有缓冲区 一.啥是缓冲区&#xff1f; 缓冲区&#xff0c;官方说法就是&#xff1a;指的是一块用于临时存储数…

linux配置mail发送邮件

无邮件正文 mail -s “主题” 收件地址 有邮件正文 mail -s “主题” 收件地址< 文件(邮件正文.txt) echo “邮件正文” | mail -s 邮件主题 收件地址 cat 邮件正文.txt | mail -s 邮件主题 收件地址 带附件 mail -s “主题” 收件地址 -a 附件 < 文件(邮件正文.t…

LeetCode 409—— 最长回文串

阅读目录 1. 题目2. 解题思路3. 代码实现 1. 题目 2. 解题思路 要想组成回文串&#xff0c;那么只有最中间的字符可以是奇数个&#xff0c;其余字符都必须是偶数个。 所以&#xff0c;我们先遍历一遍字符串&#xff0c;统计出每个字符出现的次数。 然后如果某个字符出现了偶…

MySQL InnoDB事务处理探秘:原理、特性与实战攻略

在现代数据库领域&#xff0c;事务处理是确保数据一致性和完整性的重要手段。MySQL InnoDB存储引擎以其强大的事务处理能力著称&#xff0c;它遵循ACID原则&#xff0c;为用户提供了可靠、灵活的事务管理环境。本文将深入探讨InnoDB事务处理的原理、特性&#xff0c;辅以通俗易…

FlinkSQL Tips

FlinkSQL使用小技巧总结 1. 分组聚合 create view t1 as select 1 as id, lisi1 as name ,12 as age UNION ALL select 1 as id, lisi2 as name,11 as age UNION ALL select 1 as id, lisi3 as name,15 as age UNION ALL select 1 as id, lisi4 as name,13 as age UNION ALL …

vi, vim,data,wc,系统常用命令-读书笔记(十)

vi 文本编辑器 基本上 vi 共分为三种模式&#xff0c;分别是“一般指令模式”、“编辑模式”与“命令行命令模式”。这三种模式的作用分别是&#xff1a; 一般指令模式&#xff08;command mode&#xff09;以 vi 打开一个文件就直接进入一般指令模式了&#xff08;这是默认的…

CentOS 安装 PHP 7

1. 安装 epel-release 1. 什么是epel 如果既想获得 RHEL 的高质量、高性能、高可靠性&#xff0c;又需要方便易用(关键是免费)的软件包更新功能&#xff0c;那么 Fedora Project 推出的 EPEL(Extra Packages for Enterprise Linux)正好适合你。 EPEL 是由 Fedora 社区打造&a…

yarn的安装与配置(Windows/macOS)

Yarn的安装与配置&#xff08;windows与macOS&#xff09; &#x1fa9f; Windows系统下安装与配置Yarn 步骤一&#xff1a;安装Node.js 访问 Node.js官方网站 下载适合您的Windows系统的最新稳定版安装包。进行默认安装&#xff0c;并确保在安装过程中勾选“Add to PATH”选…

【MySql】 深入理解SQL中的日期处理:NVL和TIMESTAMPDIFF函数的应用

还有多少个十年 能勇敢做热血青年 还有多少个十年 能坚持当初的信念 还有多少个十年 能不忘怀回忆点点 &#x1f3b5; 《还有多少个十年》 在处理数据库时&#xff0c;日期和时间的操作是日常任务中最常见且关键的部分之一。无论是过滤数据、生成报告还是…

Compose 简单组件

文章目录 Compose 简单组件TextText属性使用AnnotatedStringSpanStyleParagraphStyle SelectionContainer 和 DisableSelectionClickableText TextFieldTextField属性使用OutlinedTextFieldBasicTextFieldKeyboardOptions 键盘属性KeyboardActions IME动作 ButtonButton属性使用…

Android隐藏标题栏、移除标题栏

移除&#xff08;隐藏&#xff09;Android标题栏可使用如下代码&#xff1a; public class MainActivity extends AppCompatActivity {protected void onCreate(Bundle savedInstanceState) {super.onCreate(savedInstanceState);//隐藏标题栏&#xff0c;需要置于setContentV…

玩转压力管理,轻松高效编程

程序员缓解工作压力的小窍门 在当今快速发展的科技时代&#xff0c;程序员作为数字世界的建筑师&#xff0c;面临着高强度、高压力的工作环境。为保持工作效率和创新能力&#xff0c;同时也确保身心健康和个人热情的持久续航&#xff0c;采取科学合理的减压策略至关重要。 方…

一二三应用开发平台使用手册——系统管理-用户组-使用说明

概述 在RBAC模型中&#xff0c;资源、角色、用户三个关键元素&#xff0c;构成权限体系。在平台设计和实现的时候&#xff0c;以下几个核心问题思考如下&#xff1a; 角色&#xff0c;单层平铺还是树形结构&#xff1f; 在小型应用中&#xff0c;角色数量有限的情况下&#x…

高级数据结构—树状数组

引入问题&#xff1a; 给出一个长度为n的数组&#xff0c;完成以下两种操作&#xff1a; 1. 将第i个数加上k 2. 输出区间[i,j]内每个数的和 朴素算法&#xff1a; 单点修改&#xff1a;O( 1 ) 区间查询&#xff1a;O( n ) 使用树状数组&#xff1a; 单点修改&#xff1a…