如何理解数据模型?颗粒度、维度及指标?

问题1 什么是数据模型?

数据模型反映在数据库中就是一张表,该表把他分开来看有以下关注的点。

(1)主键:表明该表主要的分析对象,比如我们的分析对象是订单、是商品、是门店,那么主键就是订单id,商品id,门店id等

(2)颗粒度:数据的颗粒度是指数据的 “粗细”,也就是我们看数据的视野的大小,或者说格局的大小。反应表中一行数据所代表的细节程度,简单理解就是该行数据反应了什么样的业务,具体到哪种细节程度。也是我们进行分析、汇总、关联的最小单元。

例如一个电商公司,同样是看GMV,也就是总销售额,CEO关注的可能是今年总的GMV是多少,而业务老板关注的可能是每个月的GMV如何,具体到某个小团队,关注的点可能就是某些商品,每天的GMV如何了。数据颗粒度最常见的划分是时间

分析对象(主键)+ dt 共同构成了数据的颗粒度例如:某个门店(对象)每月(时间)的GMV

 

(3)关系:构建实体与实体之间的关系,有一对一,一对多,多对多。比如门店与顾客之间的关系,属于1对多,一个门店有多个顾客来购买商品。

(4)行为指标:即指标、度量。用来描述该对象发生了什么事情。你如XX顾客在该门店近一个月购买了多少件商品。

   本质是一种面向对象思想,对象里面有属性和方法,对象即实体,对应数据库中的表模型,对象由主键来确定,属性即表中的维度,方法即行为指标。

 

问题2:颗粒度与维度之间的区别? 

维度:指看待事物不同的角度。可以理解为对象的属性,是对同一实体更细粒度的拆分。

比如我们小学的时候就学过横看成岭侧成峰,说的就是从不同角度来看一座山,会得到不同的结论。在做数据分析时也是一样的。分析一个活动,或者一个策略对用户的吸引时,如果我们以新增用户数作为分析的指标,我们可以从以下几个维度进行拆分:

  • 时间维度:拆分为天、月、季度、年
  • 性别维度:男性、女性、未知
  • 受教育程度:小学、中学、大学、研究生、博士、其他

通过维度的分解,我们可以看到每个部分的变动,和整体的变化趋势是否相同,是否存在不同,而哪些不同点往往会成为我们接下来分析的重点。 

是不是会有同学发现,颗粒度和维度有一些相似,例如时间这个要素,在两个部分都出现了。那么颗粒度和维度的主要区别在哪呢?

  • 颗粒度和维度的本质区别在于拆分的模式不同 

  • 颗粒度是一种纵向的拆分模式,按业务实体,业务过程进行纵向拆分,不同的颗粒度都代表着不同的聚合程度。
  • 维度是一种横向拆分的模式。是在同一对象(实体)下进行的横向拆分,指的该对象的水平扩展能力,按不同维度展开分析。
  • 比如实体对象X=A+B+C+D,对象X可以按照A,B,C,D四个维度进行拆分出来进行分析,而将所有的维度组合又可以形成X整体。对象Y=1+2+3+4,1,2,3,4属于实体Y的维度,而对象X,Y则属于不同的颗粒度。

问题3:什么是指标,指标的具体含义是什么?

指标定义:指标是对业务发展现状的描述和度量。作用:是对当前业务发展好坏的评价。本质上他是一种度量(mesuare《=》metric),是数据分析的基础。
指标意义:实际上是业务固化下来的产物,可以长期监控业务发展趋势,评价业务现状。指标是数据部门与业务部门沟通的桥梁和术语,数据最终的呈现结果即为指标,没有指标数据是没有灵魂的。

指标的作用是“度量”业务,可以从三个角度对指标进行拆解:

指标=维度+统计口径+业务目标。

维度:从什么角度去衡量问题。

统计口径:用什么方法去统计问题。

业务目标:目标是什么。

下面举两个例子。订单量是指统计周期内,用户完成支付的订单数量总和。从维度、统计口径、业务目标三个角度将订单数拆解。

订单量 = 统计周期内,用户完成支付的订单数量总和

维度:用户完成支付订单数量来衡量

统计口径:订单数量总和

业务目标:完成支付订单数。

指标分类:原子指标、派生指标、衍生指标。一般日常使用的即为派生指标,派生指标=原子性指标+时间段+修饰词,三者缺一不可。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/43508.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Qt 线程 QThread类详解

Qt 线程中QThread的使用 在进行桌面应用程序开发的时候, 假设应用程序在某些情况下需要处理比较复杂的逻辑, 如果只有一个线程去处理,就会导致窗口卡顿,无法处理用户的相关操作。这种情况下就需要使用多线程,其中一个…

昇思MindSpore学习笔记6-02计算机视觉--ResNet50迁移学习

摘要: 记录MindSpore AI框架使用ResNet50迁移学习方法对ImageNet狼狗图片分类的过程、步骤。包括环境准备、下载数据集、数据集加载、构建模型、固定特征训练、训练评估和模型预测等。 一、概念 迁移学习的方法 在大数据集上训练得到预训练模型 初始化网络权重参数…

【机器学习】特征选择:精炼数据,提升模型效能

🌈个人主页: 鑫宝Code 🔥热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 ​💫个人格言: "如无必要,勿增实体" 文章目录 特征选择:精炼数据,提升模型效能引言为何进行特征选择&a…

STM32的独立看门狗详解

目录 1.独立看门狗是什么? 2.独立看门狗的作用 3.独立看门狗的实现原理 4.独立看门狗用到的寄存器 4.1 IWDG_KR (关键字计时器) 4.2 IWDG_PR(预分频寄存器) 4.3 IWDG_RLR(重装载寄存器&#xff09…

接口调用的三种方式

例子: curl --location http://110.0.0.1:1024 \ --header Content-Type: application/json \ --data {"task_id": 1 }方式一:postman可视化图形调用 方式二:Vscode中powershell发送请求 #powershell (psh) Invoke-WebRequest -U…

温州海经区管委会主任、乐清市委书记徐建兵带队莅临麒麟信安调研

7月8日上午,温州海经区管委会主任、乐清市委书记徐建兵,乐清市委常委、副市长叶序锋,乐清市委办主任郑志坚一行莅临麒麟信安调研,乐清市投资促进服务中心及湖南省浙江总商会相关人员陪同参加。麒麟信安董事长杨涛、总裁刘文清热情…

elasticsearch集群模式部署

系统版本:CentOS Linux release 7.9.2009 (Core) es版本: elasticsearch-7.6.2 本次搭建es集群为三个节点 添加启动用户 添加之前用户要是创建好了的(这里的es用户并不是绝对要求,你可以根据具体的需要命名创建) visudo 修改配置文件 sys…

【吊打面试官系列-MyBatis面试题】使用 MyBatis 的 mapper 接口调用时有哪些要求?

大家好,我是锋哥。今天分享关于 【使用 MyBatis 的 mapper 接口调用时有哪些要求?】面试题,希望对大家有帮助; 使用 MyBatis 的 mapper 接口调用时有哪些要求? 1、Mapper 接口方法名和 mapper.xml 中定义的每个 sql 的…

数据结构(初阶1)

文章目录 一、复杂度概念 二、时间复杂度 2.1 大O的渐进表示法 2.2 时间复杂度计算示例 2.2.1. // 计算Func2的时间复杂度? 2.2.2.// 计算Func3的时间复杂度? 2.2.3.// 计算Func4的时间复杂度? 2.2.4.// 计算strchr的时间复杂度? …

面对数据不一致性的解决方案:

polarDB是读写分离和计算存储分离的分布式数据库,并且副本的log replicate是基于Parallel-Raft协议来实现的。所以在瞬时进行写和读的操作时,是不可避免会存在数据一致性问题,导致这个数据一致性问题的原因不是事务,而是多副本日志…

springboot篮球馆管理系统-计算机毕业设计源码21945

目 录 摘要 1 绪论 1.1选题背景 1.2研究意义 1.3论文结构与章节安排 2 篮球馆管理系统系统分析 2.1 可行性分析 2.1.1 技术可行性分析 2.1.2 经济可行性分析 2.1.3 法律可行性分析 2.2 系统功能分析 2.2.1 功能性分析 2.2.2 非功能性分析 2.3 系统用例分析 2.4 …

数据结构--二叉树收尾

1.二叉树销毁 运用递归方法 分类: 根节点左子树右子树(一般都是这个思路,不断进行递归即可) 选择方法(分析): 前序:如果直接销毁根就无法找到左子树右子树 中序:也会导致丢失其…

【算法】(C语言):快速排序(递归)、归并排序(递归)、希尔排序

快速排序(递归) 左指针指向第一个数据,右指针指向最后一个数据。取第一个数据作为中间值。右指针指向的数据 循环与中间值比对,若大于中间值,右指针往左移动一位,若小于中间值,右指针停住。右…

红酒的奇幻之旅:从葡萄园到酒杯的魔法

在世界的某个角落,隐藏着一场关于红酒的奇幻之旅。这是一场从葡萄园到酒杯的魔法变幻,将大自然的馈赠与人类的智慧很好结合,最终呈现在我们眼前的,是一杯散发着迷人香气的雷盛红酒。 一、葡萄园的魔法启幕 当清晨的第一缕阳光洒落…

windows server 2019 更新补丁

1 点击 搜索按键--windows 更新设置 2 点击 安装补丁 3 安装完成,重新启动服务器

算法小练之 位运算基础

前言 今天正式走入,位运算这个章节,关于这一部分我会先介绍几个重要的知识点,然后再根据几个力扣上的题来讲解。 了解6种位操作 总所周知,变量在计算机中都是二进制存储的,比如一个变量int a 1; 它的存…

nvidia driver和cuda版本较低,ubuntu系统更新nvidia驱动的方法(对于小白最快最最保险的方法)

问题描述: 系统:ubuntu22.04LTS 这两天安装另一个低版本的pytorch环境,提示我的cuda版本很旧,然后运行程序时候甚至直接报错,如下所示: .local/lib/python3.10/site-packages/torch/cuda/__init__.py&quo…

高通开发系列 - 使用QFIL工具单刷某个镜像文件

By: fulinux E-mail: fulinux@sina.com Blog: https://blog.csdn.net/fulinus 喜欢的盆友欢迎点赞和订阅! 你的喜欢就是我写作的动力! 返回:专栏总目录 目录 背景过程记录背景 有时候设备中刷的是user版本,无法使用fastboot刷单个镜像,这个时候该怎么办呢? 要解决在user…

Linux 一键部署Mysql 8.4.1 LTS

mysql 前言 MySQL 是一个基于 SQL(Structured Query Language)的数据库系统,SQL 是一种用于访问和管理数据库的标准语言。MySQL 以其高性能、稳定性和易用性而闻名,它被广泛应用于各种场景,包括: Web 应用程序:许多动态网站和内容管理系统(如 WordPress)使用 MySQL 存…

Python从0到100(三十五):beautifulsoup的学习

前言: 零基础学Python:Python从0到100最新最全教程。 想做这件事情很久了,这次我更新了自己所写过的所有博客,汇集成了Python从0到100,共一百节课,帮助大家一个月时间里从零基础到学习Python基础语法、Pyth…