一、集中趋势的定义与核心目标
集中趋势指数据向其中心值聚集的倾向,反映数据的典型水平或分布中心。其核心是通过统计指标(如众数、中位数、均值)概括数据的核心特征,帮助快速理解数据分布的核心位置。
核心作用:简化复杂数据、指导业务决策(如确定用户平均消费水平)、支持模型假设检验(如正态分布验证)。
二、数据类型与对应的集中趋势指标
1. 分类数据(名义尺度)
(1)适用指标:众数(Mode)
①定义:出现频次最高的类别值。
②特点:
不受极端值影响,适用于存在极端值的场景(如收入分布右偏时,众数反映多数群体的消费水平)。
不唯一性:可能无众数(如各类别频次相同)或多众数(如双峰分布)。
③应用场景:分析用户性别分布、产品类别偏好。
2. 顺序数据(顺序尺度)
(1)适用指标:中位数(Median)
①定义:排序后位于中间位置