分析数据间的关系
散点矩阵图
如果数据框是多维数据,那么plot函数将绘制出两两之间散点图组合成为散点矩阵图(matrix of scatterplots)。散点矩阵图将多个散点图组合起来,以便可以同时浏览多个二元变量关系,一定程度上克服了在平面上展示高维数据分布情况的困难。
示例:plot函数
plot(iris[,:4])
pairs函数参数
参数解释
x数值型的矩阵或者数据框,作为散点的坐标,逻辑性和因子型会自动转换成为数据值数据
data:提供formula数据的数据框
labels:变量的名称
panel:面板数据的展示方式,默认为points散点
subset:一个可选的响铃,指定用于绘制图形的数据子集
na.action:对于缺失值的处理方式,默认为跳过缺失值
formu:公式,形如~x+y+z其中x,y,z是数据框的列名,作为散点矩阵图的坐标,其对应的列必须是数值型数据
散点矩阵图
示例:iris数据集为例,用pairs函数绘制散点矩阵图
多变量相关矩阵图
多变量相关矩阵图是相关系数矩阵(correlation matrix)的可视化结果,显示了两两变量间的相关关系,对数据维度相对较大的数据有较好的展示效果。
在R的corrgram包中的corrgram函数可绘制多变量相关矩阵图。使用格式如下所示。
corrgram(x,order=, lower.panel= , upper.panel=,text.panel=,diag.panel=,…)corrgram(x,order=,lower.panel=,upper.panel=,text.panel=,diag.panel=,)
corrgram函数参数
参数解释
x:每行作为一个观测值的数据框或者相关系数的矩阵
order:变量排序,默认FALSE,相关矩阵按数据框名对变量排序,当order为TRUE时,相关矩阵将使用主成分分析法对变量重排序,这将使得二元变量的关系模式更为明显
lower.panel:主对角线下方的元素类型,取值panel.pie,用饼图的填充比例来表示相关性大小,
panel.shade用阴影的深度来表示相关性大小,
panel.ellipse 绘制置信椭圆和平滑拟合曲线,
panel.pts绘制散点图,
panel.conf绘制置信区间,
panel.cor绘制相关系数
panel.pie用饼图的填充比例表示相关性的大小
upper.panel:主对角线上方的元素类型,取值同上
text.panel:取值panel.txt输出的变量名字
diag.panel:控制着主对角线元素类型panel.minmax输出变量的最大最小值
多变量相关矩阵图
示例:mtcars数据集绘图
library(corrgram)corrgram(mtcars, order=TRUE, upper.panel=panel.ellipse, main=“Correlogram of mtcars intercorrelations”)
# 相关图,主对角线上方绘制置信椭圆和平滑拟合曲线,主对角线下方绘制阴影
corrgram(mtcars, order=TRUE, upper.panel=panel.pts, lower.panel=panel.pie, main=“Correlogram of mtcars intercorrelations”)
# 相关图,主对角线上方绘制散点图,主对角线下方绘制饼图
corrgram(mtcars, order=TRUE, upper.panel=panel.conf, lower.panel=panel.cor, main=“Correlogram of mtcars intercorrelations”)
# 相关图,主对角线上方绘制置信区间,主对角线下方绘制相关系数
●句子
●JAVA
●C语言以及算法笔记
●大学生生活图鉴
●JavaScript
●计算机网络原理
●计算机组成原理
●操作系统
●数据库系统概论
●数据结构
●英语
●R语言
●Linux
●人生哲学以及电竞
●云计算与人工智能
●新媒体运营以及各种资源分享
●明星电视剧社会现象娱乐
仙女都在看点点点,赞和在看都在这儿!