R语言统计分析——整合和重构

参考资料:R语言实战【第2版】

        R中提供了许多用来整合(aggregate)和重塑(reshape)数据的强大方法。在整合数据时,往往将多组观测替换为根据这些观测计算的描述性统计量。在重塑数据时,则会通过修改数据的结构(行和列)来决定数据的组织方式。

1、转置

        使用函数t()即可对一个矩阵或者数据框进行转置,对于后者,行名将变成列名。

cars<-mtcars[1:5,1:4]
cars
t(cars)

2、整合数据

        在R中使用一个或多个by变量和一个预先定义好的函数来折叠(collapse)数据是比较容易的。调用格式为:

        aggregate(x,by,FUN)

其中,x是待折叠的数据对象,by是一个变量名组成的列表,这些变量将被去掉以形成新的观测,而FUN则是用来计算描述性统计量的标量函数,它将被用来计算新观测的值。

options(digits=3)
attach(mtcars)
aggdata<-aggregate(mtcars,by=list(cyl,gear),FUN=mean,na.rm=TRUE)
detach(mtcars)
aggdataattach(mtcars)
aggdata<-aggregate(mtcars,by=list(Group.cyl=cyl,Group.gear=gear),FUN=mean,na.rm=TRUE)
detach(mtcars)
aggdata

        在aggregate()函数中,by中的变量必须是一个列表(即使只有一个变量)。我们可以在列表中为各组声明自定义的名称,例如:my=list(Group.cyl=cyl,Group.gears=gear)。指定的函数可以是任意的内建函数或自定义函数。

3、reshape2包

        reshape2包是一套重构和整合数据集的绝妙的万能工具。由于reshape2包并未安装在R的标准安装中,在第一次使用它之前需要使用install.packages("reshape2")进行安装。

        大致来说,我们需要首先将数据融合(melt),以使每一行都是唯一的标识符-变量组合。然后将数据重铸(cast)为我们想要的任何形状。在重铸过程中,我们可以使用任何函数对数据进行整合。

library(reshape2)ID<-c(1,1,2,2)
Time<-c(1,2,1,2)
X1<-c(5,3,6,2)
X2<-c(6,5,1,4)
mydata<-data.frame(ID,Time,X1,X2)
mydata

(1)融合

        数据集的融合是将它重构为这样一种格式:每个测量独占一行,行中带有要唯一确定这个测量所需的标识符变量。

md<-melt(mydata,id=c('ID','Time'))
md

        注意,必须指定要唯一确定每个测量所需的变量(本例是ID和Time),而表示测量变量名的变量(本例是X1和X2)将由程序自动创建。

(2)重铸

        dcast()函数读取已融合的数据,并使用我们提供的公式和一个(可选的)用于整合数据的函数将其重塑。调用格式为:

        newdata<-dcast(md,format,fun.aggregate)

其中,md为已融合的数据,formula描述了想要的最后结果,而fun.aggregate是(可选的)数据整合函数。其接受的公式形式如:

        rowvar1+rowvar2+...~colvar1+colvar2+...

        在这一公式中,rowvar1+rowvar2+...定义了要划掉的变量集合,以确定各行的内容,而colvar1+colvar2+...则定义了要划掉的、确定各列内容的变量集合。如下图:

        由于上图中右侧(d,e和f)的公式中未包含某个函数,所以数据仅被重塑了。反之,左侧的示例(a、b和c)中指定了mean作为整合函数,从而就对数据同时进行了重复和整合。

# a
dcast(md,ID~variable,mean)
# b
dcast(md,Time~variable,mean)
# c
dcast(md,ID~Time,mean)
# d
dcast(md,ID+Time~variable)
# e
dcast(md,ID+variable~Time)
# f
dcast(md,ID~variable+Time)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/50226.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

STM32——GPIO(点亮LEDLED闪烁)

一、什么是GPIO&#xff1f; GPIO&#xff08;通用输入输出接口&#xff09;&#xff1a; 1.GPIO 功能概述 GPIO 是通用输入/输出&#xff08;General Purpose I/O&#xff09;的简称&#xff0c;既能当输入口使用&#xff0c;又能当输出口使用。端口&#xff0c;就是元器件…

数据结构(5.3_5)——二叉树的线索化

第一种寻找中序前驱方法 中序线索化 本质上就是一次中序遍历&#xff0c;只不过需要在一边遍历一边处理结点线索化 代码&#xff1a; //全局变量pre 指向当前访问结点的前驱 ThreadNode* pre NULL;struct ElemType {int value; };//线索二叉树结点 typedef struct ThreadNode…

linux练习2

一、搭建nfs服务器&#xff0c;客户端可从服务端/share目录上传与下载文件 **服务端** 1、下载相关安装包 [rootserver ~]# yum install rpcbind -y [rootserver ~]# yum install nfs-utils -y 2、 创建共享文件夹/share并授予权限 [rootserver ~]# mkdir /share [rootserv…

Vue3 响应式高阶用法之 `triggerRef()`

Vue3 响应式高阶用法之 triggerRef() 在 Vue3 的响应式系统中&#xff0c;shallowRef 提供了一种轻量级的响应式状态管理方式。然而&#xff0c;当我们需要对 shallowRef 的内层属性进行操作时&#xff0c;就会遇到一些限制。幸运的是&#xff0c;Vue3 提供了 triggerRef() 方…

Yum源配置问题

一、配置yum源 1.备份当前yum源 mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup 2.下载新的CentOS-Base.repo 到/etc/yum.repos.d/ wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo 或者 curl …

【学习笔记】Redis学习笔记——第16章 Sentinel

第16章 Sentinel 监视一个或多个主服务器及其下属服务器&#xff0c;在主服务器故障时&#xff0c;降级主服务器并将某一从服务器选举为新服务器。 这里的Sentinel本质上只是一个运行在特殊模式下的Redis服务器。 16.1 启动并初始化Sentinel 使用命令redis-server启动Sentin…

shell脚本自动化安装启动各种服务

1、自动化配置dns服务器 A主机&#xff1a;vim dns.sh #!/bin/bash# 自动化部署dns# 1、下载bind# 2、修改配置文件# vim /etc/named.conf # listen-on port 53 { 127.0.0.1;any; }; 修改&#xff08;定位替换&#xff09;# allow-query { localhost;any; }; 修改&am…

vector以及迭代器失效

前言 学习完string&#xff0c;之后学习的就是vector。vector就是之前C语言中讲到过的顺序表&#xff0c;用三个变量分别记录资源的位置&#xff0c;容器的容量和容器中元素个数。原来的写法是直接使用指针加两个int变量&#xff0c;而标准库中&#xff0c;三个都是由指针确定的…

sql server 连接报错error 40

做个简单的记录,造成40 的原因有很多,你的错误并不一定就是我遇到的这种情况. 错误描述: 首先我在使用ssms 工具连接的时候是可以正常连接的,也能对数据库进行操作. 在使用 ef core 连接 Sql Server 时报错: Microsoft.Data.SqlClient.SqlException (0x80131904): A network-r…

hadoop学习(二)

一.MapReduce 1.1定义&#xff1a;是一个分布式运算程序的编程框架 1.2核心功能&#xff1a;将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序&#xff0c;并发运行在一个Hadoop集群上。 1.3优点 1&#xff09;易于编程 它简单的实现一些接口&#…

【Linux】Ubuntu解决Release 文件已经过期问题

​今天在执行update更新软件包时遇到了此问题&#xff1a;E: http://cn.archive.ubuntu.com/ubuntu/dists/jammy-updates/InRelease 的 Release 文件已经过期(已经过期了 247天 21小时 33分 15秒)。该仓库的更新将不会应用&#xff0c;如图 ​ 这个报错之前其实经常遇到&#x…

电脑虚拟摄像头软件分享|用手机打破电脑摄像头的极限

随着手机摄像头的不断更新迭代&#xff0c;手机已经接近专业电脑摄像头的画质。这让我们可以花费更低的成本获取优质的电脑录像画面。今天小编给大家详细讲解电脑虚拟摄像头的在我们日常生活中的妙用&#xff0c;以及分享几款口碑不错的电脑虚拟摄像头软件。有需要的小伙伴可以…

周末两天我搭建了一个智能问答ai工具网站

背景 周五的时候我去看了一下Boos 直聘&#xff0c;然后沟通了一个10k-15k的职位&#xff0c;她问我会不会后端&#xff0c;我说会一些node&#xff0c;然后他跟我说他们的工作是去对接第三方的的AI工具&#xff0c;我说这个没问题&#xff0c;我自己原来接触过Stable Diffusi…

智能识海:基于深度学习的海洋生物检测系统开发指南

基于深度学习的海洋动物检测系统&#xff08;UI界面YOLOv8/v7/v6/v5代码训练数据集&#xff09; 引言 海洋动物检测在海洋生态保护、科学研究和渔业管理中起着至关重要的作用。通过深度学习技术&#xff0c;尤其是YOLO&#xff08;You Only Look Once&#xff09;模型&#x…

算法训练营第47天|1143.最长公共子序列|1035.不相交的线|53. 最大子序和|392.判断子序列

1143.最长公共子序列 思路&#xff1a;这道题比较难理解的是递推公式&#xff0c;要想明白状态转换和各个状态的意义。 如果text1[i - 1] 与 text2[j - 1]相同&#xff0c;那么找到了一个公共元素&#xff0c;所以dp[i][j] dp[i - 1][j - 1] 1; 如果text1[i - 1] 与 text2[j…

IO的分类有哪些

目录 一&#xff1a;BIO,NIO,AIO有什么区别 二&#xff1a;BIO&#xff0c;NIO&#xff0c;AIO有哪些适用场景 三&#xff1a;BIO的编程流程 四&#xff1a;NIO的三大核心部分 五&#xff1a;NIO中buffer的属性有哪些 六&#xff1a;BIO与NIO的对比 七&#xff1a;简…

Unity3D 转换微信小游戏指引 05 广告内购

Unity3D 转换微信小游戏指引系列&#xff08;第五期 完结&#xff09; 广告 在小程序后台页面找到推广->流量主 开通条件如下&#xff1a; 开通之后&#xff0c;需要接入广告组件。 调用创建广告组件的接口时&#xff0c;需要传入参数 adUnitId&#xff0c;这个是开通流量…

「C++系列」数组

文章目录 一、数组1. 声明数组2. 初始化数组3. 访问数组元素4. 遍历数组注意事项示例代码 二、多维数组1. 声明二维数组2. 初始化二维数组3. 访问二维数组元素4. 遍历二维数组注意事项示例代码 三、指向数组的指针1. 声明指向数组的指针2. 通过指针访问数组元素3. 指针和数组的…

json的数据结构

JSON 的数据结构 JSON 由两种数据结构组成&#xff1a;对象&#xff08;字典&#xff09;和数组。 一、对象 对象&#xff08;object&#xff09;是由键值对组成的无序集合。 键是字符串&#xff0c;值可以是任何类型&#xff0c;包括对象和数组&#xff1b;对象由一对花括…

Android 10.0 framework默认沉浸式状态栏功能实现

1. 前言 在10.0的系统rom定制化开发中,在实现状态栏的某些定制化开发中,在某些产品需要实现沉浸式状态栏,就是需要app 能全屏显示同样也能显示状态栏,接下来就来分析下相关的功能实现 如图: 2.framework默认沉浸式状态栏功能实现的核心类 frameworks\base\core\java\andro…