wordpress 导出 主题/济南网站推广优化

wordpress 导出 主题,济南网站推广优化,免费咨询在线律师,网站设计英文一、plyr包 plyr扩展包主要是实现数据处理中的“分割-应用-组合”(split-apply-combine)策略。此策略是指将一个问题分割成更容易操作的部分,再对每一部分进行独立的操作,最后将各部分的操作结果组合起来。 plyr扩展包中的主要函…

一、plyr包

plyr扩展包主要是实现数据处理中的“分割-应用-组合”(split-apply-combine)策略。此策略是指将一个问题分割成更容易操作的部分,再对每一部分进行独立的操作,最后将各部分的操作结果组合起来。

plyr扩展包中的主要函数可以用**ply来概括:第一个 * 表示输入数据的结构,可选的数据结构有a(array)d(data.frame) l (list);第二个 * 表示输出数据的结构,可选的数据结构除了前面3种以外,还有“_”,它表示不输出,它的结果常用于绘图和建立缓存。

plyr包的12个主要函数
输入输出数组输出数据框输出数据列表无输出
数组aaplyadplyalplya_ply
数据框daplyddplydlplyd_ply
列表laplyldplyllplyl_ply

 按照输入数据的结构可以分为3类:

a*ply(.data, .margins, .fun, ..., .progress="none"):按照维度对数组进行“切片”;

d*ply(.data, .variables, .fun, ..., .progress="none"):按照一列或多列将数据框分为若干子集;

l*ply(.data, .fun, ..., .progress="none"):将列表的每个分量作为子集。

 参数详解:

.data:表示输入数据;

.margins:表示数组的边际,与apply函数的MARGIN类似,也可以为向量。用来描述输入数据将如何被分割为若干部分;

.variables:表示分组变量,可以有多个变量。用来描述输入数据将如何被分割为若干部分。

.fun:表示应用于数据各部分的函数,如果没有指定.fun,则表示从一种数据结构变为另一种数据结构;

...:表示传递给.fun的其它参数;

.progress:表示进度条的类型,none表示不显示进度条,它有text,tk和win三种进度条。

下面用datasets包中的鸢尾花数据集iris和iris3举例:

library(plyr)
iris.set <- iris
iris3.set <- iris3
class(iris)
class(iris3)

 

若不在.fun指定应用函数,**ply()函数的作用仅仅是将数据集从一种结构转换为另一种结构

iris.set1 <- dlply(iris.set, .variables="Species")
head(iris.set1)

二、dplyr包

plyr 包虽然功能强大,但在处理大数据集时可能会比较慢。对于更高效的数据处理,可以考虑使用 dplyr 包,它是 plyr 的一个现代替代品,提供了更快的速度和更直观的语法。

dplyr包主要针对数据框和tibble(tbl_df对象,一种增强的数据框)的操作。tibble数据结构在呈现大型数据集时非常友好。

下面以nyflights13扩展包中的flights数据集为例,此数据集中包含了336776次航班信息。(先安装install.packages("nyflights13")。

flights数据集就是一个tibble类型的数据框,它和一般数据框的区别是,当打印到控制台上时会附带上更多的信息。例如,行数和列数,每一列的数据类型,少量的数据示例及省略的行数、列数和列名。

 1、select()函数

用于选择需要的变量用在后续的分析上。

library(dplyr)
# 选择列变量
head(select(flights, year, flight, dest))

如果要从数据中删除一些变量,可以通过在变量前添加负号(-)来实现。另外,在select()函数中还可以使用一些辅助函数来完成对列的匹配操作:starts_with()、ends_with()、contains()、matches()、num_range()、one_of()和everything()等。

选取以“a”为首字母的变量

library(dplyr)
# 选择以“a”为首字母的变量
head(select(flights, starts_with("a")))

 选取包含“lay”的变量

library(dplyr)
head(select(flights, contains("lay")))

选取最后单词为“.time”的变量

library(dplyr)
head(select(flights, matches(".time")))

2、filter()函数

 用于根据条件对数据的列或者记录进行筛选。

# 选取在7月19日起飞,并且飞行距离大于800的AS或HA航空公司的航班信息
filter(flights, month==7,day==19,distance>800,carrier=="AS"|carrier=="HA")

对比使用with()函数的筛选方法,就会显得使用filter()函数更加简洁清晰。

with(flights,flights[month==7 & day==19 & distance > 800 & (carrier=="AS"|carrier=="HA"),])

3、arrange()函数

 若是依据多列数据进行排序,只需按列的顺序写进此函数中即可;如果是逆序排,只需在变量前面加负号或使用rev()函数即可(注意,逆排序中使用负号的情况仅限于数值变量)

# 依次按month、day、carrier、origin和dest对flights进行排序
head(arrange(flights,-month,-day,carrier,origin,dest))

4、mutate()函数

转换函数,它可以同时修改和增加若干个变量。与R语言中的内置的转换函数transform()相比,它的优势是可在同一段代码中使用刚建立的新变量。

library(dplyr)
library(nycflights13)
# 计算飞行节约的时间和平均每小时所节约的时间
flights1 <- mutate(flights, gain=arr_delay - dep_delay, gain_per_hour= gain/(air_time/60))
head(flights1$gain)
head(flights1$gain_per_hour)

 5、group_by()和summarise()函数

这两个函数往往一起使用,先对数据集进行分组,然后再按组进行汇总。

先按照航空公司进行分组:

# 先按航空公司进行分组
flights2 <- group_by(flights, carrier)
# 查看分组变量
group_vars(flights2)
# 查看各组的行数
group_size(flights2)

 然后对各航空公司数据进行汇总:

flights3 <- summarise(flights2, dep_delay_mean = mean(dep_delay, na.rm=T),arr_delay_mean = mean(arr_delay, na.rm=T),distance_sd = sd(distance, na.rm=T))
flights3

6、连接函数

inner_join()函数:用于内连接

left_join()函数:用于左连接

right_join()函数:用于右连接

full_join()函数:用于全连接

7、抽样函数

sample_n()函数:随机选出指定个数(样本容量)的样本数;

sample_frac()函数:随机选出指定百分比的样本数。

sample_n(flights,size=8)sample_frac(flights,size=0.10)

8、管道函数%>%

此函数可以通过不断地叠加,减少代码量和中间变量,这种写法极大地提高了代码的可读性和可维护性,特别是在进行数据分析和处理数据框(data frames)时。

在叠加过程中,%>%左边的结果将作为右边函数的第一个参数

dplyr包中的%>%操作符实际上是从magrittr包中借用的,但dplyr作为数据操作的一个核心包,使得这个操作符在数据科学社区中变得非常流行。

df <- data.frame(id = 1:5,name = c("Alice", "Bob", "Charlie", "David", "Eva"),score = c(85, 90, 95, 88, 92)
)# 使用%>%管道函数
filtered_sorted_df <- df %>%filter(score > 90) %>%  # 过滤出score大于90的行arrange(desc(score)) %>%  # 按score降序排列select(name, score)  # 选择name和score列print(filtered_sorted_df)

%>%管道函数可以与dplyr包中的其他函数(如mutatesummarisegroup_by等)结合使用:

flights4 <- flights  %>%sample_frac(size = 0.1) %>% # 随机抽取10%的样本select(one_of("carrier","month","day","dep_delay","arr_delay","air_time","distance")) %>% # 筛选carrier、month、day等几列变量mutate(gain = arr_delay - dep_delay,gain_per_hour = gain / (air_time / 60)) %>% # 计算飞行节约时间和平均每小时所节约的时间group_by(carrier,month) %>% # 按航空公司和月份summarise(gain = mean(gain,na.rm = TRUE),distance = mean(distance,na.rm =TRUE)) # 求gain和distance平均值flights4

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/894991.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【DeepSeek】DeepSeek小模型蒸馏与本地部署深度解析DeepSeek小模型蒸馏与本地部署深度解析

一、引言与背景 在人工智能领域&#xff0c;大型语言模型&#xff08;LLM&#xff09;如DeepSeek以其卓越的自然语言理解和生成能力&#xff0c;推动了众多应用场景的发展。然而&#xff0c;大型模型的高昂计算和存储成本&#xff0c;以及潜在的数据隐私风险&#xff0c;限制了…

【AI】在Ubuntu中使用docker对DeepSeek的部署与使用

这篇文章前言是我基于部署好的deepseek-r1:8b模型跑出来的 关于部署DeepSeek的前言与介绍 在当今快速发展的技术环境中&#xff0c;有效地利用机器学习工具来解决问题变得越来越重要。今天&#xff0c;我将引入一个名为DeepSeek 的工具&#xff0c;它作为一种强大的搜索引擎&a…

TCP三次握手全方面详解

文章目录 (1) 三次握手各状态CLOSE状态SYN_SENT状态SYN_RECV状态ESTABLISHED状态 (2) 为什么握手时的seqnum是随机值&#xff0c;以及acknum的功能(3) 三次握手中的半连接队列&#xff08;SYN队列&#xff09;和全连接队列&#xff08;ACCEPT队列&#xff09;半连接队列全连接队…

数据结构与算法-递归

单路递归 二分查找 /*** 主函数&#xff1a;执行二分查找。* * param a 要搜索的数组&#xff08;必须是已排序的&#xff09;* param target 目标值* return 返回目标值在数组中的索引&#xff1b;如果未找到&#xff0c;则返回 -1*/ public static int binarySearch(int[] …

Termux安装ssh实现电脑ssh

Termux下载 点击下载 在 Termux 中安装并使用 SSH&#xff0c;按照以下步骤操作&#xff1a; 1. 更新软件包列表 pkg update && pkg upgrade2. 安装 OpenSSH pkg install openssh3. 设置 SSH 密码&#xff08;必须&#xff0c;否则无法使用 SSH 服务器&#xff09…

深入理解 C++17 std::is_swappable

文章目录 深入理解 C17 std::is_swappable引言std::is_swappable 概述std::is_swappable 的工作原理std::is_swappable 的变体注意事项结论 深入理解 C17 std::is_swappable 引言 在 C 编程中&#xff0c;交换两个对象的值是一个常见的操作。为了确保代码的通用性和安全性&am…

51单片机之冯·诺依曼结构

一、概述 8051系列单片机将作为控制应用最基本的内容集成在一个硅片上&#xff0c;其内部结构如图4-1所示。作为单一芯片的计算机&#xff0c;它的内部结构与一台计算机的主机非常相似。其中微处理器相当于计算机中的CPU&#xff0c;由运算器和控制器两个部分构成&#xff1b;…

w~Transformer~合集5

我自己的原文哦~ https://blog.51cto.com/whaosoft/12406495 #transformer~x1 太可怕了都到6了 太强~~ DeepMind 表示&#xff0c;他们提出的算法蒸馏&#xff08;AD&#xff09;是首个通过对具有模仿损失的离线数据进行顺序建模以展示上下文强化学习的方法。同时基于观察…

c#对接deepseek 聊天AI接口

注意&#xff1a;不是免费 对接文档&#xff1a;对话补全 | DeepSeek API Docs 注册地址&#xff1a;DeepSeek 申请key 在线请求示例 apifox deepseek - deepseek

23.PPT:校摄影社团-摄影比赛作品【5】

目录 NO12345​ NO6 NO7/8/9/10​ 单元格背景填充表格背景填充文本框背景填充幻灯片背景格式设置添加考生文件夹下的版式 NO12345 插入幻灯片和放入图片☞快速&#xff1a;插入→相册→新建相册→文件→图片版式→相框形状→调整边框宽度左下角背景图片&#xff1a;视图→…

创新领先!珈和科技获评省级企业技术中心

为充分发挥中小企业创新主体作用&#xff0c;提高自主创新、集成创新和引进消化吸收再创新能力&#xff0c;增强创新驱动发展的动力&#xff0c;做好专精特新“小巨人”企业的培育工作。 近日&#xff0c;湖北省经信厅对申报2024年湖北省中小企业技术中心的企业进行审核认定并…

初次体验Tauri和Sycamore (2)

原创作者&#xff1a;庄晓立&#xff08;LIIGO&#xff09; 原创时间&#xff1a;2025年2月8日&#xff08;首次发布时间&#xff09; 原创链接&#xff1a;https://blog.csdn.net/liigo/article/details/145520637 版权所有&#xff0c;转载请注明出处。 关键词&#xff1a;Sy…

vs封装dll 给C#使用

一&#xff0c;vs创建控制台应用 创建控制台应用得好处时&#xff0c;我们可以自己测试接口&#xff0c;如果接口没有问题&#xff0c;改成dll重新编译一遍就可以。 二&#xff0c; 创建一个c 类&#xff0c;将所需提供得功能 封装到类中。 这样可以将 所有功能&#xff0c;进…

紧跟潮流,将 DeepSeek 集成到 VSCode

Visual Studio Code&#xff08;简称 VSCode&#xff09;是一款由微软开发的免费开源代码编辑器&#xff0c;自 2015 年发布以来&#xff0c;凭借其轻便、强大、且拥有丰富扩展生态的特点&#xff0c;迅速成为了全球开发者的首选工具。VSCode 支持多平台操作系统&#xff0c;包…

html 列动态布局

样式说明&#xff1a; /* 列动态布局&#xff0c;列之间以空格填充 */ li {display: flex;/* flex-direction: column; */justify-content: space-between; }

从O(k*n)到O(1):如何用哈希表终结多层if判断的性能困局

【前言】   本文将以哈希表重构实战为核心&#xff0c;完整展示如何将传统条件匹配逻辑(上千层if-else判断)转化为O(1)的哈希表高效实现。通过指纹验证场景的代码级解剖&#xff0c;您将深入理解&#xff1a;   1.哈希函数设计如何规避冲突陷阱   2.链式寻址法的工程实现…

第 26 场 蓝桥入门赛

3.电子舞龙【算法赛】 - 蓝桥云课 问题描述 话说这年头&#xff0c;连舞龙都得电子化&#xff01;这不&#xff0c;蓝桥村的老程序员王大爷突发奇想&#xff0c;用LED灯带和一堆传感器鼓捣出了一条“电子舞龙”&#xff0c;它能根据程序指令在村里的广场上“翩翩起舞”。 广…

0012—数组

存取一组数据&#xff0c;使用数组。 数组是一组相同类型元素的集合。 要存储1-10的数字&#xff0c;怎么存储&#xff1f; C语言中给了数组的定义&#xff1a;一组相同类型元素的集合。 创建一个空间创建一组数&#xff1a; 一、数组的定义 int arr[10] {1,2,3,4,5,6,7,8,…

详细教程 | 如何使用DolphinScheduler调度Flink实时任务

Apache DolphinScheduler 非常适用于实时数据处理场景&#xff0c;尤其是与 Apache Flink 的集成。DolphinScheduler 提供了丰富的功能&#xff0c;包括任务依赖管理、动态调度、实时监控和日志管理&#xff0c;能够有效简化 Flink 实时任务的管理和部署。通过 DolphinSchedule…

了解传输层TCP协议

目录 一、TCP协议段格式 二、TCP原理 1.确认应答 2.超时重传 3.连接管理 建立连接 断开连接 4.滑动窗口 5.流量控制 6.拥塞控制 7.延时应答 8.捎带应答 9.面向字节流 10.TCP异常情况 TCP&#xff0c;即Transmission Control Protocol&#xff0c;传输控制协议。人如…