【R包开发:入门】 简介+ 包的结构

简介

本书的目的是教你如何开发包,以便你可以写出自己的包,而不只是使用别人的包。

为什么要写一个包?

一个令人信服的理由是,你想要与他人分享代码。把你的代码打成一个包,可以方便他人使用,因为他们像你一样也知道如何使用包。如果你的代码在包中,则任何 R 用户都可以轻松地下载、安装和学习如何使用它。

【在 R 中,可分享代码的基本单位是包】

即使你从不分享你的代码,包也很有用。它主要是节省你自己的时间。”把代码组织在一个包中会让你工作起来更容易,因为包有一些通用的约定。标准化的规范带来标准化的工具

1.1 开发理念

任何可以自动化的都应该自动化。把手动工作量降到最小。目标是让你将时间用于思考你想要包做什么,而不是包结构的各种细节。

这一理念主要是通过 devtools 包+RStudio 来实现的

1.2 入门

确保你有最新版本的 R(至少是 3.1.2),获得你将要用到的包

install.packages(c("devtools", "roxygen2", "testthat", "knitr"))

H还需要一个 C 编译器和几个命令行工具

  • Windows 下,下载并安装 Rtools(RTools: Toolchains for building R and R packages from source on Windows)。注意:这不是一个 R 包!

  • 在 Mac 下,确保你有 Xcode(可在 App Store 上免费获取)或 Xcode 命令行工具(Sign In - Apple)。

  • Linux 下,确保你不仅安装了 R,而且还安装了 R 开发工具。例如,在 Ubuntu 和 Debian 上,你需要安装 Ubuntu 的 r-base-dev 包。

1.3 约定

    在本书中,foo() 指函数,bar 指变量或函数参数,baz/ 指路径,#> 是输出注释,# 是常规的注释。

包的结构

2.1 给包命名

2.1.1 命名的要求

选择一个很容易被搜索到的独特的名字。这很容易让潜在的用户找到你的包,并且容易记住的包名。

2.1.2 命名的策略

找到一个和这个问题相关的词,修改它,如:plyr,lubridate,knitr,testdat  

使用缩略词:Rcpp,lvplot 

 增加一个额外的 r:stringr,tourr, gistr 

2.2 创建一个包

第一种方法:

(1) 单击 File | New Project(文件 | 新项目)。

(2) 选择 New Directory(新的目录)

(3) 下一步,选择 R Package(R 包)

(4) 最后,给出你的包名,然后单击 Create Project(创建项目)

 第二种方法:

 R 里面通过命令来创建

devtools::create("path/to/package/pkgname")

以上两种方法创建的包都属于最小的可用包,它有三个组成部分。

(1) 一个 R/ 目录,

(2) 一个描述文件 DESCRIPTION,

(3) 一个命名空间文件 NAMESPACE,

这个包还包括一个 RStudio 项目文件 pkgname.Rproj,这将使你的包易于在 RStudio 中使用。 

如果你的包中不包含.Rproj文件, 可以使用  devtools::user_rstudio("path/to/package")  来添加它。

.Rproj 文件只是一个文本文件。不需要手动来修改这个文件。通常,可以使用友好的 Project Options(项目选项)对话框,通过 RStudio 右上角的 Projects(项目)菜单来访问

2.3 RStudio 项目

使用Rstudio的好处

  • 每个项目都是独立的,在一个项目中运行的代码不会影响任何其他项目

  • 你可以获得方便的代码导航工具,如 F2 可以跳转到函数的定义,Ctrl+. 可通过名字来查找函数。

  • 有用的快捷键,用于通用的包开发任务

2.4 什么是包

2.4.1 源码包

源码包只是包含 R/ 子目录、DESCRIPTION 等组件的一个目录。

2.4.2 压缩包

压缩包是一个已经压缩为单个文件的包,R 中的压缩包使用 .tar.gz 扩展名。这意味着多个文件已经被打包成一个文件(.tar)并用 gzip(.gz)压缩过。

如果你解压一个压缩包,会看到它和你的源码包看起来几乎一样。解压的包和源码包的主要区别如下。

  • 使用指南被创建,你可以得到 HTML 和 PDF 输出而不是 Markdown 或者 LaTex 的输入。

  • 你的源码包中可能包含开发时产生的一些临时文件,比如 src/ 目录下编译生成的中间文件,它们在解压的包中是不存在的。

  • .Rbuildignore 文件中列出的任何文件都不会出现在解压的包中。

.Rbuildignore的介绍

.Rbuildignore 防止源码包中的文件出现在压缩包中。它允许你在源码包中包含比压缩包中更多的目录。这在你从其他文件生成包的内容(比如数据)时特别有用。这些文件应该包含在源码包中,但是只有结果需要发布。这对于 CRAN 包(顶层目录的个数是固定的)来说特别重要

一个典型的 .Rbuildignore 文件

2.4.3 二进制包

二进制包是一个单独的文件。如果将它解压缩,你会看到它的内部结构和源码包大不一样

二进制包是平台相关的:不能在 Mac 上安装一个 Windows 二进制包,也不能在Windows 上安装一个Mac 二进制包

Meta/ 目录包含大量 Rds 文件:这些文件缓存了包的一些元数据,比如帮助文件包含了什么主题,以及解析出的 DESCRIPTION 文件中的版本信息。

html/ 目录包含 HTML 的帮助文件

如果包中 src/ 目录下有代码,那么现在将有一个 libs/ 目录,其中包含了编译过的 32 位(i386/)和 64 位(x64/)代码。

inst/ 目录下的内容被移到了顶层目录

2.4.4 已安装的包

已安装的包只是解压到一个包库的二进制包。在理想的情况下,安装一个包包括一系列简单的步骤:源码包→压缩包,压缩包→二进制包,二进制包→已安装的包。

支持所有包安装的工具是 R 的命令行工具 R CMD INSTALL,它可以安装源码包、压缩包和二进制包。

  • devtools 的函数封装了这个工具,devtools::install() 有效地封装了 R CMD INSTALLdevtools::build() 封装了 R CMD BUILD,可以把源码包打包成压缩包。devtools::install_github() 从 GitHub 下载源码包,运行 build() 来生成使用指南,然后使用 R CMD INSTALL 安装包。
  • install.packages() 用于下载和安装 CRAN 编译的二进制包。他的工作方式是它载源码包,编译,然后安装。

2.4.5 内存中的包

library() 和 require() 会加载和附加一个已安装的包。在写脚本的时候,加载和附加包之间的区别并不重要;但是在写包的时候,这个区别是非常重要的。

2.5 什么是库

库是一个包含已安装包的目录

你的电脑中可以有多个库。事实上,几乎每个人都至少有两个库:一个用来放已经安装的包,另一个用来放 R 安装时自带的包(如 base、stats 等)。通常情况下,用户安装包的目录在不同的 R 版本下有所不同。这就是为什么你重新安装 R 以后,以前安装的包好像都丢了,实际上它们仍然在你的硬盘上,只是 R 找不到它们而已。

使用 .libPaths() 来查看当前正在使用的库是哪个

.libPaths()

参考文献

中文书籍 (ituring.com.cn)

R Packages (2e) (r-pkgs.org)

英文书籍Writing R Extensions (r-project.org) (官方 R 扩展开发手册)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/726062.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2024年 AI 辅助研发趋势

AI辅助是指人工智能(AI)技术被应用于辅助人们完成各种工作、任务或活动的过程。这种辅助可以包括提供智能建议、支持决策制定、自动化流程、增强人与机器之间的交互等。AI辅助通常旨在提高效率、减少人力成本、提升工作质量,并有助于拓展人类…

JavaScript实现遍历精灵图的效果

问题描述&#xff1a;通过JavaScript将精灵图里面的小图标给遍历出来。 关键代码&#xff1a; <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width…

为什么猫咪主食冻干价格相差那么大?性价比高的主食冻干分享

养猫知识的不断普及&#xff0c;让主食冻干喂养逐渐受到铲屎官的青睐。但价格仍是部分铲屎官的顾虑。像我这样的资深猫友&#xff0c;早已开始尝试主食冻干喂养。虽然价格稍高&#xff0c;但其为猫咪带来的实际好处是远超其价格的。 作为一个多猫家庭的铲屎官&#xff0c;纯主食…

使用Echarts绘制中国七大区地图

先上效果图&#xff08;文字是否显示&#xff0c;显示什么字&#xff0c;各种颜色之类的&#xff0c;都能随便改&#xff09; 直接上完整代码 <!DOCTYPE html> <html style"height: 100%"><head><meta charset"utf-8" /></hea…

[最佳实践] Windows上构建一个和Linux类似的Terminal

感谢大佬批评指正&#xff0c;现已更新 preview Target&#xff1a;致力打造最赏心悦目Window下的终端&#xff0c;同时能够很接近Linux的使用习惯 key word&#xff1a;windows终端美化 windows terminal windows powershell 类似Linux下的Window终端 Window也能用ll windows…

如何减少AI中的偏见问题:八种方法避免AI偏见渗入模型

克服与避免 AI 偏见的八大方法 AI 中的算法偏见是一个普遍存在的问题&#xff0c;它虽然不可能完全消除&#xff0c;但却可以通过科学的方法积极地防止这种偏见。我们将在本文中围绕如何应对AI中的偏见问题展开深入的讨论。 您可能会回想起新闻中报道的一些存在偏见的算法示例…

JavaScript编程艺术:深度解析计算机程序的构造与解释【文末送书-32】

文章目录 JavaScript编程艺术&#xff1a;深度解析计算机程序的构造与解释第一部分&#xff1a;程序的构造第二部分&#xff1a;程序的解释第三部分&#xff1a;实例分析 计算机程序的构造和解释&#xff08;JavaScript版&#xff09;【文末送书-32】 JavaScript编程艺术&#…

利用MATLAB模拟点电荷的电场分布

一、实验目的&#xff1a; 1&#xff0e;熟悉点电荷的电场分布情况&#xff1b; 2&#xff0e;学会使用Matlab绘图&#xff1b; 二、实验内容&#xff1a; 1&#xff0e;根据库伦定律&#xff0c;利用Matlab强大的绘图功能画出单个点电荷的电场分布情况&#xff0c;包括电力…

小型园区配置示例——华为

小型园区配置示例 组网图形 图1 小型园区组网图 组网需求数据规划配置思路操作步骤业务验证 组网需求 某企业划分为A、B两个部门&#xff0c;企业中的用户可以相互访问&#xff0c;并且企业中的用户可访问Internet。 如图1所示&#xff0c;在小型园区中&#xff0c;S2700…

idea2023版使用废弃类没有删除线处理方法

idea2023版使用废弃类没有删除线处理方法 新版Idea使用废弃类时,默认是黄色警告处理方法1. 打开file -> setting2. 编辑(Editor) -> 检查(Inspections) -> 搜索Deprecated API usage 新版Idea使用废弃类时,默认是黄色警告 处理方法 1. 打开file -> setting 2. 编…

单点登录是怎么工作的?

本文转自 公众号 ByteByteGo&#xff0c;如有侵权&#xff0c;请联系&#xff0c;立即删除 单点登录是怎么工作的&#xff1f; 今天来聊聊单点登录&#xff08;Single Sign On&#xff09;。 01 单点登录的主要参与者 用户 - 申请访问应用程序的个人身份供应商&#xff08;I…

浪潮服务器使用ARCCONF查看RAID配置信息

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、获取ARCCONF二、使用步骤1.Windows Server 20221.查看RAID控制器2.查询控制器属性3.查询虚拟磁盘属性4.查询物理硬盘属性 2.Ubuntu-22.043.CentOS7 三、配置…

matlab读取hdf5格式的全球火灾排放数据库Global Fire Emissions Database(GFED)数据

1.引言 火灾是大气中痕量气体和气溶胶的重要来源&#xff0c;并且是全球尺度上最重要的干扰因素。此外&#xff0c;森林砍伐和热带泥炭地火灾以及火灾频率增加的地区&#xff0c;都会增加大气中二氧化碳的积累。烧毁面积提供了生物质燃烧事件期间受火灾影响土地的估算&#xff…

300分钟吃透分布式缓存-20讲:Redis如何处理文件事件和时间事件?

Redis 事件驱动模型 事件驱动模型 Redis 是一个事件驱动程序&#xff0c;但和 Memcached 不同的是&#xff0c;Redis 并没有采用 libevent 或 libev 这些开源库&#xff0c;而是直接开发了一个新的事件循环组件。Redis 作者给出的理由是&#xff0c;尽量减少外部依赖&#xff…

Flink:Temporal Table 的两种实现方式 Temporal Table DDL 和 Temporal Table Function

博主历时三年精心创作的《大数据平台架构与原型实现&#xff1a;数据中台建设实战》一书现已由知名IT图书品牌电子工业出版社博文视点出版发行&#xff0c;点击《重磅推荐&#xff1a;建大数据平台太难了&#xff01;给我发个工程原型吧&#xff01;》了解图书详情&#xff0c;…

WordPress建站入门教程:phpMyAdmin4.8.5出现Fatal error: Unparenthesized错误怎么办?

我们在本地电脑使用小皮面板phpstudy安装phpMyAdmin4.8.5成功后&#xff0c;但是点击【管理】功能打开时却出现如下错误&#xff1a; Fatal error: Unparenthesized a ? b : c ? d : e is not supported. Use either (a ? b : c) ? d : e or a ? b : (c ? d : e) in D:\…

基于springboot的精准扶贫管理系统论文

精准扶贫管理系统 摘要 随着信息技术在管理上越来越深入而广泛的应用&#xff0c;管理信息系统的实施在技术上已逐步成熟。本文介绍了精准扶贫管理系统的开发全过程。通过分析精准扶贫管理系统管理的不足&#xff0c;创建了一个计算机管理精准扶贫管理系统的方案。文章介绍了精…

深度学习的应用实例:从自然语言处理到计算机视觉的突破

深度学习在各个领域中展现出了强大的应用潜力&#xff0c;特别是在自然语言处理、计算机视觉、语音识别和机器翻译等方向&#xff0c;其取得的成果令人瞩目。 一、自然语言处理&#xff1a;深度学习的革命性影响 自然语言处理&#xff08;NLP&#xff09;一直是人工智能领域的…

【新书推荐】16.2 显示中断

本节内容&#xff1a;屏幕显示的实现——显示I/O中断处理程序。显示器通过显示适配卡与系统相连&#xff0c;显示适配卡是显示输出的接口。早期显示适配卡是CGA和EGA等&#xff0c;目前常见的适配卡是VGA、TVGA、DVI、DP、Mini HDMI和Micro HDMI接口等。它们都支持两类显示方式…

简洁实用的wordpress外贸网站模板

坚果蜜饯wordpress跨境电商模板 木瓜干、菠萝干、夏威夷果、芒果干、椰片、巴旦木等wordpress跨境电商模板。 https://www.jianzhanpress.com/?p3944 珠宝手饰wordpress外贸网站模板 金银手饰、珍珠手饰、翡翠手饰、钻石手饰、玉石珠宝手饰wordpress外贸网站模板。 https:…