荟萃分析R Meta-Analyses 2----发现R

2.1安装R和R Studio

在开始之前,我们必须下载并准备一个计算机程序,该程序使我们能够方便地使用R进行统计分析。目前最好的选择可能是R Studio。该程序为我们提供了一个用户界面,使我们可以更轻松地处理数据、包和输出。最好的部分是 R Studio 完全免费,可以随时在 Internet 上下载。最近,R Studio 的在线版本已经发布,它通过网络浏览器为您提供基本相同的界面和功能。然而,在本书中,我们将重点关注直接安装在计算机上的 R Studio 版本。

在本章中,我们将重点介绍如何 在计算机上安装 R和 R Studio 。如果您已经在计算机上安装了 R Studio,并且您是经验丰富的R用户,那么这些对您来说可能都不陌生。那么你可以跳过这一章。如果您以前从未使用过R,请耐心等待。

让我们完成为我们的第一次编码工作设置R和 R Studio 的必要步骤。

  1. R Studio 是一个允许我们编写R代码并以简单的方式运行它的界面。但 R Studio 与R并不相同;它要求您的计算机上已安装R软件。首先,我们必须安装最新的R版本。与 R Studio 一样,R是完全免费的。它可以从综合R档案网络(CRAN)网站下载。您必须下载的R类型取决于您使用的是Windows PC还是Mac。关于R 的一个重要细节是它的版本R会定期更新,这意味着新版本可用。当您的R版本变得过于过时时,可能会出现某些功能不再起作用的情况。因此,通过重新安装R来定期(大约每年)更新R版本会很有帮助。对于本书,我们使用R版本 4.0.3。当您安装R时,可能已经有更高版本可用,建议始终安装最新版本。

  2. 下载并安装R后,您可以从R Studio 网站下载“R Studio Desktop” 。还有一些版本的 R Studio 需要您购买许可证,但这对于我们的目的来说绝对不是必需的。只需下载并安装 R Studio Desktop 的免费版本即可。

  3. 第一次打开 R Studio 时,它可能看起来很像图2.1所示。 R Studio 中有三个窗格。在右上角,我们有“环境”窗格,它显示我们在R内部定义(即保存)的对象。在右下角,您可以找到“文件”、“绘图”、“包”和“帮助”窗格。该窗格有多种功能;例如,它用于显示计算机上的文件、显示绘图和已安装的软件包以及访问帮助页面。然而,R Studio 的核心位于左侧,您可以在其中找到Console。控制台是所有R代码输入然后运行的地方。

R Studio 中的窗格。

图 2.1:R Studio 中的窗格。

  1. R Studio 中有第四个窗格,通常不会在开始时显示,即窗格。您可以通过单击菜单中的“文件” > “新建文件” > “R 脚本”来打开源窗格。这将在左上角打开一个新窗格,其中包含一个空的R 脚本R脚本是将代码收集到一个地方的好方法;您还可以将它们保存为计算机上扩展名为“.R”的文件(例如 myscript.R )。要运行R脚本中的代码,请通过将光标拖过所有相关行来选择它,然后单击右侧的“运行”按钮。这会将代码发送到控制台,并在那里对其进行评估。快捷键是 Ctrl + R (Windows) 或 Cmd + R (Mac)。




假设我们想知道 9 的平方根是多少。在R中,我们可以使用该sqrt函数来实现此目的。我们只需提供9函数的输入即可获得结果。你可以自己尝试一下。在控制台中的小箭头 ( >) 旁边,写下内容sqrt(9),然后按 Enter 键。让我们看看会发生什么。

sqrt(9)## [1] 3

我们现在收到了R的第一个输出。它告诉我们 9 的平方根是 3。虽然R中的函数比这个复杂得多,但它们都遵循相同的原则:您提供函数所需的参数信息,函数使用此信息来进行计算,最后,它为您提供输出。


  • {tidyverse}. The {tidyverse} package (Wickham et al. 2019) is not a single package, but actually a bundle of packages which make it easy to manipulate and visualize data in R. When we install the {tidyverse} package, this provides us with the {ggplot2}{dplyr}{tidyr}{readr}{purrr}{stringr} and {forcats} package at the same time. Functions included in the tidyverse have become very popular in the R community in recent years, and are used by many researchers, programmers and data scientists. If you want to learn more about the tidyverse, you can visit its website.

  • {meta}. This package contains functions which make it easy to run different types of meta-analyses (Balduzzi, Rücker, and Schwarzer 2019). We will primarily focus on this package in the guide, because it is easy to use, well documented, and very versatile. More info on the {meta} package can be found on its website.

  • {metafor}. The {metafor} package (Viechtbauer 2010) is also dedicated to conducting meta-analyses, and a true powerhouse in terms of functionality. Since we will use this package at times in later chapters, and because {metafor} is used by the {meta} package for many applications, it is best to have it installed. The {metafor} package also has an excellent documentation for various meta-analysis-related topics.

  • Installing a package.

    Figure 2.2: Installing a package.

    The install.packages function only requires the name of the package we want to install as input. One package after another, our code should look like this:


    Simply type the code above into the console; then hit Enter to start the installation (see Figure 2.1).

  • 不要忘记将包名称放入引号"") 中。否则,您将收到错误消息。

    按 Enter 键后,R将开始安装软件包并打印一些有关安装进度的信息。当install.packages函数完成后,包就可以使用了。安装的软件包被添加到R系统库中。可以在R Studio 屏幕左下角的“包”窗格中访问该系统库。每当我们想要使用已安装的包时,我们都可以使用该library函数从我们的库中加载它。让我们尝试一下,并加载{tidyverse}包。

  • library(tidyverse)

  • 2.3 { dmetar}


    为了填补这一空白,我们开发了{dmetar}包,它作为本书的配套R包。 {dmetar}包有自己的文档,可以在线找到。{dmetar}包的函数为{meta}{metafor}包(以及其他一些更高级的包)提供了附加功能,我们将在本指南中经常使用它们。本书将详细介绍{dmetar}包中包含的大多数功能以及它们如何改进元分析工作流程。我们在本指南中使用的大多数示例数据集也包含在{dmetar}中。



    要安装{dmetar}软件包,您计算机上的R版本必须为 3.6 或更高版本。如果您最近(重新)安装了R,则可能会出现这种情况。要检查您的R版本是否足够新,您可以将此行代码粘贴到控制台中,然后按 Enter 键。

  • R.Version()$version.string

    This will display the current R version you have. If the R version is below 3.6, you will have to update it. There are good blog posts on the Internet providing guidance on how to do this.

    If you want to install {dmetar}, one package already needs to be installed on your computer first. This package is called {devtools}. So, if {devtools} is not on your computer yet, you can install it like we did before.


    You can then install {dmetar} using this line of code:


    This will initiate the installation process. It is likely that the installation will take some time because several other packages have to be installed along with the {dmetar} package for it to function properly. During the installation process, the installation manager may ask you if you want to update existing R packages on your computer. The output may look something like this:

  • ## These packages have more recent versions available.
    ## Which would you like to update?
    ## 1: All                          
    ## 2: CRAN packages only            
    ## 3: None                          
    ## 4: ggpubr (0.2.2 -> 0.2.3) [CRAN]
    ## 5: zip    (2.0.3 -> 2.0.4) [CRAN]
    ## Enter one or more numbers, or an empty line to skip updates:

    When you get this message, it is best to tell the installation manager that no packages should be updated. In our example, this means pasting 3 into the console and then hitting Enter. In the same vein, when the installation manager asks this question:

    ## There are binary versions available but the source versions are later:
    ##  [...]
    ##   Do you want to install from sources the package which needs compilation?
    ##   y/n: 

    It is best to choose n (no). If the installation fails with this strategy (meaning that you get an Error), run the installation again, but update all packages this time.

    When writing this book and developing the package, we made sure that everyone can install it without errors. Nevertheless, there is still a chance that installing the package does not work at the first try. If the installation problem persists, you can have a look at the “Contact Us” section in the Preface of this book.

    2.4 Data Preparation & Import

    This chapter will tell you how to import data into R using R Studio. Data preparation can be tedious and exhausting at times, but it is the backbone of all later steps. Therefore, we have to pay close attention to bringing the data into the correct format before we can proceed.

    Usually, data imported into R is stored in Microsoft Excel spreadsheets first. We recommend to store your data there because this makes it very easy to do the import. There are a few “Dos and Don’ts” when preparing the data in Excel.

  • It is very important how you name the columns of your spreadsheet. If you already named the columns of your sheet adequately in Excel, you can save a lot of time later because your data does not have to be transformed using R. “Naming” the columns of the spreadsheet simply means to write the name of the variable into the first line of the column; R will automatically detect that this is the name of the column then.

  • Column names should not contain any spaces. To separate two words in a column name, you can use underscores or points (e.g. “column_name”).

  • It does not matter how columns are ordered in your Excel spreadsheet. They just have to be labeled correctly.

  • There is also no need to format the columns in any way. If you type the column name in the first line of your spreadsheet, R will automatically detect it as a column name.

  • It is also important to know that the import may distort special characters like ä, ü, ö, á, é, ê, etc. You might want to transform them into “normal” letters before you proceed.

  • Make sure that your Excel file only contains one sheet.

  • If you have one or several empty rows or columns which used to contain data, make sure to delete those columns/rows completely, because R could think that these columns contain (missing) data and import them also.

  • Let us start with an example data set. Imagine that you plan to conduct a meta-analysis of suicide prevention programs. The outcome you want to focus on in your study is the severity of suicidal ideation (i.e. to what degree individuals think about, consider, or plan to end their life), assessed by questionnaires. You already completed the study search and data extraction, and now want to import your meta-analysis data in R.

    The next task is therefore to prepare an Excel sheet containing all the relevant data. Table 2.1 presents all the data we want to import. In the first row, this table also shows how we can name our columns in the Excel file based on the rules we listed above. We can see that the spreadsheet lists each study in one row. For each study, the sample size (n�), mean and standard deviation (SD��) is included for both the intervention and control group. This is the outcome data needed to calculate effect sizes, which is something we will cover in detail in Chapter 3. The following three columns contain variables we want to analyze later on as part of the meta-analysis.

    We have prepared an Excel file for you called “SuicidePrevention.xlsx”, containing exactly this data. The file can be downloaded from the Internet.

    Table 2.1: The suicide prevention dataset.











    Intervention Group

    Control Group


    AuthorNMeanSDNMeanSDYearAge GroupControl Group
    Berry et al. 9014.983.299515.544.412006generalWLC
    DeVries et al. 7716.215.356920.137.432019older adultno intervention
    Fleming et al. 303.010.87303.131.232006generalno intervention
    Hunt & Burke6419.326.416520.227.622011generalWLC
    McCarthy et al. 504.542.75505.612.661997generalWLC

    To import our Excel file in R Studio, we have to set a working directory first. The working directory is a folder on your computer from which R can use data, and in which outputs are saved. To set a working directory, you first have to create a folder on your computer in which you want all your meta-analysis data and results to be saved. You should also save the “SuicidePrevention.xlsx” file we want to import in this folder.

    Then start R Studio and open your newly created folder in the bottom left Files pane. Once you have opened your folder, the Excel file you just saved there should be displayed. Then set this folder as the working directory by clicking on the little gear wheel on top of the pane, and then on Set as working directory in the pop-up menu. This will make the currently opened folder the working directory.

  • 这将使当前打开的文件夹成为工作目录。

    设置工作目录; R环境中加载的数据集。

    图2.3:设置工作目录; R环境中加载的数据集。


    然后,您的数据集及其名称应列SuicidePrevention在右上方的环境窗格中。这意味着您的数据现已加载并可供R代码使用。像我们在这里导入的表格数据集在R中称为数据框data.frame) 。数据框是具有列和行的数据集,就像我们刚刚导入的Excel电子表格一样。


    也可以直接使用代码导入数据文件。我们可以使用一个很好的包来执行此操作,称为{openxslx} ( Schauberger and Walker 2020 )。与所有R软件包一样,您必须先安装它。然后您可以使用该read.xlsx功能导入Excel工作表。


    data <- read.xlsx("SuicidePrevention.xlsx")


    现在我们已经使用 R Studio 导入了第一个数据集,让我们进行一些操作。数据整理,意味着对数据进行转换以使其可用于进一步分析,是所有数据分析的重要组成部分。一些职业,例如数据科学家,花费大部分时间将原始的“杂乱”数据转变为“整齐”的数据集。{tidyverse}的函数为数据整理提供了一个出色的工具箱。如果您尚未从库中加载包,则应该立即为以下示例加载该包。





    ## Rows: 9
    ## Columns: 10
    ## $ author    <chr> "Berry et al.", "DeVries et al.", "Fleming et al.", "Hunt & …
    ## $ n.e       <chr> "90", "77", "30", "64", "50", "109", "60", "40", "51"
    ## $ mean.e    <chr> "14.98", "16.21", "3.01", "19.32", "4.54", "15.11", "3.44", …
    ## $ sd.e      <chr> "3.29", "5.35", "0.87", "6.41", "2.75", "4.63", "1.26", "0.7…
    ## $ n.c       <dbl> 95, 69, 30, 65, 50, 111, 60, 40, 56
    ## $ mean.c    <chr> "15.54", "20.13", "3.13", "20.22", "5.61", "16.46", "3.42", …
    ## $ sd.c      <chr> "4.41", "7.43", "1.23", "7.62", "2.66", "5.39", "1.88", "1.4…
    ## $ pubyear   <dbl> 2006, 2019, 2006, 2011, 1997, 2000, 2013, 2015, 2014
    ## $ age_group <chr> "general", "older adult", "general", "general", "general", "…
    ## $ control   <chr> "WLC", "no intervention", "no intervention", "WLC", "WLC", "…


    <num>代表数字.这是所有以数字形式存储的数据(例如 1.02)。



    • <log>代表逻辑。这些是二元变量,这意味着它们表示条件是TRUEFALSE

    • <factor>代表因子.因子存储为数字,每个数字表示变量的不同级别。变量的可能因子水平可能为 1 =“低”、2 =“中”、3 =“高”。


    SuicidePrevention$n.e## [1] "90"  "77"  "30"  "64"  "50"  "109" "60"  "40"  "51"
    class(SuicidePrevention$n.e)## [1] "character"


    mean(SuicidePrevention$n.e)## Warning in mean.default(SuicidePrevention$n.e): argument is not numeric or
    ## logical: returning NA
    ## [1] NA

    为了使我们的数据集可用,我们通常必须首先将列转换为正确的类。为此,我们可以使用一组均以“ as.”开头的函数: as.numericas.character和。让我们看几个例子。as.logicalas.factor

    glimpse在之前函数的输出中,我们看到有几列已被赋予character类,而它们应该是numeric。这涉及列n.emean.esd.emean.csd.c我们看到出版年份pubyear有class <dbl>。这代表double,意味着该列是一个数值向量。在R中使用double和来指代数字数据类型是一个历史异常现象。然而,通常这没有实际意义。numeric

    然而,某些数值在我们的数据集中被编码为字符这一事实将导致下游出现问题,因此我们应该使用该as.numeric函数更改类。我们为函数提供要更改的列,然后使用赋值运算符<-) 将输出保存回其原始位置。这导致以下代码。

    SuicidePrevention$n.e <- as.numeric(SuicidePrevention$n.e)
    SuicidePrevention$mean.e <- as.numeric(SuicidePrevention$mean.e)
    SuicidePrevention$sd.e <- as.numeric(SuicidePrevention$sd.e)
    SuicidePrevention$n.c <- as.numeric(SuicidePrevention$n.c)
    SuicidePrevention$mean.c <- as.numeric(SuicidePrevention$mean.c)
    SuicidePrevention$sd.c <- as.numeric(SuicidePrevention$sd.c)
    SuicidePrevention$n.c <- as.numeric(SuicidePrevention$n.c)



    <span style="color:#000000"><span style="background-color:#fffefa"><span style="color:#212529"><span style="background-color:#f6f5f1"><code><span style="color:#19177c">SuicidePrevention</span><span style="color:#696969">$</span><span style="color:#19177c">age_group</span> <span style="color:#696969"><-</span> <span style="color:#4254a7"><a data-cke-saved-href="https://rdrr.io/r/base/factor.html" href="https://rdrr.io/r/base/factor.html">as.factor</a></span><span style="color:#696969">(</span><span style="color:#19177c">SuicidePrevention</span><span style="color:#696969">$</span><span style="color:#19177c">age_group</span><span style="color:#696969">)</span>
    <span style="color:#19177c">SuicidePrevention</span><span style="color:#696969">$</span><span style="color:#19177c">control</span> <span style="color:#696969"><-</span> <span style="color:#4254a7"><a data-cke-saved-href="https://rdrr.io/r/base/factor.html" href="https://rdrr.io/r/base/factor.html">as.factor</a></span><span style="color:#696969">(</span><span style="color:#19177c">SuicidePrevention</span><span style="color:#696969">$</span><span style="color:#19177c">control</span><span style="color:#696969">)</span></code></span></span></span></span>


    <span style="color:#000000"><span style="background-color:#fffefa"><span style="color:#212529"><span style="background-color:#f6f5f1"><code><span style="color:#4254a7"><a data-cke-saved-href="https://rdrr.io/r/base/levels.html" href="https://rdrr.io/r/base/levels.html">levels</a></span><span style="color:#696969">(</span><span style="color:#19177c">SuicidePrevention</span><span style="color:#696969">$</span><span style="color:#19177c">age_group</span><span style="color:#696969">)</span></code></span></span></span></span>
    ## [1] "general"     "older adult"
    <span style="color:#000000"><span style="background-color:#fffefa"><span style="color:#212529"><span style="background-color:#f6f5f1"><code><span style="color:#4254a7"><a data-cke-saved-href="https://rdrr.io/r/base/nlevels.html" href="https://rdrr.io/r/base/nlevels.html">nlevels</a></span><span style="color:#696969">(</span><span style="color:#19177c">SuicidePrevention</span><span style="color:#696969">$</span><span style="color:#19177c">age_group</span><span style="color:#696969">)</span></code></span></span></span></span>
    ## [1] 2

    我们还可以使用该levels函数来更改因子标签的名称。我们只需为原始标签分配新名称即可。要在R中执行此操作,我们必须使用concatenate , orc函数。此函数可以将两个或多个单词或数字连接在一起并创建一个元素。让我们试试这个。

    SuicidePrevention$age_group <- as.factor(SuicidePrevention$age_group)
    SuicidePrevention$control <- as.factor(SuicidePrevention$control)
    ## [1] "gen"   "older"


    levels(SuicidePrevention$age_group) <- new.factor.levels



    ## [1] gen   older gen   gen   gen   gen   gen   older older
    ## Levels: gen older

    还可以使用创建逻辑as.logical。假设我们想要重新编码该列pubyear,以便它仅显示 2009 年之后发布的研究。为此,我们必须通过代码定义是/否规则。我们可以使用“大于或等于”运算符来完成此操作>=,然后将其用作函数的输入as.logical

    ## [1] 2006 2019 2006 2011 1997 2000 2013 2015 2014
    as.logical(SuicidePrevention$pubyear >= 2010)

    我们可以看到,这对pubyearasTRUE或中的每个元素进行编码FALSE,具体取决于出版年份是否大于或等于 2010 年。


    R中,有多种方法可以提取数据帧的子集。我们已经介绍了一种方法,即$运算符,它可用于提取列。从数据集中提取切片的更通用方法是使用方括号。使用方括号时我们必须遵循的通用形式是data.frame[rows, columns]。始终可以使用行和列在数据集中出现的数字来提取行和列。例如,我们可以使用下面的代码来提取数据框第二行的数据。

##           author n.e mean.e sd.e n.c mean.c sd.c pubyear age_group
## 2 DeVries et al.  77  16.21 5.35  69  20.13 7.43    2019     older
##           control
## 2 no intervention


SuicidePrevention[2, 1]

 ## [1] "DeVries et al."

要选择特定的切片,我们必须c再次使用 concatenate ( ) 函数。例如,如果我们想要提取第2行和第3行以及第4行和第6列,我们可以使用此代码。

SuicidePrevention[c(2,3), c(4,6)]

##   sd.e mean.c
## 2 5.35  20.13
## 3 0.87   3.13


SuicidePrevention[, c("author", "control")]


##            author         control
## 1    Berry et al.             WLC
## 2  DeVries et al. no intervention
## 3  Fleming et al. no intervention
## 4    Hunt & Burke             WLC
## 5 McCarthy et al.             WLC
## 6   Meijer et al. no intervention
## 7   Rivera et al. no intervention
## 8  Watkins et al. no intervention
## 9  Zaytsev et al. no intervention

另一种可能性是根据行值过滤数据集。我们可以使用该filter函数来做到这一点。在函数中,我们需要指定数据集名称以及过滤逻辑。一个相对简单的例子是过滤所有n.e等于或小于 50 的研究。

filter(SuicidePrevention, n.e <= 50)

##            author n.e mean.e sd.e n.c mean.c sd.c pubyear age_group
## 1  Fleming et al.  30   3.01 0.87  30   3.13 1.23    2006       gen
## 2 McCarthy et al.  50   4.54 2.75  50   5.61 2.66    1997       gen
## 3  Watkins et al.  40   7.10 0.76  40   7.38 1.41    2015     older
##           control
## 1 no intervention
## 2             WLC
## 3 no intervention


filter(SuicidePrevention, author %in% c("Meijer et al.",
                                        "Zaytsev et al."))

##           author n.e mean.e sd.e n.c mean.c  sd.c pubyear age_group
## 1  Meijer et al. 109  15.11 4.63 111  16.46  5.39    2000       gen
## 2 Zaytsev et al.  51  23.74 7.24  56  24.91 10.65    2014     older
##           control
## 1 no intervention
## 2 no intervention


filter(SuicidePrevention, !author %in% c("Meijer et al.", 
                                         "Zaytsev et al."))


当然,也可以更改R数据框中的特定值,或扩展它们。要更改R内部保存的数据,我们必须使用赋值运算符。让我们重新使用之前学到的有关数据切片的知识来更改数据集中的特定值。想象一下,我们犯了一个错误,德弗里斯等人的研究的发表年份。被错误地报告为 2019 年,而实际上应该是 2018 年。我们可以通过相应地切片数据集来更改该值,然后分配新值。请记住DeVries 等人的结果。在数据集的第二行中报告。

SuicidePrevention[2, "pubyear"] <- 2018
SuicidePrevention[2, "pubyear"]

## [1] 2018

也可以一次更改多个值。例如,如果我们想要为数据集中的每个干预组均值添加 5,我们可以使用此代码来实现。

SuicidePrevention$mean.e + 5
## [1] 19.98 21.21  8.01 24.32  9.54 20.11  8.44 12.10 28.74


SuicidePrevention$mean.e - SuicidePrevention$mean.c

## [1] -0.56 -3.92 -0.12 -0.90 -1.07 -1.35  0.02 -0.28 -1.17

正如您所看到的,这取每项研究的干预组平均值,然后减去对照组平均值,每次都使用同一行的值。想象一下我们稍后想要使用这个均值差。因此,我们希望将其保存为一个名为 的额外对象md,并将其作为新列添加到我们的SuicidePrevention数据框中。使用赋值运算符两者都很容易。

md <- SuicidePrevention$mean.e - SuicidePrevention$mean.c

SuicidePrevention$md <- SuicidePrevention$mean.e - 


SuicidePrevention$n.c %>% mean()

## [1] 64

诚然,在这个例子中,很难看出这种管道的附加值。管道的特殊优势在于它们允许我们将许多功能链接在一起。想象一下,我们想知道对照组样本量平均值的平方根,但仅限于 2009 年之后发表的研究。管道让我们可以轻松地一步完成此操作。

SuicidePrevention %>% 
  filter(pubyear > 2009) %>% 
  pull(n.c) %>% 
  mean() %>% 

## [1] 7.615773

在管道中,我们使用了一个之前没有涉及过的函数,即 函数pull。这个函数可以看作是$我们在管道中使用的运算符的等价物。它只是“拉出”我们在函数中指定的变量,因此可以将其转发到管道的下一部分。


R 中的许多函数需要多个参数,并且不可能记住如何正确使用所有函数。值得庆幸的是,没有必要熟记每个函数是如何使用的。 R Studio使我们可以轻松访问R文档,其中每个函数都有详细的描述页面。

有两种方法可以搜索函数文档页面。第一种方法是访问R Studio 左下角的“帮助”窗格,然后使用搜索栏查找有关特定函数的信息。更方便的方法是简单地运行,? 然后在控制台中输入函数名称,例如 ?mean。这将自动打开该函数的文档条目。

函数的R 文档通常至少包含“用法”“参数”和 “示例”部分。参数和 示例部分通常对于理解函数的使用方式特别有帮助 


一旦我们对数据进行了转换并将其保存在R内部,我们就必须在某个时候将其导出。我们建议您在保存R数据帧时使用两种类型的文件格式: .rda.csv

以.rda结尾的文件代表Data。它是专门针对R 的文件类型,具有所有优点和缺点。.rda文件的优点是可以轻松地在R中重新打开它们,并且不存在数据在导出过程中可能被扭曲的风险。它们的用途也非常广泛,可以保存不适合电子表格格式的数据。缺点是只能在R中打开;但对于某些项目来说,这已经足够了。

要将对象另存为.rda数据文件,您可以使用该save函数。在该函数中,您必须提供 (1) 对象的名称,以及 (2)您希望文件具有的确切名称,包括文件结尾。运行该函数会将文件保存到您的工作目录中。

 save(SuicidePrevention, file = "suicideprevention.rda")

以.csv结尾的文件代表逗号分隔值。一般来说,这种格式是最常用的数据格式之一。它可以由许多程序打开,包括Excel。您可以使用该write.csv函数将数据保存为.csv。代码结构和行为与 的代码结构和行为几乎相同save,但提供的对象需要是数据框或其他表格数据对象。当然,您需要指定文件类型“.csv”。

write.csv(SuicidePrevention, file = "suicideprevention.csv") 


继续学习的一个好方法是查看 Hadley Wickham 和 Garrett Grolemund 的书《R for Data Science》 (2016 年)。与本指南一样,这本书可以完全免费在线阅读。此外,我们还在下一页收集了一些练习,您可以用它们来练习我们在这里学到的知识。




对于这些练习,我们将使用一个名为 的新数据集 data。您可以使用以下代码直接在R中创建此数据集 :

data <- data.frame("Author" = c("Jones", "Goldman", 
                                "Townsend", "Martin", 
                   "TE" = c(0.23, 0.56, 
                            0.78, 0.23, 
                  "seTE" = c(0.324, 0.235, 
                             0.394, 0.275, 
                  "subgroup" = c("one", "one", 
                                 "two", "two", 


  1. 显示变量Author.
  1. 转换subgroup为一个因子。
  1. 选择“Jones”和“Martin”研究的所有数据。
  1. 将研究名称“Rose”更改为“Bloom”。
  1. TE_seTE_diff通过 seTE从中减去来 创建一个新变量TE。将结果保存在 data.
  1. 使用管道 (1) 过滤subgroup“一个”或“两个”中的所有研究,(2) 选择变量TE_seTE_diff,(3) 取变量的平均值,然后exp对其应用函数。访问R文档以了解该 exp函数的作用。

这些问题的答案列于本书末尾的附录 A中。


  • R已成为世界上最强大、最常用的统计编程语言之一。

  • R不是具有图形用户界面和预定义功能的计算机程序。它是一种完整的编程语言,世界各地的人们都可以向其贡献免费的附加组件,即所谓的

  • R Studio 是一个计算机程序,它允许我们以方便的方式使用R进行统计分析。

  • R的基本构建块是函数。其中许多功能可以通过我们可以从互联网安装的包导入。

  • 函数可用于使用R导入、操作、分析和保存数据。





目录 一、背景 二、代码 一、背景 由于系统上需要分页展示数据&#xff0c;并提供按字段筛选数据的功能&#xff0c;于是需要我写个接口&#xff0c;以供前端使用。 接口可以通过python flask框架实现。Flask是一个轻量级的Web框架&#xff0c;它提供了足够的灵活性来构建定…


在当今的前端开发领域&#xff0c;样式表语言的进步已经显著提升了代码组织性和可维护性。Sass&#xff08;Syntactically Awesome Style Sheets&#xff09;作为CSS预处理器的翘楚&#xff0c;以其强大的变量、嵌套规则、混合宏&#xff08;mixin&#xff09;、循环和函数等高…

STM32学习笔记(6_5)- TIM定时器的输出捕获原理

无人问津也好&#xff0c;技不如人也罢&#xff0c;都应静下心来&#xff0c;去做该做的事。 最近在学STM32&#xff0c;所以也开贴记录一下主要内容&#xff0c;省的过目即忘。视频教程为江科大&#xff08;改名江协科技&#xff09;&#xff0c;网站jiangxiekeji.com 现在开…

ASR-LLM-TTS 大模型对话实现案例;语音识别、大模型对话、声音生成

参考:https://blog.csdn.net/weixin_42357472/article/details/136305123(llm+tts) https://blog.csdn.net/weixin_42357472/article/details/136411769 (asr+vad) 这里LLM用的是chatglm;电脑声音播报用的playsound 代码: ##运行 python main.pymain.py from multipro…


一,安装homebrew 必须安装了homebrew&#xff0c;可在终端输入命令brew -v查看是否已经安装,没安装的话安装一下: 如果未安装先安装&#xff08;网上很多文章&#xff09; 二,查看nginx是否存在 使用命令:brew search nginx查看nginx是否存在: 不存在的话,就使用brew inst…

mac 系统如何生成秘钥

1.打开终端&#xff0c;输入 cd ~/.ssh 进入.ssh目录&#xff0c;输入 ls 检查是否已经存在SSH密钥。如果看到类似 id_rsa.pub 的文件&#xff0c;说明已经有一对公钥和私钥&#xff0c;不用新建&#xff0c;直接查看就可以&#xff0c;如果没有需要生成新的密钥。 2.在终端输…


系列文章目录 提示&#xff1a;这里是该系列文章的所有文章的目录 第一章&#xff1a; &#xff08;一&#xff09;QtOpenCV调用海康工业相机SDK示例开发 第二章&#xff1a; &#xff08;二&#xff09;Qt多线程实现海康工业相机图像实时采集 第三章&#xff1a; &#xff08;…

许可型DeFi 项目NEOPIN:在合规的框架下推动DeFi的创新

合规化已成 DeFi 的主流方向 过去的几年里&#xff0c;全球金融市场见证了 DeFi 的快速增长。DeFi 通过提供无需中介的交易和借款等金融服务&#xff0c;为用户带来前所未有的便利。然而&#xff0c;其匿名性和去中心化的特性也为监管和安全带来挑战 —— DeFi项目的透明度不足…

C#自定义控件 生成 与 加入到项目

C#自定义控件生成 在C#中&#xff0c;自定义控件通常是通过继承现有的控件类&#xff08;如UserControl、Form等&#xff09;并添加或修改其属性和方法来实现的。以下是一个简单的示例&#xff0c;演示如何创建一个自定义控件&#xff1a; 首先&#xff0c;创建一个新的Window…

荟萃分析R Meta-Analyses 1

参考&#xff1a;Harrer, M.、Cuijpers, P.、Furukawa, TA 和 Ebert, DD (2021)。 使用 R 进行荟萃分析&#xff1a;实践指南。佛罗里达州博卡拉顿和伦敦&#xff1a;Chapman & Hall/CRC Press。 ISBN 978-0-367-61007-4。 1.1什么是荟萃分析&#xff1f; 它的创始人之一 G…


前言 有小伙伴在电脑上安装了独立显卡之后&#xff0c;总会用驱动人生或者驱动精灵等软件给独立显卡安装驱动。这种安装方法并不能说是错的&#xff0c;反正能用就行。 安装官方驱动的办法其实很简单&#xff0c;现在独立显卡一共就那么几家&#xff0c;最常见的显卡就是Nvidi…

我们是如何在 IDE 中设计 AutoDev 的 AI 编程开发智能体语言与框架?

上周微软发布了自家的 AI 编程和软件开发智能体框架&#xff1a;AutoDev&#xff0c;其与我们开发的 IDE 插件 AutoDev 有颇多的相似之处&#xff0c;特别是一些设计思路&#xff0c;以及在对于辅助软件开发任务的智能体以及一些基础设施上。 稍有不同的是&#xff1a; 交互介质…


随手笔记——禾赛Pandar64雷达旋转方向及坐标系定义 手册下载


一、简介 1. Maven&#xff1a; 基于 Java 平台的项目管理和整合工具&#xff0c;将项目的开发和管理过程抽象成一个项目对象模型&#xff08;POM&#xff09;。开发人员只需要做一些简单的配置&#xff0c;Maven 就可以自动完成项目的编译、测试、打包、发布以及部署等工作。…


Embedding与EmbeddingBag详解 ●&#x1f368; 本文为&#x1f517;365天深度学习训练营 中的学习记录博客 ●&#x1f356; 原作者&#xff1a;K同学啊 | 接辅导、项目定制 ●&#x1f680; 文章来源&#xff1a;K同学的学习圈子1、Embedding详解 Embedding是Pytorch中最基本…

备考ICA----Istio实验8---请求超时 Request Timeouts 实验

备考ICA----Istio实验8—请求超时 Request Timeouts 实验 1. 重置bookinfo环境 kubectl delete all --all --now kubectl delete dr --all kubectl delete vs --all kubectl delete gw --all kubectl apply -f istio/samples/bookinfo/platform/kube/bookinfo.yaml kubectl a…


STM32-01基于HAL库&#xff08;CubeMXMDKProteus&#xff09;仿真开发环境搭建&#xff08;LED点亮测试实例&#xff09; 一、 开发工具版本列表二、安装过程三、实例测试&#xff08;点亮单个LED&#xff09;0、功能需求分析1、Proteus绘制电路原理图2、STMCubeMX 配置引脚及模…

微服务day07 -- 搜索引擎 ( 数据聚合 + 自动补全 + 数据同步 + ES集群 )

1.数据聚合 聚合&#xff08;aggregations&#xff09;可以让我们极其方便的实现对数据的统计、分析、运算。例如&#xff1a; 什么品牌的手机最受欢迎&#xff1f; 这些手机的平均价格、最高价格、最低价格&#xff1f; 这些手机每月的销售情况如何&#xff1f; 实现这些…


文章目录 一、memcpy函数的使用和模拟实现1.1 memcpy函数的使用1.2 memcpy函数的模拟实现 二、memmove函数的使用和模拟实现2.1 memmove函数的使用2.2 memmove函数的模拟实现 三、memset函数的使用3.1 menset函数的使用 四、memcmp函数的使用4.1 memcmp函数的使用 学海无涯苦作…


前言 此篇文章已经是本系列的第四篇文章&#xff0c;意味着我们已经进入了Prompt工程的深水区&#xff0c;掌握的知识和技术都在不断提高&#xff0c;对于Prompt的技巧策略也不能只局限于局部运用而要适应LLM大模型的整体框架去进行改进休整。较为主流的LLM模型框架设计可以基…