一、R语言简介
R语言是专业的统计分析软件,来自著名数据科学网站(http://www.kdnuggets.com/)发起的一个2019年统计分析和数据挖掘软件使用情况的调查结果:
表明R语言是该领域近年来最受欢迎的软件之一。
R语言的优势:
(1) 免费开源,软件体积小根据需要安装扩展包,兼容各种常用操作系统;
(2) 专门为统计和数据分析开发的语言,有丰富的扩展包;
(3) 拥有顶尖水准的制图功能;
(4) 面向对象,简单易学。
缺点:内存管理机制较差,不擅长处理循环(这是老观念了,现在的R处理循环并不慢,处理循环速度的关键提升是:(1)提前分配存储空间,(2)选择合适的存放数据的数据结构),跑大数据量的程序速度慢(现在有data.table包是快速处理大数据的利器)。
二、R语言软件平台搭建
到R语言官网https://www.r-project.org/ 或镜像站:
The Comprehensive R Archive Network
下载最新版安装,安装时可选择32或64位版本。
安装R语言集成开发环境Rstudio,下载地址:
https://www.rstudio.com/products/rstudio/download
三、扩展包常用操作
1. 查看已安装的程序包
(.
注:程序包默认安装在…RR-3.6.0library目录。
2. 加载程序包
library
若没有安装该包,则会提示错误:
Error
3. 安装程序包
务必先修改镜像:
【Tools】—【Global Options…】,在Options窗口点“Packages”,修改CRAN mirror为
China
(Beijing 4) [https] - TUNA Team, Tsinghua University
命令安装:
install
注:若命令安装失败,则需要下载扩展包手动安装。
4. 删除扩展包
remove
5. 更新包
update
更新所有已安装的包。
四、R语言常用操作
1. 帮助help:help(函数名) 或者 ? 函数名
使用R帮助是一种快速学习和掌握R的有效方法。
2. 命令窗口清屏:Ctrl + L 或者
3. 清除当前内存变量:rm(变量名)
清除所有变量:rm(list=ls(all=TRUE)),或者
4. 获取或设置当前工作目录
getwd
setwd
注意:路径地址中的“”必须用“/” 或“”代替。
5. 保存和加载数据
save函数将工作空间中的数据保存为R语言数据文件(默认格式为.Rda),load函数加载R数据文件。
setwd
save
6. 脚本文件的输入和输出
(1) 在当前会话中执行一个脚本(中的R语句),常用于将某个函数打包调用:
source(“路径/脚本文件.R”)
(2) 将输出重定向到文件“文件名.txt”中(文本输出),若文件已经存在,则它的内容将被覆盖:
sink
使用参数append=TRUE可以将文本追加到文件后,而不是覆盖它;参数split=TRUE可将输出同时发送到屏幕和输出文件中;
不加参数调用sink()函数将重回“仅向屏幕返回输出结果”。
(3) 要重定向图形输出,使用下列函数即可,最后用dev.off()将输出返回到终端:
函数
输出
pdf
pdf文件
win
Windows图元文件
png
png文件
jpeg
jpg文件
bmp
bmp文件
postscript
PostScript文件
例如,执行代码:
sink
脚本文件script1.R中的代码将执行,结果也将显示在屏幕上,另外,文本输出将被追加到文件myoutput中,图形输出将保存到文件mygraphs.pdf中
继续执行代码:
sink
脚本文件script2.R中的代码将执行,结果显示在屏幕上(此时不再有文本或图形输出)。
7. 赋值
注意R语言中赋值不是用“=”,而是“<-”或“->”,例如
x
R也允许用“=”赋值,但不是标准语法,有时会出问题。
R是一种基于对象的语言,即在定义类的基础上,创建与操作对象;数值向量、函数、图形等都是对象。
主要参考文献:
- 张良均,谢佳标,杨坦,肖刚. R语言与数据挖掘. 机械工业出版社,2016.
- R常见问题解答——153分钟学会R. 2008.
作者:张敬信
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。