【数据挖掘】实验1:R入门(内含详细R和RStudio安装教程)

实验1:R入门

一:实验目的与要求

1:根据上课PPT内容,掌握课堂知识并进行代码练习操作,提供练习过程和结果。

2:可COPY代码运行结果直接提交,如涉及到输出图等可截图。

二:实验内容

1:R语言的下载与安装

1.1:安装R语言

从清华镜像网站(The Comprehensive R Archive Network)处下载Windows版本的R语言。点击下图中的【Download R-4.3.2 for Windows】即可下载。

下载完成后出现以下文件,双击该文件进行R语言的安装。

弹出【选择语言】后,选择默认的中文(简体),点击确定。

弹出【信息】后,点击下一步。

弹出【选择安装位置】后,进行路径设置(此处使用默认路径),点击下一步。

弹出【选择组件】后,进行组件配置(此处使用默认配置),点击下一步。

弹出【启动选项】后,此处使用默认选项No,点击下一步。

弹出【选择开始菜单文件夹】后,选择程序快捷方式的放置位置(此处使用默认文件夹),点击下一步。

弹出【选择附加任务】后,选择偏好的附加快捷方式,点击下一步。

等待文件安装。

安装完成,点击结束。

 此时,可以发现桌面添加了快捷方式【R 4.3.2】。

1.2:安装RStudio

从在线教育综合平台——数据挖掘课程处下载RStudio的安装包。

下载完成后得到下图的文件【RStudio-2022.02.1】,双击进行RStudio的安装。

弹出安装向导界面后,点击下一步。

弹出【选择安装位置】后,选择安装的路径并确认磁盘空间是否足够,点击下一步。

弹出【选择开始菜单文件夹】后,填写文件夹名称,点击安装。

等待文件的安装。

安装完成后,点击完成。

如果桌面没有出现快捷方式,则需要打开安装路径,找到可运行的exe文件。此处推荐使用everything工具直接搜索RStudio。

开第一个搜索结果的路径,在子文件目录bin下找到rstudio.exe。

右键点击该exe,选择创建桌面快捷方式,弹出提示框后,点击是。

即可发现桌面上多出了该可执行文件的快捷方式。

双击运行RStudio后,可进入以下操作界面。

2:R语言的基本操作

2.1:查看R版本,并在R Console上输入简单命令


打开R,查看到第一行输出R version 4.3.2,可知R语言的版本。测试PPT中给出的赋值公式和加法计算案例。结果如下图所示。


同时,也可通过【version】命令查看R语言的版本。结果如下图所示,可以看到倒数第二行version.string的对应信息为R version 4.3.2。

2.2:在R Console上更新R


    采用方法1更新R时,输入【install.packages(“installr”)】,将出现以下结果。

选择China镜像后,即可安装程序包,安装结果如下图。

输入【library(installr)】,将出现以下结果。

输入【updateR(fast=TRUE,cran_mirror="https://mirrors.ustc.edu.cn/CRAN/")】,将出现以下结果。可以发现本地的版本已经是最新。

同时,采用方法2更新R时,输入【installr::updateR(fast=TRUE,cran_mirror="https://mirrors.ustc.edu.cn/CRAN/")】,将出现以下结果。

2.3:在RStudio上检查更新


    首先点击工具栏的【Help】。

然后点击【Check for Updates】。

软件自动弹出以下更新内容。此处表明我们的RStudio已经是最新版本,无需更新。

2.4:RStudio界面的熟悉


RStudio的整体界面如下图所示。其中左上角为代码编辑区,左下角为命令控制台/代码执行区,右上角为资源栏,右下角为其他区。

同时,勾选代码编辑区的【Source on Save】以便自动保存代码,同时查看右侧两个按钮的功能。

第二个按钮(魔术棒)的功能如下图所示。

第一个按钮(放大镜)的功能如下图所示。

2.5:当前工作路径的修改和文件读取


在console中,通过getwd()读取当前工作路径,结果如下图所示。

同时,通过setwd()写入新的工作路径,并通过getwd()检查是否设置成功,结果如下图所示。

读取不在工作路径下的csv文件,结果如下图所示。

读取在工作路径下的csv文件,结果如下图所示。

其他工作路径设置的函数如下图所示。

函数ls()的使用结果如下图所示。

函数rm()的使用结果如下图所示。

函数help(options)的使用结果如下图所示。运行后界面右下角弹出help的内容。

工作空间的操作不再演示。

2.6:R扩展包的安装、载入和更新

安装class扩展包,结果如下图所示。

同时安装class和cluster扩展包,结果如下图所示。


在R console中利用【library(class)】载入,结果如下图所示。


在R console中利用【update.packages()】载入,结果如下图所示。

在R console中利用【help(package=’class’)】查看扩展包信息,结果如下图所示。

在Package中查看扩展包的更新情况,结果如下图所示。

 在R console中利用【installed.packages()[,c('Package','Version','LibPath')]】查看已经安装的扩展包,结果如下图所示(由于扩展包的数量过多,因此此处仅展示一部分扩展包内容)。

在R console中利用
【site="https://mirrors.tuna.tsinghua.edu.cn/CRAN"】
和【install.packages("ggplot2", repos=site)】安装绘图包ggplot2,结果如下图所示。

在R console中利用【if (!require("BiocManager", quietly = TRUE))
install.packages("BiocManager")】和【BiocManager::install(version = "3.18")】安装生物信息包,结果如下图所示。

2.7:R常用操作案例尝试


【1】dir.create("C:/Users/86158/Desktop/myprojects")

【2】dir.create("C:/Users/86158/Desktop/myprojects/project1")

【3】setwd("C:/Users/86158/Desktop/myprojects/project1")

【4】getwd()

【5】options()

【6】options(digits=3)

【7】x<-runif(20)

【8】summary(x)

【9】hist(x)

【10】save.image("myfile")

3:R语言的课后练习

【1】打开帮助文档首页,并查阅其中的“Introduction to R”。

    方法1:使用命令:help.start()

方法2:点击工具栏中【Help】下的【R Help】,进入Help界面。

点击【Manuals】中的【An Introduction to R】。

查看R语言介绍的详细内容。

【2】安装vcd包。


使用命令:install.packages("vcd")

【3】列出vcd包中可用的函数和数据集。


    使用命令:help(package="vcd")

在右下角处,可以看到可使用的数据集,各个数据集由字母顺序进行排序。

【4】载入vcd包并阅读数据集Arthritis的描述。


    首先,找到Arthritis数据集所在的链接位置。

然后,得到该数据集的描述(风湿性关节炎),具体内容如下。

Arthritis Treatment Data

Description

Data from Koch & Edwards (1988) from a double-blind clinical trial investigating a new treatment for rheumatoid arthritis.

Usage

data("Arthritis")

Format

A data frame with 84 observations and 5 variables.

ID

patient ID.

Treatment

factor indicating treatment (Placebo, Treated).

Sex

factor indicating sex (Female, Male).

Age

age of patient.

Improved

ordered factor indicating treatment outcome (None, Some, Marked).

Source

Michael Friendly (2000), Visualizing Categorical Data: http://euclid.psych.yorku.ca/ftp/sas/vcd/catdata/arthrit.sas

References

G. Koch & S. Edwards (1988), Clinical efficiency trials with categorical data. In K. E. Peace (ed.), Biopharmaceutical Statistics for Drug Development, 403–451. Marcel Dekker, New York.

M. Friendly (2000), Visualizing Categorical Data. SAS Institute, Cary, NC.

Examples

Run examples

data("Arthritis")

art <- xtabs(~ Treatment + Improved, data = Arthritis, subset = Sex == "Female")

art

mosaic(art, gp = shading_Friendly)

mosaic(art, gp = shading_max)

根据上表可知,数据的格式为【患者ID、治疗方法、患者性别、患者年龄、治疗效果】。

另外,可以使用以下命令组合,获取上述内容。

命令编号

命令内容

1

install.packages("zoo")

2

library(grid)

3

library(zoo)

4

library(vcd)

5

help(Arthritis)

【5】显示数据集Arthritis的内容(直接输入一个对象的名称将列出它的内容)。

使用命令:Arthritis

输出数据共84条。

【6】运行数据集Arthritis自带的示例。

使用命令:example(Arthritis)

输出内容如下图所示。

Data处输出该数据集共包含84行数据,5列数据特性。

上面两个图输出了treatment(治疗方法)和improved(治疗效果)之间的Pearson residuals(皮尔逊残差)。关于Pearson residuals的解释如下图所示。

三:遇到的问题和解决方案


问题1:执行【updateR()】命令时,出现以下报错。

解决1:查询资料后(Rstudio > updateR() Error in file(con, "r") : 无法打开链结 此外: Warning message: In file(con, "r") : Int... - 简书),发现是镜像没有设置好,需要手动配置。只需要将执行命令变为【updateR(fast=TRUE,cran_mirror="https://mirrors.ustc.edu.cn/CRAN/")】即可。

问题2:执行【install.packages("class")】命令时,出现以下报错。

解决
2:查询资料后(R报错:WARNING: Rtools is required to build R packages, but is not currently installed._warning: rtools is required to build r packages bu-CSDN博客),需要从官网(Rtools43 for Windows)中先下载并安装RTools43。同时输入【chooseCRANmirror()】更改镜像源。

问题3:执行【source("https://bioconductor.org/biocLite.R")】命令时,出现以下报错。

解决3:通过官网(Bioconductor - Install)找到详细的安装方法,按照R为4.3版本的指示进行操作即可。即下图中原来ppt中的方法,现在已经不适用。


问题4:执行【library(vcd)】命令时,出现以下报错。

解决4:在执行上述命令前,使用命令【library(grid)】和【install.packages("zoo")】+【library(zoo)】。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/740393.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

免费搭建导航网站教程带免费空间域名源码

使用免费空间和免费域名免费搭建一个导航网站 手把手视频教程 https://pan.xunlei.com/s/VNsoMehs7RCjz3IClV6h2vNMA1?pwdq596#

中国首个基于区块链的分布式算力网络上线

随着美国人工智能公司OpenAI近期发布的Sora视频模型&#xff0c;全球对高性能算力的需求突破了历史新高。Sora的创新在于它能够以超长生成时间、多角度镜头捕捉&#xff0c;理解物理世界的能力&#xff0c;这不仅是技术的一大突破&#xff0c;更是对算力需求的一大挑战。在这样…

使用npm版本管理工具解决npm 的EACCES permissions errors when installing packages globally错误

EACCES错误通常表示“权限被拒绝”&#xff0c;意味着您没有足够的权限来执行某个操作。在计算机领域&#xff0c;尤其是在文件系统和程序安装中&#xff0c;这个错误很常见。以下是可能导致EACCES错误的原因以及相应的解决方法&#xff1a; 文件系统权限&#xff1a;当您尝试…

【开源】SpringBoot框架开发智慧社区业务综合平台

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 业务类型模块2.2 基础业务模块2.3 预约业务模块2.4 反馈管理模块2.5 社区新闻模块 三、系统设计3.1 用例设计3.2 数据库设计3.2.1 业务类型表3.2.2 基础业务表3.2.3 预约业务表3.2.4 反馈表3.2.5 社区新闻表 四、系统展…

【机器学习300问】34、决策树对于数值型特征如果确定阈值?

还是用之前的猫狗二分类任务举例&#xff08;这个例子出现在【机器学习300问】第33问中&#xff09;&#xff0c;我们新增一个数值型特征&#xff08;体重&#xff09;&#xff0c;下表是数据集的详情。如果想了解更多决策树的知识可以看看我之前的两篇文章&#xff1a; 【机器…

按键+串口发送实验

摸鱼记录 Day_15 &#xff5e;(&#xffe3;▽&#xffe3;&#xff5e;)(&#xff5e;&#xffe3;▽&#xffe3;)&#xff5e; review 前边已经学习了&#xff1a; 串口发送Vivado 串口通信(UART)------串口发送-CSDN博客 按键基于状态机的按键消抖实现-CSDN博客 1. …

STM32外设分类--学习笔记

简介: 本文在于根据自己的理解&#xff0c;将stm32f103外设按照功能分个类别&#xff0c;便于记忆。下面的几张图一定要熟悉&#xff0c;后期编写代码时能够快速找到想要的功能和对应的引脚。 我使用的工具链是&#xff1a;使用CubeMX完成keil5工程搭建和引脚初始化功能,然后用…

Grafana

介绍 官网&#xff1a;https://grafana.com/ Grafana 是一个开源的指标分析和可视化工具&#xff0c;它被广泛用于展示和监控云基础设施和应用程序的实时数据。Grafana 提供了一个强大且易于使用的界面&#xff0c;允许用户创建各种图表、图形和仪表盘&#xff0c;以直观地展…

探索HDFS读写流程、节点机制和数据完整性

目录 写在前面一、HDFS的读写流程1.1 HDFS写数据流程1.2 机架感知1.3 HDFS读数据流程1.4 小结 二、 NameNode和SecondaryNameNode2.1 NN和2NN工作机制2.2 Fsimage和Edits解析2.2.1 oiv查看Fsimage文件2.2.2 oev查看Edits文件 2.3 CheckPoint时间设置 三、DataNode3.1 DataNode工…

案例分析篇14:信息系统安全设计考点(2024年软考高级系统架构设计师冲刺知识点总结系列文章)

专栏系列文章推荐: 2024高级系统架构设计师备考资料(高频考点&真题&经验)https://blog.csdn.net/seeker1994/category_12593400.html 【历年案例分析真题考点汇总】与【专栏文章案例分析高频考点目录】(2024年软考高级系统架构设计师冲刺知识点总结-案例分析篇-…

Unity URP 如何写基础的几何着色器

这是使用几何着色器在点中心生成一个点并根据这个点把原本的面片分成三个三角形的操作。 对于几何着色器构造相对简单&#xff0c;网上的信息也相对较多&#xff0c;需要注意的点就是需要提供一个新的数据结构供几何着色器输出&#xff0c;因为几何着色器在顶点之后&#xff0…

哈达玛矩阵与克罗内克积

哈达玛矩阵与克罗内克积在计算机视觉中发挥着重要作用,例如哈希感知等场景下都可能用到这两个知识点。 例如: 论文:Visually meaningful image encryption scheme based on new-designed chaotic map and random scrambling diffusion strategy 中有一句: “Construct a Ha…

UVC 设备框架在 Linux 4.15 内核的演变

1. 概述 发现之前的uvc框架和现在的还是有一些差别的&#xff08;比如从videobuf 过渡到videobuf2&#xff09;&#xff0c;写个blog记录一下&#xff0c;方便以后查询&#xff0c;我的内核版本&#xff1a;Linux 4.15 UVC&#xff08;USB Video Class&#xff09;设备框架是…

Leetcode 3.12

leetcode hot 100 链表1.两两交换链表中的节点2.随机链表的复制3.排序链表 链表 1.两两交换链表中的节点 两两交换链表中的节点 1.必须要设置一个dummy (temp) 结点2.保存第二个节点3.先让第一个节点指向第三个节点4.再让第二个节点指向第一个节点5.最后让dummy指向第二个节点…

蓝鲸作业平台升级openssh执行方案分享

本文来自腾讯蓝鲸智云社区用户&#xff1a;AK47 蓝鲸的运维系统在我们单位使用已经快四个年头了&#xff0c;从刚开始的5到现在最新的7.1都有部署、测试、验证和使用。在实际的使用过程中&#xff0c;给我们运维提供了非常大的帮助。其中有一个场景分享给大家。这个场景是关于o…

Linux——磁盘文件

磁盘文件 通过前一篇文章Linux——系统文件I/O&#xff0c;我们知道了如何对加载在内存中的文件进行读写等操作&#xff0c;并了解了其内在的原理。同时我们也应该清楚&#xff0c;并不是所有的文件都会被加载入内存&#xff0c;而没有被加载入内存的文件&#xff0c;就被存放…

酷开科技智慧AI助力酷开系统千屏千面

每台智能电视都有一个专属的操作系统&#xff0c;而酷开系统作为一款基于人工智能技术的智能电视操作系统&#xff0c;深受大众喜爱&#xff0c;其最大的特点就是“千屏千面”。这意味着每一位消费者在使用酷开系统时&#xff0c;通过酷开科技的智慧AI&#xff0c;都能根据自己…

Prometheus监控Mysql数据库在Grafana展示

未安装prometheus和Grafana可以参考这个博客操作 Docker安装Prometheus监控-CSDN博客 Windows版本数据库 一、在数据库服务器安装mysqld-exporter 下载mysqld-exporter文件 Releases prometheus/mysqld_exporter GitHub 二、配置mysqld-exporter文件 1、解压进入mysqld…

docker+elasticsearch

一&#xff0c;环境准备&#xff1a;安装docker&#xff08;往期文章&#xff09; 二&#xff0c;elasticsearch简介&#xff1a; 用于储存数据 三&#xff0c;部署&#xff1a; 1&#xff09;&#xff0c;拉取镜像 使用本作者提供的java17镜像 2&#xff09;&#xff0c;…

ARM64汇编05 - MOV系列指令

MOV(wide immediate) MOV 可以将一个立即数移动到寄存器中。 .text:0000000000000834 80 46 82 D2 MOV X0, #0x1234 ; Keypatch modified this from:MOV X0, #0x1234 对应的汇编代码为&#xff1a;80 46 82 D2 看手册可知&#xf…