r语言在linux下取数据,菜鸟第一步,跪在数据处:R语言读取数据

1. 温故知坑

实践是学习知识的最好途径。之前我讲的内容都非常非常基础,包括:

(1)什么是R语言?R语言和Rstudio软件的安装,Rstudio的界面介绍;

(2)R语言的基本逻辑,基本数据类型;

(3)ggplot基础绘图;

(4)学习R语言的思路(整理,总结问题)。

通过不断的踩坑,走弯路,我们可以在勤奋的基础上,找一些快速的方法。我们已经不能再像上大学时候一样了,先啃完一本书,学好各种基础知识,然后开始应用。工作之繁忙,生活之琐碎,各种被电子产品占据走的时间。已经很难找出一整块的时间去学习了。

换句话说,没有目的性的理论学习就是耍流氓。怎么讲这么多数据类型,格式,可是我用不着呀?因此,我们调整策略,按照完成project为主线来解说在完成数据分析的过程中,我们需要用的R语言知识。

2. 一个超级简单的project流程

以我之前处理的GEO数据为蓝本,我们详细的介绍每一个数据处理过程,所需要的知识(不仅仅是R语言代码,还有各种背景知识)。

步骤基本上是:导入数据--整理为可以进行分析的形式--差异分析(火山图等)--GO/KEGG注释(各种好看的图)。其中每一个步骤都可以说是好几把辛酸泪。

但素!为了降低炸毛的风险,我自己捏造了一段非常非常小的数据用来做示例。想要跟着我步骤的小伙伴,需要这小小数据,你们可以想办法找到我。

so,今天我们来讲,导入数据!

(1)首先自然是要有数据

数据的来源:A. 自己课题组的各种测序结果,在经过linux的上游分析之后,得到一个表达量和分组的表格(我们也称之为表达矩阵),经过精心整理之后,它大概需要变成这样:

b32eccb44ac1

expression data.frame.jpg

B. 从公共数据库下载:例如GEO、TCGA数据库(知识点:自行去了解这两个数据库),那根据数据库的不同,下载的数据也是有所不同的。GEO数据可以直接通过R语言下载,可以说是非常方便了!

(2)载入数据方式

R语言载入数据的方式如下:

R语言数据的输入:

(1)手打;(2)文本文件txt;(3)Excel;(4)Acess;(5)其他统计软件出来的数据,例如SPSS,SAS;(6)XML数据;(7)网页抓取;(8)Stata;(9)netCDF;(10)HDF5;(11)通过数据库接口下载;(12)通过Stat/Transfer导入数据 。

看到这么多会直接炸毛,这么多!没关系,我们又没有期末考,掌握自己所需要的就可以了。

最最最常见的数据就是txt,xls,csv(有点像xls)。

(3)读取Excel文件

step 1-2 新建proj,管理文件,而后双击打开

b32eccb44ac1

step1-2.png

step 3 将Excel另存为csv文件,而后载入

## (1)另存为csv文件之后,以下代码均可以读取数据

data_1

data_2

## 知识点,header= T,sep="," 是什么意思?

## header= T,字面上的意思就是:有抬头,本文件的抬头(即列名)就是:

> colnames(data_1)

[1] "ensembl_id" "control_1" "control_2" "control_3" "experiment_1" "experiment_2"

[7] "experiment_3"

## 那什么是sep="," 你试试看不要这么参数?试试嘛!

step 4 我偏不另存为,我就要读Excel

好的,妥妥的满足你!虽然我不会,但是我去话了小洁大佬,她支的招就是,使用R包 tidyverse

## (2)我偏不另存为,那就试试tidyverse包

install.packages("tidyverse")

library(tidyverse)

## 调出帮助文档,学习如何使用该包

?tidyverse

## 可是我怕不想看帮助文档怎么办?偷懒的我发现了一个小妙招

请看图

b32eccb44ac1

amazing.png

## 然后就妥妥的会啦

data_3

b32eccb44ac1

loaddata.jpg

至于txt文档怎么载入,我想你用到的时候,定会查到的!

3. 还是温故知新的!

其实写这篇推文呢,我才是最大的收获者,为了写得简洁明了,我回去自己看了一下书,然后又请教了小洁,真是妥妥的--温故知不足,求索方知新。大家加油吧!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/336314.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【音视频安卓开发 (五)】Android中获取音视频原始数据的方法

一般取得原始数据的方法使用的camera setPreviewCallback

c语言 桌面程序_C语言编程工具:Dev - C++ 简单安装和使用!新手福利!

工欲善其事,必先利其器。——《论语》# 写在前面有关编译器和开发工具可以查看历史文章。# 下载Dev-C操作系统建议Windows 7或10,直接搜索Dev-C下载,或者sourceforge官网下载链接:https://sourceforge.net/projects/orwelldevcpp/…

stub_AccuREST Stub Runner发布

stub最近发布时间不错! 我在Too Much Coding博客上的博客更多是关于发布,然后是关于任何具体主题;) 在作为Brixton RC1的一部分发布Spring Cloud Sleuth之后,我们刚刚发布了AccuREST 1.0.4版本。 我们修复了一些错误,…

kali linux wifi监听模式,无线渗透教程1:监听无线网络

第一:配置管理无线网卡1.1这里,我们使用tplink wn722n, kali linux插上即用,无需安装驱动。1.2Vmare虚拟机配置如下:如网卡插入到电脑后,先将虚拟机设置成桥接模式之后对虚拟机进行配置之后呢,我们在终端窗…

matlab的7.3版本是什么_王者荣耀:玩不好元歌的3大原因,无论什么版本,元歌起码T1.5_电竞...

很多高段位元歌并不是以秀为核心的,而是他们就像一个冷静的杀手,在一闪即逝却又最合适的时机里,他能正确的选择进场的方式,以及击杀的方式。说白了,元歌的进场手段并没有多少,什么时候用傀儡433上去锁人&am…

【WebRTC---入门篇】(一)WebRTC整体架构

1.绿色部分是WebRTC核心部分(核心库) 2.紫色部分是JS提供的API(应用层) 整体是应用层调用核心层。 核心层,第一层 C++ API 提供给外面的接口。最主要的是(PeerConnedtion 对等连接)。 核心层,第二层 Session 上下文管理层(音视频)。 核心层,第三层[最重要的…

aws sqs_AWS SQS和Spring JMS集成

aws sqsAmazon WEB服务为我们提供了SQS消息传递服务。 sqs的java sdk与JMS兼容。 因此,可以将SQS与spring提供的JMS集成框架集成在一起,而不是将SQS用作简单的spring bean。 我将使用spring-boot和gradle。 gradle文件: group com.gkatzi…

linux ntfs 新建,Linux在NTFS中创建的文件的权限

我正在尝试使用以下设置在Linux中挂载NTFS文件系统:>在Linux中,NTFS中的所有文件和目录都应归root所有并获得团体胜利.权限应设置为775.> Linux在NTFS文件系统中创建的所有文件和目录都应该在Windows中具有与目录相同的所有权和权限包含新创建的文件或目录.为…

python 创建空的numpy数组_数据分析-NumPy内置函数创建数组

微信公众号:yale记关注可了解更多的教程问题或建议,请公众号留言。背景介绍今天学习使用numpy的内置函数arange()、ones()、zeros()、linspace() 等内置函数创建数组,对于使用数据结构和多维列表非常有用,可以节省大量的时间。入门…

c语言课全部由字母,C语言程序设计课程期末练习试题.doc

C语言程序设计课程期末练习题一、单项选择题。把合适的选项编号填写在括号内。1.不符合C语言规定的复合语句是( )。DA.{} B.{;} C.{x0;} D.{y10}2.C语言中的选择类语句有两条,它们是( )。AA&…

java8返回单个号码_如何在单个API中支持Java 6、8、9

java8返回单个号码借助jOOQ 3.7&#xff0c;我们终于添加了对Java 8功能的正式支持。 这为许多不错的改进打开了大门&#xff0c;例如&#xff1a; 创建结果流 try (Stream<Record2<String, String>> stream DSL.using(configuration).select(FIRST_NAME, LAST_N…

使用t-sql语句修改表中的某些数据及数据类型。_数据库基本理论详细介绍

1、数据库范式第一范式&#xff1a;列不可分&#xff0c;eg:【联系人】(姓名&#xff0c;性别&#xff0c;电话)&#xff0c;一个联系人有家庭电话和公司电话&#xff0c;那么这种表结构设计就没有达到 1NF&#xff1b;第二范式&#xff1a;有主键&#xff0c;保证完全依赖。eg…

spring-retry_使用Spring-Retry重试处理

spring-retry每当软件组件相互通信时&#xff0c;就有可能出现暂时的自我纠正错误。 这些故障包括服务的暂时不可用&#xff0c;网络连接的瞬时丢失或服务繁忙时出现的超时。 在这种情况下&#xff0c;适当的重试处理可以减少这些故障可能引起的问题。 在这篇文章中&#xff0…

【WebRTC---入门篇】(三)WebRTC运行机制

轨和流 Track 轨&#xff1a;音频轨和视频轨是不相交的 MediaStream 媒体流&#xff1a;中包含多个音视频轨 WebRTC重要类 MediaStream 负责添加N个轨&#xff0c;加入到RTCPeerConnection RTCPeerConnection 核心 RTCDataChannel 非音视频数据&#xff0c;通过RTCP…

a - 数据结构实验之串一:kmp简单应用_【在线教学示范课案例】数据结构(刘航)...

一、教师简介刘航&#xff0c;网络空间安全学院教师&#xff0c;本科生“数据结构”、“算法设计综合实验” 和研究生“算法设计与优化”课程的主讲教师。近年来积极开展了教学与考核模式改革、探究式/研究型课程等课程改革探索&#xff0c;探索课程、学科竞赛和项目相结合的科…

c语言创建字符树,使用C语言构建基本的二叉树数据结构

二叉树结构常用的一些初始化代码#include#includetypedef struct Node{int data;Node *leftchild;Node *rightchild;}Node;/*初始化一棵二叉树排序树。*/void InitBinaryTree(Node**root,int elem){*root(Node*)malloc(sizeof(Node));if(!(*root)){printf("Memory allocat…

可变lambda_Lambda的Lambda(如果可选)

可变lambda因此&#xff0c;我对JDK 8中Optional接口的两个限制感到沮丧。第一个问题是&#xff0c;没有明显的方法可以在块中执行else操作&#xff0c;因为只有isPresent方法&#xff0c;除非您使用的是老式的if语句。 第二个问题当然是古老的板栗&#xff0c;即使您能够做到&…

【WebRTC---入门篇】(四)WebRTC设备管理

enumerateDevices API用来获取音视频设备 JS使用单线程处理&#xff0c;为了避免阻塞。使用异步调用Promise。handle为处理函数&#xff0c;处理主要逻辑。成功调用resolve&#xff1b;失败调用reject。Promise可以注册两个方法 then(逻辑处理成功会收到on_resolve) 和 catch(…

n阶幻方c语言编程,求单偶阶与双偶阶幻方编程思想及其算法!

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼#include #define N 100void oujie(int oushu){int a[N][N]{0},i,j,k1,n,m;noushu/2;m(oushu-2)/4;for(i1,j3*n/2;k<n*n;){if(i<0){ ii3*n; continue; }if(j>3*n){ jj-3*n; continue; }if(j<0){ jj3*n; continue; }if(…