1. RTCGAToolbox库加载
library(RTCGAToolbox)
2. 下载TCPA数据
2.1 下载代码
# Get the last run dates
lastRunDate <- getFirehoseRunningDates()[1]# get RPPA data and clinical data for LGG
lgg.data <- getFirehoseData(dataset = "LGG",gistic2_Date = getFirehoseAnalyzeDates(1), runDate = lastRunDate,# 确认要下载RPPA数据,默认只下载clinical数据RPPAArray = TRUE)
2.2 出现问题
3.问题原因
windows系统中通常限定文件名最多包含 260 个字符。但实际的文件名必须少于这一数值,因为完整路径(如 C:Program Filesfilename.txt)都包含在此字符数值中。这就是为什么有时候将文件复制到比当前位置路径长的某个位置时会出现错误的原因。
本人默认的R工作地址为"C:/Users/Administrator/Desktop/TCGA",再加上解压缩后的原本应该的文件名 'C:/Users/Administrator/Desktop/TCGA/gdac.broadinstitute.org_ LGG.Merge_protein_exp__mda_rppa_core__mdanderson_org__Level_3__protein_normalization__data.Level_3.2016012800.0.0/LGG.protein_exp__mda_rppa_core__mdanderson_org__Level_3__protein_normalization__data.data.txt'已经超出了文件名字符数。
4.解决方案
# 方案一:修改工作路径到D盘
setwd('D:/')
# 重新运行脚本
lgg.data <- getFirehoseData(dataset = "LGG",gistic2_Date = getFirehoseAnalyzeDates(1), runDate = lastRunDate,# 确认要下载RPPA数据,默认只下载clinical数据RPPAArray = TRUE)
# 获取RPPA数据(默认的getData方法好像不行,需要提供平台信息)
lgg.RPPA <- lgg.data@RPPAArray[[1]]@DataMatrix# 方案二:手动将下载的LGG-RPPAArray.tar.gz的减压缩
# LGG.protein_exp__mda_rppa_core__mdanderson_org__Level_3__protein_normalization__data.data.txt
# 为tsv格式
lgg.RPPA <- read.csv("LGG.protein_exp__mda_rppa_core__mdanderson_org__Level_3__protein_normalization__data.data.txt",sep = 't')