| 查看: 20643 | 回复: 2 | |||
| 当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖 | |||
[交流]
TCGA(癌症和肿瘤基因图谱)数据下载和处理(TCGA-Assembler) 已有2人参与
|
|||
|
国政府发起的癌症和肿瘤基因图谱(Cancer Genome Atlas,TCGA)计划,试图通过应用基因组分析技术,特别是采用大规模的基因组测序,将人类全部癌症(近期目标为50种包括亚型在内的肿瘤)的基因组变异图谱绘制出来,并进行系统分析,旨在找到所有致癌和抑癌基因的微小变异,了解癌细胞发生、发展的机制,在此基础上取得新的诊断和治疗方法,最后可以勾画出整个新型“预防癌症的策略”。 TCGA 使命:提高人们对癌症发病分子基础的科学认识及提高我们诊断、治疗和预防癌症的能力 TCGA 目标:完成一套完整的与所有癌症基因组改变相关的“图谱”。 图1.png TCGA数据源大部分都是公开的,如何有效的进行收集和预处理是一个头疼的问题。今天我们讲解下怎么将TCGA的数据转化成癌症类型的二维数据矩阵(例如基因为rows,样本为columns)。得到这个矩阵之后,后面的事情就好办了,我们可以做差异表达,共表达网络,生存分析等。今天我们主要讲解如何下载TCGA的数据,大家对后续分析感兴趣的话,可以在加“生物信息培训+视频”裙,或者大家可以在掏宝搜索“生物信息视频”,跟我们联系。 我们开始吧,我们可以使用TCGA-Assembler这软件去下载TCGA的数据http://www.compgenome.org/TCGA-Assembler/。TCGA-Assembler不但可以很方便的下载数据,还能对数据进行初始化处理,非常方便。下载完后,我们使用首先要安装一些依赖包。通过下面的命令: install.packages(c("HGNChelper", "RCurl", "httr", "stringr", "digest", "bitops" , dependencies=T)安装完了依赖包,我们进入刚才下载的TCGA-Assembler的目录,使用setwd(C:/Users/cloud/Desktop/TCGA-Assembler)设置TCGA-Assembler的目录为工作目录,接下来,我们就可以下载数据了。我们需要下载什么数据,就选择相应的脚本。具体脚本如下: # Load module A functions. source("Module_A.r" ;# Download level-3 miRNA-seq data of six rectum adenocarcinoma (READ) samples miRNASeqRawData = DownloadmiRNASeqData(traverseResultFile = "./DirectoryTraverseResult_Jul-08-2014.rda", saveFolderName = "./QuickStartGuide_Results/RawData/", cancerType = "READ", assayPlatform = "miRNASeq", inputPatientIDs = c("TCGA-EI-6884-01", "TCGA-DC-5869-01", "TCGA-G5-6572-01", "TCGA-F5-6812-01", "TCGA-AF-2689-11", "TCGA-AF-2691-11" ); # Download level-3 DNA copy number data of six READ samples CNARawData = DownloadCNAData(traverseResultFile = "./DirectoryTraverseResult_Jul-08-2014.rda", saveFolderName = "./QuickStartGuide_Results/RawData/", cancerType = "READ", assayPlatform = "genome_wide_snp_6", inputPatientIDs = c("TCGA-EI-6884-01", "TCGA-DC-5869-01", "TCGA-G5-6572-01", "TCGA-F5-6812-01", "TCGA-AF-2692-10", "TCGA-AG-4021-10" ); # Download level-3 RNASeqV2 gene expression and exon expression data of six READ samples RNASeqRawData = DownloadRNASeqData(traverseResultFile = "./DirectoryTraverseResult_Jul-08-2014.rda", saveFolderName = "./QuickStartGuide_Results/RawData/", cancerType = "READ", assayPlatform = "RNASeqV2", dataType = c("rsem.genes.normalized_results", "exon_quantification" , inputPatientIDs = c("TCGA-EI-6884-01", "TCGA-DC-5869-01", "TCGA-G5-6572-01", "TCGA-F5-6812-01", "TCGA-AG-3732-11", "TCGA-AG-3742-11" ); # Download level-3 HumanMethylation27 data of six READ samples Methylation27RawData = DownloadMethylationData(traverseResultFile = "./DirectoryTraverseResult_Jul-08-2014.rda", saveFolderName = "./QuickStartGuide_Results/RawData/", cancerType = "READ", assayPlatform = "humanmethylation27", inputPatientIDs = c("TCGA-AG-3583-01", "TCGA-AG-A032-01", "TCGA-AF-2692-11", "TCGA-AG-4001-01", "TCGA-AG-3608-01", "TCGA-AG-3574-01" ); # Download level-3 HumanMethylation450 data of six READ samples Methylation450RawData = DownloadMethylationData(traverseResultFile = "./DirectoryTraverseResult_Jul-08-2014.rda", saveFolderName = "./QuickStartGuide_Results/RawData", cancerType = "READ", assayPlatform = "humanmethylation450", inputPatientIDs = c("TCGA-EI-6884-01", "TCGA-DC-5869-01", "TCGA-G5-6572-01", "TCGA-F5-6812-01", "TCGA-AG-A01W-11", "TCGA-AG-3731-11" ); # Download level-3 RPPA protein expression data of six READ samples RPPARawData = DownloadRPPAData(traverseResultFile = "./DirectoryTraverseResult_Jul-08-2014.rda", saveFolderName = "./QuickStartGuide_Results/RawData", cancerType = "READ", assayPlatform = "mda_rppa_core", inputPatientIDs = c("TCGA-EI-6884-01", "TCGA-DC-5869-01", "TCGA-G5-6572-01", "TCGA-F5-6812-01", "TCGA-AG-3582-01", "TCGA-AG-4001-01" ); # Download de-identified clinical information of READ patients DownloadClinicalData(traverseResultFile = "./DirectoryTraverseResult_Jul-08-2014.rda", saveFolderName = "./QuickStartGuide_Results/RawData", cancerType = "READ", clinicalDataType = c("patient", "drug", "follow_up" );运行上面的脚本,我们就能得到我们想要的结果了,假如我们需要下载adenocarcinoma的miRNA数据,我们可以使用。下载完后,我们就得到了adenocarcinoma的矩阵了(基因为rows,样本为columns)。 setwd(C:/Users/cloud/Desktop/TCGA-Assembler) source("Module_A.r" ;miRNASeqRawData = DownloadmiRNASeqData(traverseResultFile = "./DirectoryTraverseResult_Jul-08-2014.rda", saveFolderName = "./QuickStartGuide_Results/RawData/", cancerType = "READ", assayPlatform = "miRNASeq" ; |
» 猜你喜欢
上海工程技术大学【激光智能制造】课题组招收硕士
已经有6人回复
带资进组求博导收留
已经有11人回复
自荐读博
已经有5人回复
求个博导看看
已经有16人回复
上海工程技术大学张培磊教授团队招收博士生
已经有4人回复
求助院士们,这个如何合成呀
已经有4人回复
临港实验室与上科大联培博士招生1名
已经有9人回复
写了一篇“相变储能技术在冷库中应用”的论文,论文内容以实验为主,投什么期刊合适?
已经有6人回复
最近几年招的学生写论文不引自己组发的文章
已经有11人回复
中科院杭州医学所招收博士生一名(生物分析化学、药物递送)
已经有3人回复
» 本主题相关商家推荐: (我也要在这里推广)
» 本主题相关价值贴推荐,对您同样有帮助:
急求!核苷酸序列翻译成氨基酸后,怎么回到对应的核苷酸序列?
已经有4人回复
请问TCGA的level2数据是通过哪种方法标准化的?
已经有5人回复
从网上下载了cel文件,但不知怎么下对应的实验条件信息
已经有3人回复
求氢气分子的键长数据
已经有3人回复
TCGA数据库的使用交流
已经有12人回复
有人做过或接触过microRNA的paired-end测序数据分析吗
已经有18人回复
如何找到DNA甲基化的位点
已经有3人回复
The Cancer Genome Atlas (TCGA)数据库的使用?
已经有6人回复
求编程,求应助
已经有3人回复
求TCGA 数据库的使用说明,关于数据的。
已经有7人回复
【视频】【教程】PDB数据库的使用——视频教程
已经有254人回复
有关PDB数据库的使用问题
已经有11人回复
xingzhou823
木虫 (正式写手)
五道杠
- 应助: 24 (小学生)
- 金币: 2391.6
- 散金: 200
- 红花: 7
- 帖子: 789
- 在线: 170.7小时
- 虫号: 2070126
- 注册: 2012-10-18
- 性别: GG
- 专业: 生物信息学
★
小木虫: 金币+0.5, 给个红包,谢谢回帖
小木虫: 金币+0.5, 给个红包,谢谢回帖

3楼2015-11-12 11:48:08
2楼2015-10-17 09:29:57







, dependencies=T)
回复此楼