| 查看: 5420 | 回复: 12 | ||||
zhangjunpeng至尊木虫 (知名作家)
|
[交流]
TCGA数据库的使用交流已有10人参与
|
|||
|
在生信领域,数据源是非常重要的,毕竟谁也不想感受“巧妇无米之炊”的感觉。随着大数据时代的到来,各种大型生物公共数据库也不断完善,其中就包括The Cancer Genome Atlas (TCGA,https://tcga-data.nci.nih.gov/tcga/tcgaHome2.jsp)数据库。TCGA数据源大部分都是公开的,如何有效的进行收集和预处理是一个头疼的问题。 目前来能够从TCGA数据库中提取数据的处理工具有cBioPortal(http://www.cbioportal.org/public-portal/cgds_r.jsp),ICGC(http://dcc.icgc.org/download/current)和GenePattern(http://www.broadinstitute.org/ca ... tern/download/index)。这些工具使用起来还是有其局限性,都不能够轻易获取每个癌症类型的二维数据矩阵(例如基因为rows,样本为columns)。 因此开此贴,欢迎各位同行虫友交流一下获取TCGA数据库的经验,以及间接获取TCGA数据的工具使用技巧和方法。 |
» 收录本帖的淘帖专辑推荐
分子生化实验经验积累 |
» 猜你喜欢
2025冷门绝学什么时候出结果
已经有3人回复
天津工业大学郑柳春团队欢迎化学化工、高分子化学或有机合成方向的博士生和硕士生加入
已经有4人回复
康复大学泰山学者周祺惠团队招收博士研究生
已经有6人回复
AI论文写作工具:是科研加速器还是学术作弊器?
已经有3人回复
孩子确诊有中度注意力缺陷
已经有6人回复
2026博士申请-功能高分子,水凝胶方向
已经有6人回复
论文投稿,期刊推荐
已经有4人回复
硕士和导师闹得不愉快
已经有13人回复
请问2026国家基金面上项目会启动申2停1吗
已经有5人回复
同一篇文章,用不同账号投稿对编辑决定是否送审有没有影响?
已经有3人回复
» 本主题相关价值贴推荐,对您同样有帮助:
The Cancer Genome Atlas (TCGA)数据库的使用?
已经有6人回复
求TCGA 数据库的使用说明,关于数据的。
已经有7人回复
交流一下Ei数据库的收录事情
已经有10人回复
【求助/交流】从哪个数据库可查询到miRNA序列信息
已经有3人回复

★
小木虫: 金币+0.5, 给个红包,谢谢回帖
小木虫: 金币+0.5, 给个红包,谢谢回帖
|
In order to download data from TCGA data portal: 1. Connect to https://tcga-data.nci.nih.gov/tcga/ 2. Select the cancer subtype you are interested in (i.e breast invasive carcinoma) 3. Select mRNA 4. Now you can see a table where rows are representing different patients. 5. If present select the column (by clicking on header) that referse to RNASeq or RNASeqV2 if it is present for that cancer subtype and then click BUILD archive. 6. Keep in mind that just below the header there is a number indicating the respective data level. Levels 1-4 (https://wiki.nci.nih.gov/display/TCGA/Data+level) If you need RAW data such as FASTQ files you have find level 1 data, but often this kind of data is not publicly available on TCGA and you might need to ask for permission in order to download it. |
11楼2015-08-31 15:15:06
xingzhou823
木虫 (正式写手)
五道杠
- 应助: 24 (小学生)
- 金币: 2391.6
- 散金: 200
- 红花: 7
- 帖子: 789
- 在线: 170.7小时
- 虫号: 2070126
- 注册: 2012-10-18
- 性别: GG
- 专业: 生物信息学
★
小木虫: 金币+0.5, 给个红包,谢谢回帖
小木虫: 金币+0.5, 给个红包,谢谢回帖
|
http://wenku.baidu.com/link?url= ... O7J9NHzBL_xnc1QCBRC 链接是一个TCGA的基础培训,可以学习一下 |

12楼2015-11-12 11:57:05
2楼2014-03-18 22:11:58
zhangjunpeng
至尊木虫 (知名作家)
- 应助: 125 (高中生)
- 金币: 25494.1
- 散金: 3660
- 红花: 51
- 沙发: 20
- 帖子: 8445
- 在线: 2027小时
- 虫号: 930914
- 注册: 2009-12-20
- 性别: GG
- 专业: 生物信息学

3楼2014-03-18 22:33:43
scybhmu老谭
木虫 (小有名气)
- 应助: 2 (幼儿园)
- 金币: 3020.1
- 散金: 20
- 帖子: 271
- 在线: 43.6小时
- 虫号: 2120575
- 注册: 2012-11-11
- 专业: 生物信息学
4楼2014-04-12 14:21:03
zhangjunpeng
至尊木虫 (知名作家)
- 应助: 125 (高中生)
- 金币: 25494.1
- 散金: 3660
- 红花: 51
- 沙发: 20
- 帖子: 8445
- 在线: 2027小时
- 虫号: 930914
- 注册: 2009-12-20
- 性别: GG
- 专业: 生物信息学

5楼2014-04-12 15:37:17
xv1215
金虫 (正式写手)
- 应助: 12 (小学生)
- 金币: 2067.9
- 散金: 50
- 红花: 1
- 帖子: 344
- 在线: 42.4小时
- 虫号: 2484813
- 注册: 2013-05-28
- 性别: MM
- 专业: 细胞生物学
6楼2014-11-23 20:53:01
★
小木虫: 金币+0.5, 给个红包,谢谢回帖
小木虫: 金币+0.5, 给个红包,谢谢回帖
|
下面是某学长发给我的TCGA部分数据,请问每组数据代表什么意思? # Mutation matrix made from SNV data (/data/compbio/datasets/MutationMatrices/BREAST/2012-10-31/brca_mutation_fromPanCancer.snv) and CNA data (brca_cna_gistic_wide.cna). TCGA-A1-A0SD ANK3 C12ORF51 C19ORF51 CASK CDHR3 CNTFR COL14A1 CPAMD8 CPEB2 CXORF58 FAM182B FNDC1 GDF5 GRIN2C IGSF3 KIRREL KLK15 L1CAM LOC653125 LRBA LRP2 NCOA3 PAK1(A) PCDHA6 PGC PNLIPRP2 PTEN(D) RP1 SFRS17A SIDT2 SLC44A3 SLFN14 SNX5 TLR5 WDR72 ZFP91 ZFR2 ZNF544 ZNF740 TCGA-A1-A0SE ARRDC4 B3GNT1 C10ORF71 C3ORF38 CCND1(A) CDH1 ENSG00000234924 ENSG00000245041 ENSG00000245055 ENSG00000245922 ENSG00000246925 ENSG00000247772 LOC646096 MAP2K4(D) MED23 MGA MRPS18B PAK1(A) RBM26 SDR16C5 SYDE2 TBC1D12 UNC13C WDR91 ZFHX4 TCGA-A1-A0SH 12p13.33(A) ACSL4 AHCTF1 ALPK3 ANK3 ANKRD7 APOB48R ARHGAP28 ASL ATPIF1 BCL7B BDP1 BLOC1S1 BRCA1 C14ORF37 CAP2 CCT8 CD97 CDCA2 CHCHD1 CNTN4 COL14A1 CUBN DAPK2 DHRS13 DMD DNAH8 DRGX ENSG00000210082 ENSG00000245997 ENSG00000246667 ENSG00000247966 ESCO1 EXPH5 FAM111A FAM149B1 FAM150B FAM83B FBXO4 GDF9 GPR32 H2BFWT HCFC2 HOMER3 HYDIN IRS4 ITIH5 KCNT2 KCNU1 KDELR3 KLHL25 KRT28 LOC100130982 LOC100288406 LOC201651 LOC440292 LOC645954 LPP LRRC8A MAGEA12 MARCH7 MED13L METT5D1 MICAL1 MTM1 NOS3 PALLD PCTK3 PHF17 PLCE1 PNCK PPARA PREX1 PTPRD(D) PZP RHCG SCAPER SLC17A4 SPTBN1 TAS2R46 TIFAB TTC39A UPRT WDR7 WDR87 WWOX(D) ZFHX4 ZNF606 TCGA-A1-A0SJ 20p12.1(D) ADK-MYST4(A) ADORA3 ALG1 AMZ2 ASCL3 C14ORF104 CCND1(A) CHML CILP CNR1 COL20A1 ENSG00000240720 ENSG00000245434 ENSG00000245549 ENSG00000245900 ENSG00000246515 ENSG00000247089 FAF2 FLJ40292 GJB2 GNPTAB HAGHL HNRPDL HOOK2 IKZF1 LATS2 LOC100287308 LOC100290640 LOC729866 MAP2K4(D) MCTS1 MDM2(A) NOTUM NUP62 OFD1 PAK1(A) PSMD11 RANBP6 RASSF7 SCN4A SNAI1 SPEN TH1L TNRC6A ZBTB11 ZNF217(A) ZNF543 TCGA-A1-A0SK 8p11(A) 8p11.23(A) ACBD5 AHNAK ANKRD42 ARL11 ASB10 ATG2A C19ORF29OS CAMTA2 CCL23 CHRNB4 COPE CYP21A2 DMBT1 DTX1 ENSG00000005206 ENSG00000223274 FAT3 FLJ32810 GDPD5 GMEB1 GTF3C1 HNRNPA1 IDS LAMA3 LARGE LOC645954 LRP2 LSR NPAS2 NSMAF OBFC2B OR5AU1 PJA1 POU4F1 RB1(D) RXFP4 SCD5 SERTAD3 SHPK SLITRK4 SSR4 TECTA TEX11 TG TP53 TRAF3IP1 UGT2B15 UNC5D USH2A VIT YIPF7 |

7楼2015-03-12 16:09:45
8楼2015-04-23 12:19:31
fangyonghui
新虫 (初入文坛)
- 应助: 0 (幼儿园)
- 金币: 217.1
- 散金: 100
- 红花: 1
- 帖子: 39
- 在线: 36小时
- 虫号: 510804
- 注册: 2008-02-24
- 专业: 信号理论与信号处理
9楼2015-04-24 03:01:21
10楼2015-06-24 16:55:22













回复此楼