24小时热门版块排行榜    

查看: 5691  |  回复: 12
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

zhangjunpeng

至尊木虫 (知名作家)

[交流] TCGA数据库的使用交流 已有10人参与

在生信领域,数据源是非常重要的,毕竟谁也不想感受“巧妇无米之炊”的感觉。随着大数据时代的到来,各种大型生物公共数据库也不断完善,其中就包括The Cancer Genome Atlas (TCGA,https://tcga-data.nci.nih.gov/tcga/tcgaHome2.jsp)数据库。TCGA数据源大部分都是公开的,如何有效的进行收集和预处理是一个头疼的问题。

目前来能够从TCGA数据库中提取数据的处理工具有cBioPortal(http://www.cbioportal.org/public-portal/cgds_r.jsp),ICGC(http://dcc.icgc.org/download/current)和GenePattern(http://www.broadinstitute.org/ca ... tern/download/index)。这些工具使用起来还是有其局限性,都不能够轻易获取每个癌症类型的二维数据矩阵(例如基因为rows,样本为columns)。

因此开此贴,欢迎各位同行虫友交流一下获取TCGA数据库的经验,以及间接获取TCGA数据的工具使用技巧和方法。
回复此楼

» 收录本帖的淘帖专辑推荐

分子生化实验经验积累

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

北冥有鱼,其名为鲲。鲲之大,不知其几千里也。化而为鸟,其名为鹏。鹏之背,不知其几千里也。怒而飞,其翼若垂天之云。是鸟也,海运则将徙于南冥。南冥者,...
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangjunpeng

至尊木虫 (知名作家)

引用回帖:
2楼: Originally posted by biojamie at 2014-03-18 22:11:58
我最近也在使用TCGA的一些数据,TCGA只公开部分的肿瘤数据,有一些是可以下载,但不能发布使用,对于既能下又能用的部分(我用到的是22种肿瘤),又分为基因组的variation和RNA seq的一些原始结果(目前我所知道的)。最 ...

虽然TCGA公开了很多数据,但是数据格式难以转化成熟悉的结构化数据:nXm,其中n为变量,m为样本。所以数据转化是一个问题。
北冥有鱼,其名为鲲。鲲之大,不知其几千里也。化而为鸟,其名为鹏。鹏之背,不知其几千里也。怒而飞,其翼若垂天之云。是鸟也,海运则将徙于南冥。南冥者,...
3楼2014-03-18 22:33:43
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 13 个回答

biojamie

金虫 (初入文坛)


小木虫: 金币+0.5, 给个红包,谢谢回帖
我最近也在使用TCGA的一些数据,TCGA只公开部分的肿瘤数据,有一些是可以下载,但不能发布使用,对于既能下又能用的部分(我用到的是22种肿瘤),又分为基因组的variation和RNA seq的一些原始结果(目前我所知道的)。最好是批量下载,即在它的ftp上把整个文件夹获取。另外也推荐一个肿瘤数据库:COSMIC  里面的mutation文件竟包含了TCGA的一些结果,但我没细看是否完全包含了,lz如果深入做这部分,可以向你请教一下!
2楼2014-03-18 22:11:58
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

scybhmu老谭

木虫 (小有名气)


小木虫: 金币+0.5, 给个红包,谢谢回帖
我也在用这个数据库的数据,它里面gene expressing 的数据一般有3个level,但是往往没有我需要的level2的数据,所以想要得到真的不容易,但是听人说给作者写邮件能得到level2的数据,不知道能不能行,想问问你们有没有什么办法得到level2的数据?
4楼2014-04-12 14:21:03
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangjunpeng

至尊木虫 (知名作家)

引用回帖:
4楼: Originally posted by scybhmu老谭 at 2014-04-12 14:21:03
我也在用这个数据库的数据,它里面gene expressing 的数据一般有3个level,但是往往没有我需要的level2的数据,所以想要得到真的不容易,但是听人说给作者写邮件能得到level2的数据,不知道能不能行,想问问你们有没 ...

level2数据一般是受保护的,有些涉及到隐私,内部人员才有权利进入。一般来说,获取level3数据就不错了。
北冥有鱼,其名为鲲。鲲之大,不知其几千里也。化而为鸟,其名为鹏。鹏之背,不知其几千里也。怒而飞,其翼若垂天之云。是鸟也,海运则将徙于南冥。南冥者,...
5楼2014-04-12 15:37:17
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复 (可上传附件)
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[考研] 考研调剂 +3 呼呼?~+123456 2026-03-21 3/150 2026-03-21 20:04 by 无际的草原
[考研] 0805 316求调剂 +3 大雪深藏 2026-03-18 3/150 2026-03-21 18:55 by 学员8dgXkO
[考研] 307求调剂 +3 余意卿 2026-03-18 3/150 2026-03-21 17:31 by ColorlessPI
[考研] 求调剂 +6 Mqqqqqq 2026-03-19 6/300 2026-03-21 08:04 by JourneyLucky
[考研] 南昌大学材料专硕311分求调剂 +6 77chaselx 2026-03-20 6/300 2026-03-21 07:24 by JourneyLucky
[考研] 一志愿中国石油大学(华东) 本科齐鲁工业大学 +3 石能伟 2026-03-17 3/150 2026-03-21 02:22 by JourneyLucky
[考研] 材料 336 求调剂 +3 An@. 2026-03-18 4/200 2026-03-21 01:39 by JourneyLucky
[考研] 一志愿武汉理工材料工程专硕调剂 +9 Doleres 2026-03-19 9/450 2026-03-20 22:36 by JourneyLucky
[考研] 材料与化工 322求调剂 +4 然11 2026-03-19 4/200 2026-03-20 22:12 by luoyongfeng
[考研] 北科281学硕材料求调剂 +5 tcxiaoxx 2026-03-20 5/250 2026-03-20 21:35 by laoshidan
[考研] 一志愿西南交通 专硕 材料355 本科双非 求调剂 +5 西南交通专材355 2026-03-19 5/250 2026-03-20 21:10 by JourneyLucky
[考研] 344求调剂 +6 knight344 2026-03-16 7/350 2026-03-18 20:13 by walc
[考研] 材料,纺织,生物(0856、0710),化学招生啦 +3 Eember. 2026-03-17 9/450 2026-03-18 10:28 by Eember.
[考研] 277调剂 +5 自由煎饼果子 2026-03-16 6/300 2026-03-17 19:26 by 李leezz
[考研] 290求调剂 +3 p asserby. 2026-03-15 4/200 2026-03-17 16:35 by wangkm
[考研] 一志愿苏州大学材料工程(085601)专硕有科研经历三项国奖两个实用型专利一项省级立项 +6 大火山小火山 2026-03-16 8/400 2026-03-17 15:05 by 无懈可击111
[考研] 275求调剂 +4 太阳花天天开心 2026-03-16 4/200 2026-03-17 10:53 by 功夫疯狂
[考研] 中科院材料273求调剂 +4 yzydy 2026-03-15 4/200 2026-03-16 15:59 by Gaodh_82
[考研] 327求调剂 +6 拾光任染 2026-03-15 11/550 2026-03-15 22:47 by 拾光任染
[考研] 0856专硕279求调剂 +5 加油加油!? 2026-03-15 5/250 2026-03-15 11:58 by 2020015
信息提示
请填处理意见