24小时热门版块排行榜    

查看: 6798  |  回复: 0

omicsbean

新虫 (初入文坛)

[交流] GEO多套数据如何合并进行分析?(之一)

GEO数据库就是当今最大、最全面的公共基因表达数据资源。用户不仅可以上传自己的数据,而且还可以免费下载数据库中和自己研究方向类似甚至相同的数据来进行分析,为自己的研究提供一些启示或者验证。在这里不禁可以对数据进行二次分析找到和原文不同的研究方向构建模型,还可以横向拓展自己的实验,增加发表文章的档次。那么多套数据怎么合并并进行分析呢?这里分享下我个人的一些分析方法和大家探讨,有不合适的地方欢迎批评指正,共同学习。
1.GEO数据的下载:要选择相同研究内容的数据;最好是同一个芯片平台;soft文件。


2.将下载的soft压缩文件上传至omicsbean(http://www.omicsbean.cn),用其中的一个工具GEO2Matrix转换一下,并将转换之后的文件下载。

3.取转换后的文件中的基因名和相对表达值新建一个矩阵文件。这个时候要注意不同套数据的情况,看是否有经过log转换,我的看法是若都没经过log变换,取需要的数据合并就可以。若是都有,可经log变换之后再合并。

4.将合并之后的矩阵表达文件和分组文件上传至omicsbean(http://www.omicsbean.cn),经过质控(归一化、PCA、Cluster)并将变化差异较大的列删除后进行差异筛选。

5.对筛选出来的差异基因座功能富集分析。

GEO多套数据如何合并进行分析?(之一)
图片1.png
回复此楼

» 猜你喜欢

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 omicsbean 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见