24小时热门版块排行榜    

查看: 8454  |  回复: 3

棉子糖

铁虫 (初入文坛)


[交流] 教你如何做趋势分析

在实验的设计中,我们经常需要了解基因随时间,温度,药物浓度等变化的表达趋势。当生物体按照一定顺序发生变化或者受到外界环境刺激(如受到不同浓度的化学药物诱导)时,基因表达变化也会呈现趋势特征。

趋势分析

趋势分析(STC, Series Test of Cluster)就是发现基因表达的趋势特征,将相同变化特征的基因集中在一种变化趋势中,从而找到实验变化过程中最具有代表性的基因群,揭示生物样本在变化过程中所特有的规律。

应用场景举例

观察基因随时间的变化是趋势性分析应用较多的场景,下面我们就以此来看看趋势性分析的具体应用。

文章案例
Genes related to the very early stage of ConA-induced fulminant hepatitis: a gene-chip-based study in a mouse model


相关基因:ACSL1、MPDZ       相关疾病:Liver Failure
样本编号:GSE17184    PMID: 20398290           IF:3.867


这篇文章主要研究爆发性肝炎在早期阶段的病理机制,研究目的在于寻找病变过程中起主导作用的基因群及关键基因。作者采用ConA 诱导的小鼠肝炎模型,选取了0h,1h,3h,6h四个时间点做表达谱分析,用ANOVA筛选得到了1473个差异表达基因(p<0.05,FDR<0.05)。

为进一步筛选出显著变化的基因群,作者用趋势分析将差异基因的表达趋势进行了分门别类,从中得到了10个显著变化的趋势模型(p<0.05)。

图1 小鼠肝炎随时间变化的26个趋势模型,有颜色的代表显著的趋势模型(p<0.05),无颜色的代表不显著,相同颜色代表相似性的表达趋势

并在最显著变化的NO.9和NO.16趋势模型中,用基因共表达网络分析得到了26个核心基因,这些核心基因主要作用于蛋白转运、转录调节、细胞代谢方面。筛选出的核心基因为爆发性肝癌的早期诊断提供了分子依据。

图2 NO.9和NO.16趋势模型中基因的表达情况


趋势分析结果解析

上文作者在做爆发性肝癌的病理机制的研究中,通过趋势性分析来寻找病变过程中起主导作用的基因群。

那上述的趋势模型图具体怎么看呢?
完整的趋势分析结果是怎么的呢?

小编用上述文献中的样本GSE17184在GCBI在线实验室进行趋势分析,具体方案如下,0,1,3,6为时间分组,先对数据进行差异分析(P值<0.01 Q值<0.05),得到了9409个差异基因,再对差异基因进行趋势性分析。

图3 趋势分析方案图(数据GSE17184)

趋势模型总图
趋势分析得到的26个趋势模型(亦称为profile)中,筛选得到12个显著性profile(红色部分),最显著的两个分别为profile10和profile17,profile10和17都在1时无明显变化,随后开始下调/上调。

图4 GSE17184趋势模型总图

四个时间点为何是26种趋势模型?
如何将表达基因匹配到趋势模型中?
又如何判断趋势模型的显著性?

请戳方法论

如何看表达趋势模型呢?选取profile10作为示例。

图5 趋势总图中profile 10

图的正上方,显示趋势模型编号及P值。横坐标表示样本顺序,0、1、2、3分别对应时间点0h,1h,3h,6h。
纵坐标表示基因表达变化幅度,正负号表示上下调。
Profile 10的趋势模型可归纳为(0,0,-1,-2)。

(为什么趋势线都是都从0点开始呢?见下文)。

单个趋势图
趋势总图中的每个profile都对应有各自基因的趋势图。profile10的基因趋势图如下图所示。

图6 单个趋势模型

图的上方(0,0,-1,-2)对应趋势总图中的趋势模型。横坐标表示时间相,纵坐标表示表达变化幅度 log2(V(i)/V(0)),V(i)表示某相的表达值,V(0)表示0点的表达值。这就是为什么趋势线都是从零开始的。每条折线代表样本中的一个基因。

STC分析结果的详细信息可参见表格。

趋势模型总表
趋势总表中罗列了所有显著性趋势模型,红框中的参数表示基因在每个点变化幅度,绿框中为统计检验参数。
图7 趋势模型总表
genes assigned表示在每个趋势模型中的基因个数,gene expected表示置换基因样本顺序分配在这个趋势模型中的基因个数,由此来检验某个趋势模型是否具有统计显著性意义。黄框里是每个趋势模型的基因列表。

单个趋势模型列表
单个趋势模型列表罗列了每个profile中基因在每个时刻点的具体数值。
图8  单个趋势模型列表

STC-GO
在趋势分析中,可通过STC-GO进一步对显著趋势模型中的基因做GO功能分析,看基因群主要集中在哪些功能通路。上图profile10中的基因GO功能分析如下图所示,富集度最高的两个GO功能通路分别是细胞内铜离子转运和钙依赖的细胞基质黏附。

图9 profile 10 GO富集图

趋势分析方法

是否可以自行做趋势分析呢?
俗话说自己动手丰衣足食嘛。

在GCBI在线实验室,零基础照样做分析,只需拖动趋势分析模板即可。还是以上文中的数据GSE17184作为示范案例。
步骤

1、 进入GCBI网站的在线实验室 https://www.gcbi.com.cn(注册即可免费使用)

2、 建立趋势分析方案

建立了如下趋势分析方案。

图10 方案图

3、 选择样本数据。
在GCBI样本库中直接搜索GSE17184或直接搜文献也可获得数据链接,将数据发送至实验室以供后续分析。
图11 样本搜索

根据样本信息在每个时间点选择对应的实验样本。
图12 样本选择


4、 设置各模块参数
差异分析 P值<0.05
              Q值<0.05(因多分组,不考虑fold change)
趋势分析  p值<0.05
显著性趋势功能分析(STC-GO)
分析类型:生物过程     p值<0.01,FDR<0.01

5、运行方案
运行几分钟即可得到结果。

就是这么简单明了,趋势分析,拿下了么?


拓展
检测工具
Clariom™ D assays, mouse(曾用名GeneChip® Mouse Transcriptome Assay 1.0)


拓展知识:
三点搞定GEO数据上传
差异基因结果解读
GO和pathway分析及结果解读  视频教程
手把手教你用GSEA做富集图
如何用path-net挑选核心pathway  视频教程
基因共表达网络
芯片Meta分析

链接请见原文 http://college.gcbi.com.cn/blog/877.jhtml
教你如何做趋势分析
图1 小鼠肝炎随时间变化的26个趋势模型,有颜色的代表显著的趋势模型(p0.05),无颜色的代表不显著,相同颜色代表相似性的表达趋势.png


教你如何做趋势分析-1
图2 NO.9和NO.16趋势模型中基因的表达情况.png


教你如何做趋势分析-2
图3 趋势分析方案图(数据GSE17184).png


教你如何做趋势分析-3
图4 GSE17184趋势模型总图.jpg


教你如何做趋势分析-4
图5 趋势总图中profile 10.png


教你如何做趋势分析-5
图6 单个趋势模型.jpg


教你如何做趋势分析-6
图7 趋势总表.png


教你如何做趋势分析-7
图8 单个趋势模型列表.png


教你如何做趋势分析-8
图9 profile 10 GO富集图.png


教你如何做趋势分析-9
图10 方案图.png


教你如何做趋势分析-10
图11 样本搜索.png


教你如何做趋势分析-11
图12 样本选择.png
回复此楼

» 猜你喜欢

» 本主题相关商家推荐: (我也要在这里推广)

» 本主题相关价值贴推荐,对您同样有帮助:

» 抢金币啦!回帖就可以得到:

查看全部散金贴

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

棉子糖

铁虫 (初入文坛)


内容已删除
2楼2016-10-13 12:33:01
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
简单回复
syhorchid3楼
2016-10-13 13:22   回复  
棉子糖(金币+1): 谢谢参与
dsctg4楼
2016-10-13 13:44   回复  
棉子糖(金币+1): 谢谢参与
相关版块跳转 我要订阅楼主 棉子糖 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见