24小时热门版块排行榜    

查看: 4451  |  回复: 8

emanlee

木虫 (小有名气)

[求助] 如何理解RNA-Seq基因表达数据(Count,或 FPKM)服从泊松分布

请问如何理解微阵列基因表达数据服从正态分布?是指一个Array中的表达数据,还是全部数据合在一起?
请问如何理解RNA-Seq基因表达数据(Count,或 FPKM)服从泊松分布,负二项分布?
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

youxiluo

新虫 (小有名气)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
wizardfan: 金币+5, 鼓励新虫发帖,分析得很好 2013-05-14 08:39:39
emanlee: 金币+10, 有帮助 2013-05-20 20:48:22
1 应该是指一个array中的数据就是正态分布,因为常用的t检验法筛选差异基因都是一个array一个array来进行的,也就是认为每个array都服从正态分布了

2 在RNA-Seq中,每个基因会对应多少个读段是一个计数型的随机变量,计数型随机变量分布类型通常就是离散分布里面那几个,泊松分布是最常见的一个了,加上有通常假定每个read在基因组序列上是均匀分布的,故一个基因对应的read数服从速率恒定的泊松分布(当然也可以推广至速率变化的泊松分布,那就得改变前提假设了)

以上是个人理解,希望有帮助!多多交流!
2楼2013-05-13 09:42:45
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

emanlee

木虫 (小有名气)

对于microarray,比如条件1下测了5个microarray1,microarray2,microarray3,microarray4,microarray5;
比如条件2下测了5个microarray6,microarray7,microarray8,microarray9,microarray10;
每个 microarray 中都有geneA,请问geneA 在条件1下的五个表达值服从正态分布吗?
3楼2013-05-13 15:20:02
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

emanlee

木虫 (小有名气)

对于RNA-Seq,
比如条件1下测了5个样本得到五个样本中geneA的count或者FPKM,count1,count2,count3,count4,count5;
比如条件2下测了另外5个样本得到五个样本中geneA的count或者FPKM,count6,count7,count8,count9,count10;
每个样本中都有geneA,请问geneA 在条件1下的五个表达值服从泊松分布吗?
4楼2013-05-13 15:35:56
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wizardfan

至尊木虫 (著名写手)

优秀版主

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
emanlee: 金币+10, 有帮助 2013-05-20 20:48:30
137167741: 金币+1, 小木虫交流,共同进步~~ 2013-06-26 12:27:02
引用回帖:
3楼: Originally posted by emanlee at 2013-05-13 15:20:02
对于microarray,比如条件1下测了5个microarray1,microarray2,microarray3,microarray4,microarray5;
比如条件2下测了5个microarray6,microarray7,microarray8,microarray9,microarray10;
每个 microar ...

不是,是within one microarray,而不是among microarrays。
5楼2013-05-14 08:39:13
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

emanlee

木虫 (小有名气)

Sample 1        Sample 2        Sample 3        Sample 4        Sample 5
Gene 1        Gs11        Gs12        Gs13        Gs14        Gs15
Gene 2        Gs21        Gs22        Gs23        Gs24        Gs25
Gene 3        Gs31        Gs32        Gs33        Gs34        Gs35

请问 gs11,gs12,...gs15 服从正态分布吗?
还是 gs11,gs21,gs31 服从正态分布?
6楼2013-06-26 12:04:27
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

emanlee

木虫 (小有名气)

数据格式有点乱,重新写了一下:

------        Sample 1        Sample 2        Sample 3        Sample 4        Sample 5
Gene 1        Gs11        Gs12        Gs13        Gs14        Gs15
Gene 2        Gs21        Gs22        Gs23        Gs24        Gs25
Gene 3        Gs31        Gs32        Gs33        Gs34        Gs35
7楼2013-06-26 12:08:21
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wubingran

金虫 (正式写手)


137167741: 金币+1, 小木虫交流,共同进步~~ 2013-07-05 15:19:16
这个你得出一个结论没??
关于理解NA-Seq基因表达数据(Count,或 FPKM)服从泊松分布或负二项分布。
可以分享一下,你最近对这个的理解不?
8楼2013-07-05 11:38:45
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

emanlee

木虫 (小有名气)

引用回帖:
8楼: Originally posted by wubingran at 2013-07-05 11:38:45
这个你得出一个结论没??
关于理解NA-Seq基因表达数据(Count,或 FPKM)服从泊松分布或负二项分布。
可以分享一下,你最近对这个的理解不?

泊松分布或负二项分布 -- 可能是在一个Lane内的各个基因间服从的。
9楼2013-07-09 08:24:08
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 emanlee 的主题更新
信息提示
请填处理意见