24小时热门版块排行榜    

CyRhmU.jpeg
查看: 4533  |  回复: 6

yuehedou

木虫 (小有名气)

[求助] miRNA差异表达分析时reads数目的校准(TPM)问题

在做miRNA的差异表达分析时,很多文章里都要使用TPM(Transcripts per million,公式为:单一miRNA reads数×10^6/总reads数)来校准miRNA的表达量,这样做是为了去除pcr扩增文库时的偏倚吗?
然后,如果使用TPM进行校准,那也会产生另外的差异啊我觉得,举个极端的例子:样品A中实际总共表达了10个reads,其中miR1表达了2个;样品B总共表达了100个reads,其中miR1表达了20个,——实际上在两个样品中miR1是显著差异表达的,但经TPM校准后,两个样品中其表达量就都成了20 000,就一样了么,那么校准岂不是产生了原来没有的错误??
我觉得miRNA是短序列,不存在转录组中序列片段长短的问题,那么直接使用reads的count作为其相应miRNA的表达量岂不是更好?
欢迎讨论!
回复此楼
每天都为自己的无知而羞耻!
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

myibm369

木虫 (正式写手)

~~~~~~~~~~~~~~~~~

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
yuehedou: 金币+18, ★★★★★最佳答案, 非常给力! 2014-05-06 15:10:14
引用回帖:
使用TPM(Transcripts per million,公式为:单一miRNA reads数×10^6/总reads数)来校准miRNA的表达量

这其实是个normalization的过程,因为假如你有多个样品(》=2),测序得到的total mapping reads的数目是不一样的,大家必须normalize到同一个水平才方便比较。
引用回帖:
样品A中实际总共表达了10个reads,其中miR1表达了2个;样品B总共表达了100个reads,其中miR1表达了20个

你说的实际应该是指细胞内真正表达的数量吧,但是实际上通过测序你是拿不到真正意义上的绝对表达量,只是一个相对的表达量。我们在进行2个或者多个样品genes或者miRNA表达差异分析比较的时候,是默认总体RNA表达的一样多的。简单来说就是你例子中sample A和B的RNA总量是一致的,不过A测序测到了10个reads,B测序测的比较多,拿到了100个reads,如果A也达到B的测序深度,其实miR1也就是20个reads,表达量是一致的。

不知道你明白否
2楼2014-05-06 09:24:15
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yuehedou

木虫 (小有名气)

引用回帖:
2楼: Originally posted by myibm369 at 2014-05-06 09:24:15
这其实是个normalization的过程,因为假如你有多个样品(》=2),测序得到的total mapping reads的数目是不一样的,大家必须normalize到同一个水平才方便比较。


你说的实际应该是指细胞内真正表达的数量吧, ...

引用回帖:
这其实是个normalization的过程,因为假如你有多个样……

我觉得total mapping reads的数目不一样才是正常的,因为是不同样品。
引用回帖:
你说的实际应该是指细胞内真正表达的数量吧……

我说的是实际表达量。我认为只要能控制建库均匀度、测序深度,那得到的数据反映的应该就是实际表达丰度,即使这种反映是将原来的表达量以一种集体相对的方式表现出来,例如将实际的表达量整体放大。因为实际总体和单个的表达量就不一致,在测序深度同样为10的情况下,样品A中miR1表达了1,放大10倍就测得了10;B中miR1表达了10,放大10倍就成了100. 那我们后边又进行校准,就人为地抹掉了这种差异——实际上它们却是有显著差异的。
每天都为自己的无知而羞耻!
3楼2014-05-06 11:53:03
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

myibm369

木虫 (正式写手)

~~~~~~~~~~~~~~~~~

引用回帖:
3楼: Originally posted by yuehedou at 2014-05-06 11:53:03
我觉得total mapping reads的数目不一样才是正常的,因为是不同样品。

我说的是实际表达量。我认为只要能控制建库均匀度、测序深度,那得到的数据反映的应该就是实际表达丰度,即使这种反映是将原来的表达量以 ...

其实你假设下就知道了,上机测序的total miRNA量 A为10ng其中miR1有1ng,B为10ng其中miRNA1有0.1ng,那么你最后测序得到的结果比例还是这样的,A中miR1为10%,B中miR1为1%,都normalization到100,那么A的miR1是10,B的是1。
<quote>在测序深度同样为10的情况下,样品A中miR1表达了1,放大10倍就测得了10;B中miR1表达了10,放大10倍就成了100. 那我们后边又进行校准,就人为地抹掉了这种差异——实际上它们却是有显著差异的。</quote>
校准还是10:100哦,是有差异的啊。
4楼2014-05-06 12:13:49
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yuehedou

木虫 (小有名气)

引用回帖:
4楼: Originally posted by myibm369 at 2014-05-06 12:13:49
其实你假设下就知道了,上机测序的total miRNA量 A为10ng其中miR1有1ng,B为10ng其中miRNA1有0.1ng,那么你最后测序得到的结果比例还是这样的,A中miR1为10%,B中miR1为1%,都normalization到100,那么A的miR1是10 ...

哦,明白了,“拿去上机测序的样品总量是一样的”,所以后边才把测得的总量校准到一样!
谢谢你的耐心讲解,终于解了心里纠结很久的困惑!
每天都为自己的无知而羞耻!
5楼2014-05-06 15:09:26
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wangjiying

铁虫 (小有名气)

请问TMP校正公式中总reads数是指的什么?是测序产生的总Read数?还是检测出的miRNA的raw read的总和?还是其它?请指教,谢谢!
6楼2015-08-19 00:44:37
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yuehedou

木虫 (小有名气)

引用回帖:
6楼: Originally posted by wangjiying at 2015-08-19 00:44:37
请问TMP校正公式中总reads数是指的什么?是测序产生的总Read数?还是检测出的miRNA的raw read的总和?还是其它?请指教,谢谢!

应该是指单个样品的clean reads的总数。
每天都为自己的无知而羞耻!
7楼2015-08-20 16:05:04
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 yuehedou 的主题更新
信息提示
请填处理意见