24小时热门版块排行榜    

查看: 1018  |  回复: 0

美亿美生物

捐助贵宾 (职业作家)

技术服务-实验代做


[交流] 微生物多样性测序需要多少重复?

原创 2017-08-24 小师兄

统计学可行性
那每组一个重复不能开展差异检验分析的话,每组3个重复是否就可以了?从统计学来说,3个重复确实可以。例如一般的t检验,每组至少3个重复就能算均值方差,从而进行t检验。

但t检验本身是一种有监督检验方法,需要依赖数据符合正态分布,而在多次随机抽样中,微生物的丰度分布并不一定符合正态分布,因此有时候需要开展无监督检验方法。Wilcoxon秩和检验就是一种常用的方法。但我们通过其检验临界表可以发现,在0.01的水平下至少需要5个重复才能找到数据,也就是才能开展分析。

因此,总结来说,要开展有效的差异检验分析,必须要有至少3个,甚至5个样本重复才可以。




生物学合理性


考虑完分析的可行性之后,接下来我们讨论其合理性,也就是多少重复才算比较有数据代表性。由于微生物样本影响因素繁多,加上样本物种种类复杂,因此相比于转录组等样本来说,其离散程度较大。同时由于人为误差的必然存在(如采集到极端样本、操作失误等),因此,就算3,5个样本重复统计出来的显著差异,实际上并没有太多生物学意义。

举个例子,如果需要开发一种药物针对性治疗某种疾病,而这种疾病经过研究是与肠道微生物有关,那很自然想到通过分析寻找肠道群落的biomarker。现在有两个实验室同时对正常与疾病人群采样进行研究,其中A实验室每组采集3个样本作为重复,而B实验室每组采集50个样本。两个实验室都通过差异检验分析得到一些候选物种作为biomarker,你是药物研发公司的投资人,会选谁的结果作为依据来开发药物?



很显然,在进行容错率越低的研究时候(例如药物研发,疾病机理等),我们需要更多的样本重复来消除背景误差,以精确的找到目标,因此B实验室的结果在这种环境下更让人“放心”。

同时,样本的复杂程度越高,理论需要的重复数也越多。因此推荐,一般的水体研究,可以开展5个左右重复,土壤10个以上,而人体肠道微生物研究,则推荐20个以上样本。


操作便捷性


前面我们所谈到的,都是理论问题。那实际操作当中呢,多少重复有利于实验的开展?

由于实验条件的差异,经常造成测序所产生的数据量差别很大。例如同一批数据,同一组中某重复a、b的tag数目都是20万,另外一个重复c则是3万。我们可以采用抽平分析策略来解决数据量差异问题,但着会造成a、b数据的极大浪费。如果直接用原始数据进行分析,后期分析肯定会造成极大误差。其实由于c数据出现极端异常,很有可能是离群样本,因此合理的方法是把c样本剔除。但由于开始只有3个重复,在剔除样本后没办法开展后续差异分析。

为了解决这数据剔除的问题,最简单有效的方法就是在实验设计时候增加样本数,如果设计的是10个样本,那么后期就算剔除3个(已经非常多了),也还可以开展后续分析。当然,考虑到成本情况下,一般还是推荐至少5个重复。
回复此楼

» 猜你喜欢

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 美亿美生物 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见