|
|
[交流]
阻碍基因测序产业从二代技术升级到三代技术最大的技术障碍:组装算法 已有1人参与
“第三代测序技术”的研发已有近十年时间,商业化的第三代测序仪上市也有三年。但目前测序市场仍为二代测序技术所垄断。三代测序技术产生的读段更长,测序成本更低,其取代二代技术是测序技术发展的必然趋势。然而由于三代测序技术错误率高,现有的组装软件多是对第二代测序数据组装软件的“修补”而并没有充分考虑到三代测序技术的数据特征。事实上,基因组装算法问题被广泛认为是计算生物学和生物信息学领域最复杂的计算难题之一,也是目前阻碍基因测序产业从二代技术升级到三代技术最大的技术障碍。
最近,Chengxi Ye等人发表了一篇题为DBG2OLC: Efficient Assembly of Large Genomes Using the Compressed Overlap Graph 的文章,引入了一种新的针对三代测序技术的基因组装算法,开发出一款软件(DBG2OLC)。
与目前用于三代测序最优秀的一些基因组装软件(例如PacBio2CA, HGAP, ECTools)相比,DBG2OLC在计算时间和内存空间的消耗通常仅为其它算法的1/10。理论上,DBG2OLC在时间和空间的使用上相对其它同类软件可减少达1000倍。例如组装关键步骤之一的“两两比对”计算,采用一组由 PacBio提供的人类基因组数据,DBG2OLC 使用一台普通PC仅用了6小时完成。而同样计算,Pacific Biosciences所报道的时间为 405000 CPU小时,而且是在Google的计算集群上完成。因此,DBG2OLC 算法基本解决了目前三代测序技术所面临的计算技术挑战,从而为推进基因测序技术的产业升级奠定了良好的技术基础。
软件链接:http://sites.google.com/site/dbg2olc/.
DBG2OLC: Efficient Assembly of Large Genomes Using the Compressed Overlap Graph
Chengxi Ye, Chris Hill, Sergey Koren, Jue Ruan, Zhanshan (Sam)Ma, James A. Yorke, Aleksey Zimin
(Submitted on 10 Oct 2014)
关注我:
在微信中,“发现”->“扫一扫”,扫描我的二维码,加关注。
在微信中,“通讯录”-> “添加”-> “查找公众号”,找到“生物信息库”,加关注。
![阻碍基因测序产业从二代技术升级到三代技术最大的技术障碍:组装算法]()
微信二维码.jpg |
» 猜你喜欢
» 本主题相关价值贴推荐,对您同样有帮助:
|