| 查看: 1279 | 回复: 1 | ||
[求助]
关于de novo拼接结果的疑问
|
|
之前发帖问过关于trinity软件de novo拼接的问题,但始终有些疑惑得不到解答。 (上一个帖子的问题: 最近在公司做了转录组测序,植物样本,illumina Hiseq2000,三个样本共100M的clean reads,一起拼接。该公司用Trinity软件进行de novo拼接,拼出来contigs达40多万条,后来又用CD-HIT进行聚类,结果仍有30多万条,其中包含很多转录本的存在。从文献中看一般植物转录组de novo拼接也就几万条序列,太多的转录本会影响到后面表达量的比较。不知道是由于Trinity这个拼接软件的原因还是其他什么原因。) 后来从拼接的contig中挑了些序列出来仔细比对,发现了一些问题。在trinity软件输出的结果中,同一个comp里面包含了很多的seq(每一个seq就是一个contig),很多的seq间有重叠的序列,多个seq可以拼接成一条长的序列,并且这条序列能很好的比对到拟南芥基因上。 我很疑惑为什么trinity软件不把这些短的seq组装成一条长的序列,按照我的理解能组装成一条长序列应该更有利于分析。不然,做差异表达分析的时候看起来是多个基因都差异表达了,其实这多个基因都只是一个基因上的不同片段而已。我看SOAP的原理,好像就可以将contig组装成scaffold。 不知用过de novo拼接软件的各位能否给些意见和建议。 |
» 猜你喜欢
退学或坚持读
已经有27人回复
面上基金申报没有其他的参与者成吗
已经有5人回复
有70后还继续奋斗在职场上的吗?
已经有5人回复
遇见不省心的家人很难过
已经有22人回复
博士延得我,科研能力直往上蹿
已经有5人回复
多组分精馏求助
已经有6人回复
» 本主题相关价值贴推荐,对您同样有帮助:
下午致电CSC询问结果事宜
已经有19人回复
灯用绿色荧光粉的一些疑问?
已经有8人回复
linux下面使用castep跑出来结果文件中没有xsd文件
已经有10人回复
【资料】nature关于生物燃料的综述
已经有66人回复
关于如何去除RSC文章模板中的endnote?
已经有12人回复
用Trinity进行de novo拼装
已经有16人回复
关于溶胶-凝胶法制备板钛矿TiO2
已经有25人回复
关于欧洲化学投稿状态谢谢
已经有4人回复
如此面试最终结果,无言!
已经有51人回复
【求助】关于乙丙橡胶牌号问题
已经有5人回复
【讨论】EBSD中关于取向差的描述?
已经有8人回复
【zhou2009个人文集】关于电荷计算的第二组分子
已经有4人回复
【讨论】香豆素衍生物合成中的疑问
已经有16人回复
【分享】测序结果拼接软件ContigExpress程序及使用方法
已经有128人回复
2楼2012-05-03 15:14:17













回复此楼