| 查看: 1260 | 回复: 1 | ||
[求助]
关于de novo拼接结果的疑问
|
|
之前发帖问过关于trinity软件de novo拼接的问题,但始终有些疑惑得不到解答。 (上一个帖子的问题: 最近在公司做了转录组测序,植物样本,illumina Hiseq2000,三个样本共100M的clean reads,一起拼接。该公司用Trinity软件进行de novo拼接,拼出来contigs达40多万条,后来又用CD-HIT进行聚类,结果仍有30多万条,其中包含很多转录本的存在。从文献中看一般植物转录组de novo拼接也就几万条序列,太多的转录本会影响到后面表达量的比较。不知道是由于Trinity这个拼接软件的原因还是其他什么原因。) 后来从拼接的contig中挑了些序列出来仔细比对,发现了一些问题。在trinity软件输出的结果中,同一个comp里面包含了很多的seq(每一个seq就是一个contig),很多的seq间有重叠的序列,多个seq可以拼接成一条长的序列,并且这条序列能很好的比对到拟南芥基因上。 我很疑惑为什么trinity软件不把这些短的seq组装成一条长的序列,按照我的理解能组装成一条长序列应该更有利于分析。不然,做差异表达分析的时候看起来是多个基因都差异表达了,其实这多个基因都只是一个基因上的不同片段而已。我看SOAP的原理,好像就可以将contig组装成scaffold。 不知用过de novo拼接软件的各位能否给些意见和建议。 |
» 猜你喜欢
对氯苯硼酸纯化
已经有3人回复
求助:我三月中下旬出站,青基依托单位怎么办?
已经有12人回复
不自信的我
已经有12人回复
假如你的研究生提出不合理要求
已经有5人回复
所感
已经有4人回复
论文终于录用啦!满足毕业条件了
已经有28人回复
要不要辞职读博?
已经有7人回复
北核录用
已经有3人回复
实验室接单子
已经有3人回复
磺酰氟产物,毕不了业了!
已经有8人回复
» 本主题相关价值贴推荐,对您同样有帮助:
下午致电CSC询问结果事宜
已经有19人回复
灯用绿色荧光粉的一些疑问?
已经有8人回复
linux下面使用castep跑出来结果文件中没有xsd文件
已经有10人回复
【资料】nature关于生物燃料的综述
已经有66人回复
关于如何去除RSC文章模板中的endnote?
已经有12人回复
用Trinity进行de novo拼装
已经有16人回复
关于溶胶-凝胶法制备板钛矿TiO2
已经有25人回复
关于欧洲化学投稿状态谢谢
已经有4人回复
如此面试最终结果,无言!
已经有51人回复
【求助】关于乙丙橡胶牌号问题
已经有5人回复
【讨论】EBSD中关于取向差的描述?
已经有8人回复
【zhou2009个人文集】关于电荷计算的第二组分子
已经有4人回复
【讨论】香豆素衍生物合成中的疑问
已经有16人回复
【分享】测序结果拼接软件ContigExpress程序及使用方法
已经有128人回复
2楼2012-05-03 15:14:17












回复此楼