24小时热门版块排行榜    

CyRhmU.jpeg
查看: 3154  |  回复: 16
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

七八月的阳光

铜虫 (初入文坛)


[交流] 用Trinity进行de novo拼装

最近在公司做了转录组测序,植物样本,illumina Hiseq2000,三个样本共100M的clean reads,一起拼接。该公司用Trinity软件进行de novo拼接,拼出来contigs达40多万条,后来又用CD-HIT进行聚类,结果仍有30多万条,其中包含很多转录本的存在。从文献中看一般植物转录组de novo拼接也就几万条序列,太多的转录本会影响到后面表达量的比较。不知道是由于Trinity这个拼接软件的原因还是其他什么原因。
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

» 抢金币啦!回帖就可以得到:

查看全部散金贴

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gaoyang636

木虫 (著名写手)


引用回帖:
8楼: Originally posted by zhusheng303 at 2012-04-13 09:38:17:
我看到你的测序结果后感到很奇怪,有几个问题想问你:
(1)你的三个样本的reads长度是多少啊?如果reads太短,也会导致拼接的结果变化。还有就是你用哪种方式建库,single-end,mated-paired 和 paired-end?一 ...

转录组哪有做MP的?
9楼2012-04-13 14:34:08
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 17 个回答

gaoyang636

木虫 (著名写手)



小木虫: 金币+0.5, 给个红包,谢谢回帖
植物的基因组多大呢?
contig的N50有多少?
2楼2012-04-11 16:50:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

七八月的阳光

铜虫 (初入文坛)


引用回帖:
2楼: Originally posted by gaoyang636 at 2012-04-11 16:50:53:
植物的基因组多大呢?
contig的N50有多少?

不知道呢,可能很大,有90多条染色体。
选取的contig为200bp以上,N50为558
不知道是不是和多倍体重复基因有关系
第一次发金币,发出去了吗?
3楼2012-04-11 16:57:55
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gaoyang636

木虫 (著名写手)


★ ★ ★ ★ ★
小木虫: 金币+0.5, 给个红包,谢谢回帖
zhaohq1209: 金币+4, 学习了~欢迎继续交流哈 2012-04-13 11:28:17
我个人感觉是你的测序深度太小,而不是软件的问题,即便把其他的拼接软件都用一遍,也不会有什么明显改善。
如果你想把contig尽量拼好一点,进行项目的时候就应该和公司讨论好。才100M的reads,不够的。看看文献上的测序量有多少?
不过转录组本来也不要求拼长,直接去比对也可以的。你如果是觉得contig太多,就过滤一下吧,比如,选400bp以上的?
4楼2012-04-12 08:26:10
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复(可上传附件)
信息提示
请填处理意见