| 查看: 3404 | 回复: 16 | |||
[交流]
用Trinity进行de novo拼装
|
|||
| 最近在公司做了转录组测序,植物样本,illumina Hiseq2000,三个样本共100M的clean reads,一起拼接。该公司用Trinity软件进行de novo拼接,拼出来contigs达40多万条,后来又用CD-HIT进行聚类,结果仍有30多万条,其中包含很多转录本的存在。从文献中看一般植物转录组de novo拼接也就几万条序列,太多的转录本会影响到后面表达量的比较。不知道是由于Trinity这个拼接软件的原因还是其他什么原因。 |
» 猜你喜欢
求环氧树脂研发1名
已经有10人回复
280求调剂
已经有5人回复
什么是人一生最重要的?
已经有10人回复
面上可以超过30页吧?
已经有13人回复
网上报道青年教师午睡中猝死、熬夜猝死的越来越多,主要哪些原因引起的?
已经有10人回复
为什么中国大学工科教授们水了那么多所谓的顶会顶刊,但还是做不出宇树机器人?
已经有13人回复
版面费该交吗
已经有17人回复
【博士招生】太原理工大学2026化工博士
已经有8人回复
» 本主题相关价值贴推荐,对您同样有帮助:
Trinity拼装contig数量
已经有0人回复
陈连福NGS生物信息分析 2015暑期培训班招生简章
已经有326人回复
模具咬花数字化:更简单更快地实现丰富的表面质感
已经有0人回复
单词演义(五)
已经有40人回复
关于de novo拼接结果的疑问
已经有1人回复
【迅雷】1024分辨率《加勒比海盗4》BD中英双字无水印
已经有6人回复
【迅雷】2011动作科幻大片《加勒比海盗4》BD国语配音中字1024高清
已经有5人回复
【迅雷】2011最新动作冒险大片《加勒比海盗4:惊涛怪浪》DVD中英双字
已经有65人回复
» 抢金币啦!回帖就可以得到:
单曲循环久了很多都会变
+1/399
高级研发工程师/研发工程师 – 锂离子电池正极材料回收与制备-香港纳米及先进材料研发
+1/284
寻找那个能让“稳定生活”变得“更有趣”的你
+1/160
【全奖博士招生】美国科罗拉多大学科罗拉多斯普林斯分校----固体与结构力学
+1/84
【最后机会】深圳大学2026级土木工程博士急招
+5/80
南通大学生物医药方向国家级人才团队招聘教师
+3/62
设备故障诊断与预测性维护方向-硕博研究生兼职
+1/43
澳门理工大学人工智能智慧康养方向26 年9月入学博士招生 奖学金
+1/30
26年启明计划
+1/17
南京林业大学-国家级青年人才团队 招2026级申请考核制博士
+1/13
推荐一款可以AI辅助写作的Latex编辑器SmartLatexEditor,超级好用,推荐试试
+1/10
中国林科院林业研究所/林木遗传育种全国重点实验室 “推免生”硕士/博士生招生
+1/8
邀稿综述,作者排名和工作量分工问题,存在不满和疑问。
+1/7
海南大学-国家级人才团队 招2026级全日制硕士研究生
+1/6
【2026年】【材料力学方向】中科院力学所招1名硕士
+1/4
【全奖博士招生】美国科罗拉多大学科罗拉多斯普林斯分校----固体与结构力学
+1/4
青岛理工大学高端装备健康监测与智能运维团队接受调剂
+1/3
陕西科技大学招生学术博士生1名(锂钠离子电池/光电催化/环境功能材料/热电材料)
+1/3
【科研助理招聘-北京理工大学-集成电路与电子学院-国家杰青团队】
+1/3
新加坡南洋理工大学- 光电/ 智能传感/ 脑机接口方向 博士后
+1/1
★ ★ ★ ★ ★
小木虫: 金币+0.5, 给个红包,谢谢回帖
zhaohq1209: 金币+4, 信息学的GG就是不一般 2012-04-13 11:28:43
小木虫: 金币+0.5, 给个红包,谢谢回帖
zhaohq1209: 金币+4, 信息学的GG就是不一般 2012-04-13 11:28:43
|
我看到你的测序结果后感到很奇怪,有几个问题想问你: (1)你的三个样本的reads长度是多少啊?如果reads太短,也会导致拼接的结果变化。还有就是你用哪种方式建库,single-end,mated-paired 和 paired-end?一般,如果用paired-end技术,可能拼接结果会更好点。 (2)你的三个样本是混在一起建库后测序的吗?还是分别建成三个库,分别加三个不同barcode的加以区别吗?如果是后者,我有一个问题,一般Hiseq 2000的一个lane可以获得5-30G左右的数据,而且一个lane里面最多也就可以加到24样品啊,一般的公司在一个lane最多也就加到8个样品,所以你的一个样品获得数据5G/24=210Mb左右才对啊,三个样品应该是至少也应该是600Mbp左右啊!如果你的reads总共才100Mbp的话,拼接成这样,应该是因为你的测序depth太低(因为植物的基因很大,除了拟南芥小点(125Mb)外,一般都大于400Mbp)。你的植物的物种是木本,还是草本植物;如果是木本植物,它的基因组可能会更大点,也会影响你的测序depth。 (3)在使用Tiniity拼接时,你输出的最小的contig长度是多少呢(即“--min_contig_length”参数设置为多少,程序默认200bp)? (4)在使用Tiniity拼接时,他使用哪个方法拼接的:Inchworm、 Chrysalis 和Butterfly (A)Inchworm assembles the RNA-seq data into the unique sequences of transcripts, often generating full-length transcripts for a dominant isoform, but then reports just the unique portions of alternatively spliced transcripts. (B) Chrysalis clusters the Inchworm contigs into clusters and constructs complete de Bruijn graphs for each cluster. Each cluster represents the full transcriptonal complexity for a given gene (or sets of genes that share sequences in common). Chrysalis then partitions the full read set among these disjoint graphs. (C)Butterfly then processes the individual graphs in parallel, tracing the paths that reads and pairs of reads take within the graph, ultimately reporting full-length transcripts for alternatively spliced isoforms, and teasing apart transcripts that corresponds to paralogous genes. 三种方法得到的结果也是有所不同的。 |
8楼2012-04-13 09:38:17
2楼2012-04-11 16:50:53
3楼2012-04-11 16:57:55
4楼2012-04-12 08:26:10
5楼2012-04-12 09:33:09
6楼2012-04-12 16:07:38
7楼2012-04-13 09:19:25
9楼2012-04-13 14:34:08
10楼2012-04-13 17:34:53
11楼2012-04-16 09:18:26
12楼2012-04-16 09:56:13
13楼2012-04-16 15:48:05
14楼2012-04-16 15:54:43
15楼2012-04-16 19:52:12
16楼2012-04-17 08:12:51
17楼2015-06-18 10:49:52













回复此楼