| 查看: 3151 | 回复: 16 | |||
[交流]
用Trinity进行de novo拼装
|
|||
| 最近在公司做了转录组测序,植物样本,illumina Hiseq2000,三个样本共100M的clean reads,一起拼接。该公司用Trinity软件进行de novo拼接,拼出来contigs达40多万条,后来又用CD-HIT进行聚类,结果仍有30多万条,其中包含很多转录本的存在。从文献中看一般植物转录组de novo拼接也就几万条序列,太多的转录本会影响到后面表达量的比较。不知道是由于Trinity这个拼接软件的原因还是其他什么原因。 |
» 猜你喜欢
真诚求助:手里的省社科项目结项要求主持人一篇中文核心,有什么渠道能发核心吗
已经有8人回复
寻求一种能扛住强氧化性腐蚀性的容器密封件
已经有5人回复
论文投稿,期刊推荐
已经有6人回复
请问哪里可以有青B申请的本子可以借鉴一下。
已经有4人回复
孩子确诊有中度注意力缺陷
已经有14人回复
请问下大家为什么这个铃木偶联几乎不反应呢
已经有5人回复
请问有评职称,把科研教学业绩算分排序的高校吗
已经有5人回复
2025冷门绝学什么时候出结果
已经有3人回复
天津工业大学郑柳春团队欢迎化学化工、高分子化学或有机合成方向的博士生和硕士生加入
已经有4人回复
康复大学泰山学者周祺惠团队招收博士研究生
已经有6人回复
» 本主题相关价值贴推荐,对您同样有帮助:
Trinity拼装contig数量
已经有0人回复
陈连福NGS生物信息分析 2015暑期培训班招生简章
已经有326人回复
模具咬花数字化:更简单更快地实现丰富的表面质感
已经有0人回复
单词演义(五)
已经有40人回复
关于de novo拼接结果的疑问
已经有1人回复
【迅雷】1024分辨率《加勒比海盗4》BD中英双字无水印
已经有6人回复
【迅雷】2011动作科幻大片《加勒比海盗4》BD国语配音中字1024高清
已经有5人回复
【迅雷】2011最新动作冒险大片《加勒比海盗4:惊涛怪浪》DVD中英双字
已经有65人回复
» 抢金币啦!回帖就可以得到:
加拿大/英属哥伦比亚大学曹彦凯课题组招收全奖博士/博后 [机器学习/优化/控制方向]
+1/85
加拿大/英属哥伦比亚大学曹彦凯课题组招收全奖博士/博后 [机器学习/优化/控制方向]
+1/82
湘潭大学化学学院陈华杰教授课题组招收有机/高分子方向的博士研究生
+1/81
招收26年资源与环境领域、生物质生物转化、生物技术等方向博士研究生
+1/79
湘潭大学化学学院理论与计算化学课题组裴勇教授招生博士生2名
+2/72
同济大学 物理科学与工程学院 陈振跃(国家高层次青年人才) 课题组招聘博士后
+1/71
鄢勇课题组2026年拟招收项目聘用人员1名,方向:1. 具身智能;2. 智能感知;3. 忆阻器
+1/39
双一流大学湘潭大学“化工过程模拟与强化”国家地方联合工程研究中心招收各类博士生
+1/32
青岛大学 丁欣 课题组 招收2026秋化学博士1名
+1/31
哈尔滨工业大学(深圳)赵怡潞课题组诚招博士后
+1/15
澳门科技大学2026年数学博士招生——计算物理与数学课题组: 相场与计算流体动力学
+1/13
招若干有机合成人员 (中山大学)
+1/11
东华大学 唐正 课题组诚招2026年博士研究生-有机半导体材料与器件等
+1/8
北理工化学领军人才团队招收有机光电材料合成与太阳能电池器件背景的26级博士生
+1/7
招收26年秋季入学博士生(北科大高精尖学院 力学超材料/机器学习/增材制造相关方向)
+1/6
欢迎报考中山大学课题组,提供2025-2026级硕士研究生名额
+1/4
上海师范大学邓清海教授课题组招收2026届有机化学博士研究生
+1/4
三峡集团科研院海上风电研究项目实习生招聘公告
+1/2
中国科学技术大学 精准智能化学重点实验室 武建昌课题组招聘博士,博士后
+1/1
上海交通大学章晔课题组诚聘博士后(半导体光学、纳米光子学、超材料方向)
+1/1
★ ★ ★ ★ ★
小木虫: 金币+0.5, 给个红包,谢谢回帖
zhaohq1209: 金币+4, 信息学的GG就是不一般 2012-04-13 11:28:43
小木虫: 金币+0.5, 给个红包,谢谢回帖
zhaohq1209: 金币+4, 信息学的GG就是不一般 2012-04-13 11:28:43
|
我看到你的测序结果后感到很奇怪,有几个问题想问你: (1)你的三个样本的reads长度是多少啊?如果reads太短,也会导致拼接的结果变化。还有就是你用哪种方式建库,single-end,mated-paired 和 paired-end?一般,如果用paired-end技术,可能拼接结果会更好点。 (2)你的三个样本是混在一起建库后测序的吗?还是分别建成三个库,分别加三个不同barcode的加以区别吗?如果是后者,我有一个问题,一般Hiseq 2000的一个lane可以获得5-30G左右的数据,而且一个lane里面最多也就可以加到24样品啊,一般的公司在一个lane最多也就加到8个样品,所以你的一个样品获得数据5G/24=210Mb左右才对啊,三个样品应该是至少也应该是600Mbp左右啊!如果你的reads总共才100Mbp的话,拼接成这样,应该是因为你的测序depth太低(因为植物的基因很大,除了拟南芥小点(125Mb)外,一般都大于400Mbp)。你的植物的物种是木本,还是草本植物;如果是木本植物,它的基因组可能会更大点,也会影响你的测序depth。 (3)在使用Tiniity拼接时,你输出的最小的contig长度是多少呢(即“--min_contig_length”参数设置为多少,程序默认200bp)? (4)在使用Tiniity拼接时,他使用哪个方法拼接的:Inchworm、 Chrysalis 和Butterfly (A)Inchworm assembles the RNA-seq data into the unique sequences of transcripts, often generating full-length transcripts for a dominant isoform, but then reports just the unique portions of alternatively spliced transcripts. (B) Chrysalis clusters the Inchworm contigs into clusters and constructs complete de Bruijn graphs for each cluster. Each cluster represents the full transcriptonal complexity for a given gene (or sets of genes that share sequences in common). Chrysalis then partitions the full read set among these disjoint graphs. (C)Butterfly then processes the individual graphs in parallel, tracing the paths that reads and pairs of reads take within the graph, ultimately reporting full-length transcripts for alternatively spliced isoforms, and teasing apart transcripts that corresponds to paralogous genes. 三种方法得到的结果也是有所不同的。 |
8楼2012-04-13 09:38:17
2楼2012-04-11 16:50:53
3楼2012-04-11 16:57:55
4楼2012-04-12 08:26:10
5楼2012-04-12 09:33:09
6楼2012-04-12 16:07:38
7楼2012-04-13 09:19:25
9楼2012-04-13 14:34:08
10楼2012-04-13 17:34:53
11楼2012-04-16 09:18:26
12楼2012-04-16 09:56:13
13楼2012-04-16 15:48:05
14楼2012-04-16 15:54:43
15楼2012-04-16 19:52:12
16楼2012-04-17 08:12:51
17楼2015-06-18 10:49:52













回复此楼