24小时热门版块排行榜    

CyRhmU.jpeg
查看: 2494  |  回复: 8

cgdsbsd

新虫 (初入文坛)

[求助] 叶绿体序列拼接已有1人参与

我现在有基因组数据、转录组数据,怎么提取出叶绿体基因,并且拼接成一个圆环啊?
我开始是想先用一个从NCBI上下载的一个相近物种的叶绿体基因做reference,然后用soap2把基因组序列mapping到reference上,筛选出可能是叶绿体的短read,用soapdenovo将这些read拼接成contig,然后用BWA mapping在reference上,看有多少gap  ,在gap两端设计引物做PCR,将gap补满,不知道这个思路对不对?
现在我得出的短read都是单序列,没有成对的,然后从头合成拼接的时候生成2500多条contig,而且最长的才300多bp,没有scafer生成,下一步不知道该怎么继续了,很茫然,请各位大牛帮忙,谢谢。。。
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

求知。。。
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mycaas

铁杆木虫 (正式写手)

【答案】应助回帖

感谢参与,应助指数 +1
gap可以先用软件补一补,不一定要用PCR
没有pair-end信息做scaffold确实挺困难
2楼2012-07-27 17:06:54
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xiaokoupu

银虫 (小有名气)

【答案】应助回帖

感谢参与,应助指数 +1
呵呵,我觉得是不是还可以确定些保守基因,然后利用这些基因通过相似性钓一些short reads,因为mappin的mismatch一般<2,用基因去钓取可以适当放宽些条件,然后把钓取的序列添加进去再拼接;没这么做过,如果lz有兴趣这么做,完了告诉我下效果怎么样啊,哈哈
3楼2012-07-28 21:53:02
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

cgdsbsd

新虫 (初入文坛)

引用回帖:
2楼: Originally posted by mycaas at 2012-07-27 17:06:54
gap可以先用软件补一补,不一定要用PCR
没有pair-end信息做scaffold确实挺困难

xie  xie   
求知。。。
4楼2012-07-30 10:07:29
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

cgdsbsd

新虫 (初入文坛)

引用回帖:
3楼: Originally posted by xiaokoupu at 2012-07-28 21:53:02
呵呵,我觉得是不是还可以确定些保守基因,然后利用这些基因通过相似性钓一些short reads,因为mappin的mismatch一般<2,用基因去钓取可以适当放宽些条件,然后把钓取的序列添加进去再拼接;没这么做过,如果lz有 ...

怎么确定保守基因?hai   you  soapdenovo    de   config_file   zen   me   she   zhi   can  shu   a   ?   xie   xie  zhi   jiao  ...
求知。。。
5楼2012-07-30 11:19:51
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

tw7649116

木虫 (小有名气)

【答案】应助回帖

目前我也在做水稻叶绿体基因组组装,原始数据如下是水稻基因组重测序数据(rawdata.fastq.gz),根据相关文献已经进行了以下分析:
利用bwa得到mapping到reference的.bam文件
利用samtools从bam文件提取mapped reads.bam(20M左右)
利用soapdenovo或者velvet进行组装获得了scaffold序列,但是只有100k不到,而水稻叶绿体基因组大约130多k
下面就不知道怎么做了,也不知道前面的步骤对不对!

楼主问题解决了吗?是怎么做的呢?
6楼2014-04-28 18:50:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

nn219

新虫 (初入文坛)

我们是先把原始数据做一个质控,然后用SOAPdenovo或CLC软件拼接成contig或scafford,然后找参考序列,挑出叶绿体序列,再手动拼接,gap一般可以用不同的拼接软件试下看能不能补齐。

另外,楼主可以告诉我SOAPdenovo的具体操作么
7楼2015-01-13 10:28:44
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

赖苏亮

新虫 (初入文坛)

引用回帖:
7楼: Originally posted by nn219 at 2015-01-13 10:28:44
我们是先把原始数据做一个质控,然后用SOAPdenovo或CLC软件拼接成contig或scafford,然后找参考序列,挑出叶绿体序列,再手动拼接,gap一般可以用不同的拼接软件试下看能不能补齐。

另外,楼主可以告诉我SOAPdeno ...

你好!
      我现在也在做叶绿体基因组拼接,我的思路跟你的很相似,请问如果先拼接然后再筛选出叶绿体序列,会不会由于软件的误差将核的跟线粒体的序列也拼进去,而导致拼接错误?
      我看许多文献都是先用一个近缘物种的叶绿体基因组作为reference筛选叶绿体reads,然后再拼接的。
8楼2016-06-05 17:13:48
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

筱杨i

新虫 (初入文坛)

引用回帖:
8楼: Originally posted by 赖苏亮 at 2016-06-05 17:13:48
你好!
      我现在也在做叶绿体基因组拼接,我的思路跟你的很相似,请问如果先拼接然后再筛选出叶绿体序列,会不会由于软件的误差将核的跟线粒体的序列也拼进去,而导致拼接错误?
      我看许多文献都是先用 ...

能请问一下是怎么筛选的叶绿体基因组么

发自小木虫Android客户端
9楼2019-03-05 16:23:49
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 cgdsbsd 的主题更新
信息提示
请填处理意见