24小时热门版块排行榜    

查看: 2528  |  回复: 5

lenalee119

铜虫 (初入文坛)

[求助] 【跪求指教!】NCBI提交编码蛋白的基因序列出现ERROR(有终止密码子) 已有1人参与

各位大侠各位老师!!!
第一次提交基因序列,
序列来源为:环境中的原核生物 (对其的一种 functional gene 序列用特定引物扩增而成,理论应为编码蛋白序列,非16S序列),
结果,
五百多条序列中有一百多条出现error。
系统说是由于 Stop codon '*' is found in the range. 序列中间出现了终止密码子导致无法编码氨基酸序列。

请问:
1. 这种序列中间出现终止密码子的情况是否可以自行分析剔除后上传?
2. 如果把这一百多条序列以非编码基因上传(不附加CDS特征信息),那么这一百多条序列是否与另外登陆成功的400条有CDS特征信息的序列进行比较并建成一棵系统树?(这一百多条序列与成功的四百条序列在样本来源和操作手法上并没有差异性)
3.编码蛋白的序列中间出现密码子,是否能够代表了测序时的不准确?又或者,有没有可能性是: 这个基因本身多样性较高,从而在一些样本中的一些位点出现了突变?
4.如果这一百多条“error”序列是代表了测序的偏差或引物二聚体,是否应该干脆把这一百多条序列删除?

对这个error的处理方法感觉非常难以把握,苦恼多时所以在此诚心求助!
实验室也没有提交编码序列的先例,恳请各位路过的大侠指导一二,真的不胜感激!
有提交过functional gene 序列而非16S序列的前辈烦请多多分享经验!先谢过大家!!!!!!!!!
回复此楼
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

lenalee119

铜虫 (初入文坛)

自己顶一下,劳烦各位多多指点!
2楼2015-08-14 15:52:35
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

stone2239

铁杆木虫 (著名写手)

【答案】应助回帖

感谢参与,应助指数 +1
一种基因,怎么测了五百多条?
3楼2015-08-14 17:41:48
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

lenalee119

铜虫 (初入文坛)

引用回帖:
3楼: Originally posted by stone2239 at 2015-08-14 17:41:48
一种基因,怎么测了五百多条?

因为不是纯的菌种,是环境样本。

[ 发自小木虫客户端 ]
4楼2015-08-15 00:18:17
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

Fleaves

至尊木虫 (著名写手)

动不动就跪求,男儿膝下有黄金不知道么?
5楼2015-08-16 11:46:05
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

lenalee119

铜虫 (初入文坛)

问题已解决。
这种情况不需添加CDS特征,而以 misc_feature特征进行登陆即可。
不需要对序列进行修饰,登陆后的非CDS序列仍可与其他序列共同建树。
6楼2015-09-16 14:00:45
已阅   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 lenalee119 的主题更新
信息提示
请填处理意见