24小时热门版块排行榜    

查看: 1364  |  回复: 15
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

蛇精病范

新虫 (初入文坛)

[求助] 为什么我要表达的eIF4GI基因序列是3920bp,但是只表达1305个氨基酸呢已有1人参与

急求急求,跪求跪求。。。。我要表达鸭子的eIF4GI做抗体,NCBI上发布的eIF4G的编码区有3920bp,但是只编码1305个氨基酸,编码区基因刚开始3位是起始密码子,最后三位是终止密码子,请问这是为什么呢,首先编码区基因序列根本不是3的倍数,其次正常的话是编码1305个氨基酸,余下2bp。为什么呢?
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ptttmt

银虫 (正式写手)

【答案】应助回帖

★ ★ ★ ★ ★
蛇精病范: 金币+5 2015-08-26 15:59:44
EIF4G1 eukaryotic translation initiation factor 4 gamma, 1 [ Anas platyrhynchos (mallard) ]

Gene ID: 101791993, updated on 11-Jul-2015

http://www.ncbi.nlm.nih.gov/gene/?term=101791993

mRNA序列:3918bp,N表示A/T/C/G四种碱基的其中一种

http://www.ncbi.nlm.nih.gov/nuccore/XM_013102310.1

蛋白序列:1305aa  X表示未知氨基酸或终止密码子

http://www.ncbi.nlm.nih.gov/protein/XP_012957764.1

这个序列是基因枪测序的数据,这个EIF4G1蛋白是由软件预测,product="LOW QUALITY PROTEIN: eukaryotic translation initiation factor 4 gamma 1",注意前面这个LOW QUALITY PROTEIN,说明这个基因的数据不太准确

具体到你做实验,可以先提RNA进行逆转录,获得绿头鸭的cDNA,根据已公布的mRNA序列的上下游设计引物,扩增出cDNA样本中的EIF4G1基因的开放阅读框,然后测通,获得全长,就知道了你实验标本绿头鸭EI4G1基因编码区的准确序列,然后根据实验需要,往下继续进行。


gene            1..3918
                     /gene="EIF4G1"
                     /note="The sequence of the model RefSeq transcript was
                     modified relative to its source genomic sequence to
                     represent the inferred CDS: deleted 2 bases in 1 codon;
                     Derived by automated computational analysis using gene
                     prediction method: Gnomon. Supporting evidence includes
                     similarity to: 1 Protein, and 93% coverage of the
                     annotated genomic feature by RNAseq alignments"
                     /db_xref="GeneID:101791993"
     CDS             1..3918
                     /gene="EIF4G1"
                     /note="The sequence of the model RefSeq protein was
                     modified relative to its source genomic sequence to
                     represent the inferred CDS: deleted 2 bases in 1 codon;
                     substituted 1 base at 1 genomic stop codon"
                     /codon_start=1
                     /transl_except=(pos:1030..1032,aa:OTHER)
                     /product="LOW QUALITY PROTEIN: eukaryotic translation
                     initiation factor 4 gamma 1"
                     /protein_id="XP_012957764.1"
                     /db_xref="GI:874481792"
                     /db_xref="GeneID:101791993"
8楼2015-08-26 10:19:26
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 16 个回答

ptttmt

银虫 (正式写手)

【答案】应助回帖

感谢参与,应助指数 +1
把序列号发上来才好帮你分析啊

[ 发自小木虫客户端 ]
2楼2015-08-25 04:46:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

蛇精病范

新虫 (初入文坛)

引用回帖:
2楼: Originally posted by ptttmt at 2015-08-25 04:46:25
把序列号发上来才好帮你分析啊

基因序列号是 NM_004677274.1
蛋白序列号是XP_012957764.1
谢谢!
3楼2015-08-25 09:53:40
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

蛇精病范

新虫 (初入文坛)

还有想请问一下NCBI发布的核苷酸序列中有一连串的NNNNNN是什么意思,氨基酸序列中有一连串的XXXXX是什么意思,我的基因和氨基酸中就含有这两串字母
4楼2015-08-25 10:36:03
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
信息提示
请填处理意见