24小时热门版块排行榜    

Znn3bq.jpeg
查看: 553  |  回复: 2

初出茅庐521

铜虫 (小有名气)

[求助] 如何处理基因注释文件

我现在下载了GI编号为NC_000853的基因注释信息,在注释信息里卖弄有很多是可以编码蛋白质的基因,我现在想把这些基因提取出来,如果一个一个地提取效率太低,想问下大家有什么比较高效的方法吗??
下面的红线加粗的字体就是可以编码蛋白质的基因所在序列的位置,这种片段特别多,不知道怎么编程可以快速地获取该genome中所有的gene ,求大神哈!!
   
LOCUS       NC_000853            1860725 bp    DNA     circular CON 22-DEC-2014
DEFINITION  Thermotoga maritima MSB8 chromosome, complete genome.
ACCESSION   NC_000853
VERSION     NC_000853.1  GI:15642775
DBLINK      BioProject: PRJNA57723
KEYWORDS    RefSeq.
SOURCE      Thermotoga maritima MSB8
  ORGANISM  Thermotoga maritima MSB8
            Bacteria; Thermotogae; Thermotogales; Thermotogaceae; Thermotoga.
REFERENCE   1  (bases 1 to 1860725)
  AUTHORS   Nelson,K.E., Clayton,R.A., Gill,S.R., Gwinn,M.L., Dodson,R.J.,
            Haft,D.H., Hickey,E.K., Peterson,J.D., Nelson,W.C., Ketchum,K.A.,
            McDonald,L., Utterback,T.R., Malek,J.A., Linher,K.D., Garrett,M.M.,
            Stewart,A.M., Cotton,M.D., Pratt,M.S., Phillips,C.A.,
            Richardson,D., Heidelberg,J., Sutton,G.G., Fleischmann,R.D.,
            White,O., Salzberg,S.L., Smith,H.O., Venter,J.C. and Fraser,C.M.
  TITLE     Evidence for lateral gene transfer between Archaea and bacteria
            from genome sequence of Thermotoga maritima
  JOURNAL   Nature 399 (6734), 323-329 (1999)
   PUBMED   10360571
REFERENCE   2  (bases 1 to 1860725)
  CONSRTM   NCBI Genome Project
  TITLE     Direct Submission
  JOURNAL   Submitted (18-SEP-2001) National Center for Biotechnology
            Information, NIH, Bethesda, MD 20894, USA
REFERENCE   3  (bases 1 to 1860725)
  AUTHORS   Nelson,K.E., Clayton,R.A., Gill,S.R., Gwinn,M.L., Dodson,R.J.,
            Haft,D.H., Hickey,E.K., Peterson,J.D., Nelson,W.C., Ketchum,K.A.,
            McDonald,L., Utterback,T.R., Malek,J.A., Linher,K.D., Garrett,M.M.,
            Stewart,A.M., Cotton,M.D., Pratt,M.S., Phillips,C.A.,
            Richardson,D., Heidelberg,J., Sutton,G.G., Fleischmann,R.D.,
            White,O., Salzberg,S.L., Smith,H.O., Venter,J.C. and Fraser,C.M.
  TITLE     Direct Submission
  JOURNAL   Submitted (01-JUN-1999) The Institute for Genomic Research, 9712
            Medical Center Dr, Rockville, MD 20850, USA
COMMENT     REVIEWED REFSEQ: This record has been curated by NCBI staff. The
            reference sequence was derived from AE000512.
            RefSeq Category: Reference Genome
                        TYS: Designated Type Strain
                        UPR: UniProt Genome
            COMPLETENESS: full length.
FEATURES             Location/Qualifiers
     source          1..1860725
                     /organism="Thermotoga maritima MSB8"
                     /mol_type="genomic DNA"
                     /strain="MSB8"
                     /db_xref="taxon:243274"
     gene            323..448
                     /locus_tag="TM0001"
                     /db_xref="GeneID:897248"
     CDS             323..448
                     /locus_tag="TM0001"
                     /note="similar to percent identity: 0.00; identified by
                     sequence similarity"
                     /codon_start=1
                     /transl_table=11
                     /product="hypothetical protein"
                     /protein_id="NP_227817.1"
                     /db_xref="GI:15642776"
                     /db_xref="GeneID:897248"
                     /translation="MVYGKEGYGRSKNILLSECVCGIISLELNGFQYFLRGMETL"
     gene            complement(483..608)
                     /locus_tag="TM0002"
                     /db_xref="GeneID:896810"
     CDS             complement(483..608)
                     /locus_tag="TM0002"
                     /note="similar to percent identity: 0.00; identified by
                     sequence similarity"
                     /codon_start=1
                     /transl_table=11
                     /product="hypothetical protein"
                     /protein_id="NP_227818.1"
                     /db_xref="GI:15642777"
                     /db_xref="GeneID:896810"
回复此楼

» 猜你喜欢

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

初出茅庐521

铜虫 (小有名气)

2楼2016-03-07 23:05:34
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

江天一览3215

新虫 (初入文坛)

可以告诉我是怎么看的吗?

发自小木虫Android客户端
3楼2016-10-29 11:56:22
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 初出茅庐521 的主题更新
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[基金申请] 2026山东省优青 +3 luckinging 2026-05-14 4/200 2026-05-19 16:15 by 52wls
[基金申请] 评审有感 +10 popular289 2026-05-18 16/800 2026-05-19 14:46 by popular289
[有机交流] 反应很差,大量原料没有反应 5+3 Mr.Zot 2026-05-19 3/150 2026-05-19 13:56 by xtlilibin
[论文投稿] Sci. Bull. 悲剧经验 +4 jyang1999 2026-05-16 4/200 2026-05-19 10:56 by maolC
[考博] 找博士生导师 +6 小代想上岸 2026-05-15 7/350 2026-05-19 10:22 by free_fisher
[考博] 26/27申博自荐-锂/钠电池方向 5+3 狗头军师. 2026-05-15 4/200 2026-05-19 09:10 by moonboat
[考博] 26/27博士推荐 +4 1木头人13949 2026-05-13 4/200 2026-05-19 08:29 by zhyzzh
[考博] 2026博士还有哪些学校有名额 +7 小王求读研 2026-05-15 8/400 2026-05-19 08:27 by zhyzzh
[考博] 云南大学材料与能源学院解琳课题组钙钛矿博士招生 +3 光伏爱好者 2026-05-17 4/200 2026-05-19 01:19 by 风起于浮萍
[基金申请] 国自然上会要求 +5 无名者登山 2026-05-18 9/450 2026-05-18 17:50 by BlakeReary
[基金申请] 今年审到国自然15份,谈谈感受 +16 国自然国社科中 2026-05-17 16/800 2026-05-18 14:58 by gy116024
[硕博家园] 考博自荐 +5 科研狗111 2026-05-13 6/300 2026-05-18 11:22 by 糊糊涂涂好
[基金申请] 青C资助名额大幅增加! +12 西葫芦炒鸡蛋 2026-05-13 16/800 2026-05-18 10:02 by Equinoxhua
[基金申请] 重磅!青年科学基金项目(C类)资助增幅预计超过50% +7 水和泥不是水泥 2026-05-13 10/500 2026-05-18 07:50 by 水和泥不是水泥
[文学芳草园] 半夜喝咖啡 +3 myrtle 2026-05-15 5/250 2026-05-18 01:03 by 小沈2018
[有机交流] 求助2,4-二氯-5-嘧啶甲醛的合成方法 20+3 光吃不拉 2026-05-14 6/300 2026-05-16 19:46 by Equinoxhua
[有机交流] 如何实现卤原子转化 +3 BT20230424 2026-05-15 5/250 2026-05-16 16:20 by czyzsu
[硕博家园] 申请博士 +3 呃?呃 2026-05-15 3/150 2026-05-16 11:01 by a4742549
[教师之家] 教学课件你会给同学吗 +8 硕士研究生吗 2026-05-13 8/400 2026-05-14 22:23 by 常规沥青
[考博] 26应届毕业生考博求助 +3 wo一定上岸 2026-05-13 3/150 2026-05-14 21:47 by 明海天涯
信息提示
请填处理意见