24小时热门版块排行榜    

查看: 3115  |  回复: 1

初出茅庐521

铜虫 (小有名气)

[交流] 如何处理基因注释文件 已有1人参与

我现在下载了GI编号为NC_000853的基因注释信息,在注释信息里卖弄有很多是可以编码蛋白质的基因,我现在想把这些基因提取出来,如果一个一个地提取效率太低,想问下大家有什么比较高效的方法吗??
下面的红线加粗的字体就是可以编码蛋白质的基因所在序列的位置,这种片段特别多,不知道怎么编程可以快速地获取该genome中所有的gene ,求大神哈!!
   
LOCUS       NC_000853            1860725 bp    DNA     circular CON 22-DEC-2014
DEFINITION  Thermotoga maritima MSB8 chromosome, complete genome.
ACCESSION   NC_000853
VERSION     NC_000853.1  GI:15642775
DBLINK      BioProject: PRJNA57723
KEYWORDS    RefSeq.
SOURCE      Thermotoga maritima MSB8
  ORGANISM  Thermotoga maritima MSB8
            Bacteria; Thermotogae; Thermotogales; Thermotogaceae; Thermotoga.
REFERENCE   1  (bases 1 to 1860725)
  AUTHORS   Nelson,K.E., Clayton,R.A., Gill,S.R., Gwinn,M.L., Dodson,R.J.,
            Haft,D.H., Hickey,E.K., Peterson,J.D., Nelson,W.C., Ketchum,K.A.,
            McDonald,L., Utterback,T.R., Malek,J.A., Linher,K.D., Garrett,M.M.,
            Stewart,A.M., Cotton,M.D., Pratt,M.S., Phillips,C.A.,
            Richardson,D., Heidelberg,J., Sutton,G.G., Fleischmann,R.D.,
            White,O., Salzberg,S.L., Smith,H.O., Venter,J.C. and Fraser,C.M.
  TITLE     Evidence for lateral gene transfer between Archaea and bacteria
            from genome sequence of Thermotoga maritima
  JOURNAL   Nature 399 (6734), 323-329 (1999)
   PUBMED   10360571
REFERENCE   2  (bases 1 to 1860725)
  CONSRTM   NCBI Genome Project
  TITLE     Direct Submission
  JOURNAL   Submitted (18-SEP-2001) National Center for Biotechnology
            Information, NIH, Bethesda, MD 20894, USA
REFERENCE   3  (bases 1 to 1860725)
  AUTHORS   Nelson,K.E., Clayton,R.A., Gill,S.R., Gwinn,M.L., Dodson,R.J.,
            Haft,D.H., Hickey,E.K., Peterson,J.D., Nelson,W.C., Ketchum,K.A.,
            McDonald,L., Utterback,T.R., Malek,J.A., Linher,K.D., Garrett,M.M.,
            Stewart,A.M., Cotton,M.D., Pratt,M.S., Phillips,C.A.,
            Richardson,D., Heidelberg,J., Sutton,G.G., Fleischmann,R.D.,
            White,O., Salzberg,S.L., Smith,H.O., Venter,J.C. and Fraser,C.M.
  TITLE     Direct Submission
  JOURNAL   Submitted (01-JUN-1999) The Institute for Genomic Research, 9712
            Medical Center Dr, Rockville, MD 20850, USA
COMMENT     REVIEWED REFSEQ: This record has been curated by NCBI staff. The
            reference sequence was derived from AE000512.
            RefSeq Category: Reference Genome
                        TYS: Designated Type Strain
                        UPR: UniProt Genome
            COMPLETENESS: full length.
FEATURES             Location/Qualifiers
     source          1..1860725
                     /organism="Thermotoga maritima MSB8"
                     /mol_type="genomic DNA"
                     /strain="MSB8"
                     /db_xref="taxon:243274"
     gene            323..448
                     /locus_tag="TM0001"
                     /db_xref="GeneID:897248"
     CDS             323..448
                     /locus_tag="TM0001"
                     /note="similar to percent identity: 0.00; identified by
                     sequence similarity"
                     /codon_start=1
                     /transl_table=11
                     /product="hypothetical protein"
                     /protein_id="NP_227817.1"
                     /db_xref="GI:15642776"
                     /db_xref="GeneID:897248"
                     /translation="MVYGKEGYGRSKNILLSECVCGIISLELNGFQYFLRGMETL"
     gene            complement(483..608)
                     /locus_tag="TM0002"
                     /db_xref="GeneID:896810"
     CDS             complement(483..608)
                     /locus_tag="TM0002"
                     /note="similar to percent identity: 0.00; identified by
                     sequence similarity"
                     /codon_start=1
                     /transl_table=11
                     /product="hypothetical protein"
                     /protein_id="NP_227818.1"
                     /db_xref="GI:15642777"
                     /db_xref="GeneID:896810"
回复此楼

» 猜你喜欢

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yuan24209

新虫 (小有名气)


小木虫: 金币+0.5, 给个红包,谢谢回帖
用phylosuite一键extraction

发自小木虫IOS客户端
2楼2020-10-10 17:32:03
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 初出茅庐521 的主题更新
普通表情 高级回复 (可上传附件)
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[考研] 0854电子信息求调剂 +3 α____ 2026-03-22 3/150 2026-03-22 21:28 by zhq0425
[考研] 263求调剂 +4 yqdszhdap- 2026-03-22 4/200 2026-03-22 21:20 by 1144970272
[考研] 一志愿西安交通大学材料工程专业 282分求调剂 +11 枫桥ZL 2026-03-18 13/650 2026-03-22 20:26 by edmund7
[考研] 环境学硕288求调剂 +6 皮皮皮123456 2026-03-22 6/300 2026-03-22 16:52 by i_cooler
[考研] 324求调剂 +6 lucky呀呀呀鸭 2026-03-20 6/300 2026-03-22 16:01 by ColorlessPI
[考研] 280求调剂 +11 咕噜晓晓 2026-03-18 12/600 2026-03-21 22:40 by ACS Nano——
[考研] 0805 316求调剂 +3 大雪深藏 2026-03-18 3/150 2026-03-21 18:55 by 学员8dgXkO
[考研] 求调剂 +3 13341 2026-03-20 3/150 2026-03-21 18:28 by 学员8dgXkO
[考研] 336求调剂 +5 rmc8866 2026-03-21 5/250 2026-03-21 17:24 by 学员8dgXkO
[考研] 299求调剂 +5 shxchem 2026-03-20 7/350 2026-03-21 17:09 by ColorlessPI
[基金申请] 学校已经提交到NSFC,还能修改吗? 40+4 babangida 2026-03-19 9/450 2026-03-21 16:12 by babangida
[考研] 085700资源与环境308求调剂 +12 墨墨漠 2026-03-18 13/650 2026-03-21 01:42 by JourneyLucky
[考研] 一志愿西南交大,求调剂 +5 材化逐梦人 2026-03-18 5/250 2026-03-21 00:26 by JourneyLucky
[考研] 330求调剂 +4 小材化本科 2026-03-18 4/200 2026-03-20 23:13 by JourneyLucky
[考研] 350求调剂 +5 weudhdk 2026-03-19 5/250 2026-03-20 22:04 by luoyongfeng
[考研] 一志愿西安交通大学 学硕 354求调剂211或者双一流 +3 我想要读研究生 2026-03-20 3/150 2026-03-20 20:13 by JourneyLucky
[考研] 工科材料085601 279求调剂 +7 困于星晨 2026-03-17 9/450 2026-03-20 17:38 by 无懈可击111
[考研] 08工学调剂 +5 用户573181 2026-03-20 5/250 2026-03-20 15:47 by xia_2003
[考研] 材料学硕318求调剂 +5 February_Feb 2026-03-19 5/250 2026-03-19 23:51 by 23Postgrad
[考研] 生物学调剂招人!!! +3 山海天岚 2026-03-17 4/200 2026-03-19 21:34 by 怎么释怀
信息提示
请填处理意见