24小时热门版块排行榜    

CyRhmU.jpeg
查看: 1705  |  回复: 13
本帖产生 1 个 BioEPI ,点击这里进行查看

erlei

木虫 (正式写手)

[求助] 求助有关生物信息学的

本人刚接触生物信息学软件,现在老师让我从线粒体基因组全序列中将所有单个的编码基因析出,一个一个的析出太慢了,时间不够,老师自己对这块不懂,让我自己弄,我没学过,希望有人可以指点帮忙
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
回帖置顶 ( 共有1个 )

genomelin

银虫 (小有名气)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
wizardfan: 金币+10, BioEPI+1, 感谢热心的回答 2013-04-24 06:31:58
GO to "http://www.ncbi.nlm.nih.gov/genomes/OrganelleResource.cgi?opt=organelle&taxid=6544"
click "Download"-> "download the list of accessions"-> fileA
GO to "http://www.ncbi.nlm.nih.gov/sites/batchentrez"
upload the fileA and got the all GBk webpage
click "send to" to save file with "Genebank full " -> file B

install perl and bioperl package
run "perl GetCds.pl fileB FileYouWanted"

GetCds.pl :

#!/usr/bin/perl
use Bio::SeqFeatureI;
use Bio:erl;
use Bio::Seq;

my %species;
@seq=read_all_sequences("$ARGV[0]",'genbank');
$flag=1;
foreach $seqobj (@seq) {
        @features=$seqobj->get_SeqFeatures();
        foreach $feat (@features) {
                if($feat->primary_tag eq 'CDS'){
                        print "$feat\n";
                        @name=$feat->get_tag_values('gene');
                        $name=join "",@name;
                        open OUT,">>$ARGV[1]";
                        print OUT '>'.$seqobj->desc().$name."\n";
                        print OUT $feat->seq->seq()."\n";
                        close OUT;
                }
        }
}
4楼2013-04-23 07:06:38
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
回帖支持 ( 显示支持度最高的前 50 名 )

erlei

木虫 (正式写手)

现在GB文件已经有了,程序该怎么改,这是其中一个,向这种的文件有将近100个

LOCUS       AB055624               16967 bp    DNA     linear   INV 21-DEC-2012
DEFINITION  Unio japanensis mitochondrial DNA, COIII to CO1 region,
            haplotype:male type.
ACCESSION   AB055624
VERSION     AB055624.1  GI:15128581
KEYWORDS    .
SOURCE      mitochondrion Unio japanensis
  ORGANISM  Unio japanensis
            Eukaryota; Metazoa; Lophotrochozoa; Mollusca; Bivalvia;
            Palaeoheterodonta; Unionoida; Unionoidea; Unionidae; Unioninae;
            Unio.
REFERENCE   1
  AUTHORS   Okazaki,M. and Ueshima,R.
  TITLE     Evolutionary diversity between the gender-associate mitochondrial
            DNA genomes of freshwater mussels
  JOURNAL   Unpublished
REFERENCE   2  (bases 1 to 16967)
  AUTHORS   Okazaki,M.
  TITLE     Direct Submission
  JOURNAL   Submitted (07-FEB-2001) Contact:Masahiro Okazaki University of
            Tokyo, Biological Sciences; hongo 7-3-1, Bunkyo-ku, Tokyo 113-0033,
            Japan
FEATURES             Location/Qualifiers
     source          1..16967
                     /organism="Unio japanensis"
                     /organelle="mitochondrion"
                     /mol_type="genomic DNA"
                     /db_xref="taxon:1260922"
                     /haplotype="male type"
                     /sex="male"
                     /tissue_type="spermatozoon"
                     /note="germ line;
                     synonym: Inversidens japanensis"
     gene            <1..789
                     /gene="COIII"
     CDS             <1..789
                     /gene="COIII"
                     /codon_start=1
                     /transl_table=5
                     /product="cytochrome c oxidase subunit III"
                     /protein_id="BAB62758.1"
                     /db_xref="GI:15128582"
                     /translation="VKLKEIRSPFHLVEMSPWPLFSSVSAVCLVVGFVSWLSGGSLCL
                     LFLGVGLVSAVLFQWWRDIIRESNQGWHTSYVASNVRLGMVLFIVSEVFFFFGFFWAF
                     FSCSLVPGVEVGSVWPPVGIVPLNPFGLPLLNTAVLLGSGVSVTWAHHAVLAGDRKEA
                     MIGLVFTIMMGLYFTFLQACEYVECSFSIADSVYGSLFYVMTGFHGVHVVMGTLILSV
                     GFFRCFGFGFSSERHLGLELGIWYWHFVDVVWICLFLCVYWWGG"
     gene            803..1465
                     /gene="ATP6"
     CDS             803..1465
                     /gene="ATP6"
                     /codon_start=1
                     /transl_table=5
                     /product="ATPase complex subunit 6"
                     /protein_id="BAB62759.1"
                     /db_xref="GI:15128583"
                     /translation="MLTDIFSSLDFYYVNESRSYFISWLSYFGFVVGGLAVYPQKGGF
                     WVGGSWFLRVVHSLMGVVFQIVVDCKGYRFGGFSLGCVGGFWMLVLLNFGGMVPGSAS
                     LTSQLSVGLSLALLWWSWSTLSGCFYSWKSFLGHLLPLGTPVVLCPLMILIESVSVLI
                     RPVTLAVRLVANITMGHLVLSLMGDNLIGGGSVIVGAYGVVWVLCLRFAGLCVYFVGE
                     FV"
     tRNA            complement(1759..1824)
                     /product="tRNA-Asp"
     gene            2189..2497
                     /gene="ND4L"
     CDS             2189..2497
                     /gene="ND4L"
                     /codon_start=1
                     /transl_table=5
                     /product="NADH dehydrogenase complex 4L"
                     /protein_id="BAB62760.1"
                     /db_xref="GI:15128584"
                     /translation="MSVGLGYNQSAVCVVLVVLAISCIMFQRHSLLMVLLGFEVFSLV
                     LFSCFISVFGVMQTPVGLSLVFLCLEVCVMSVCLALMVKLVSCVGSDYVGVASLGSDF
                     "
     gene            2490..3851
                     /gene="ND4"
     CDS             2490..3851
                     /gene="ND4"
                     /codon_start=1
                     /transl_table=5
                     /product="NADH dehydrogenase complex 4"
                     /protein_id="BAB62761.1"
                     /db_xref="GI:15128585"
                     /translation="MFSVVLSIWLALLASWLCGQLSWWVVTWVCQLSVLAIILGGFMG
                     VGVPNCNLGGEFCCDEVSCGFIWLSAFIASLSLVSSGDILASKDSSSVFLVAVVSLCL
                     VLCVCFATDSLFVFYVLFESSLIPTLFIICGWGYQPERLRAGKYLVLYMVSASLPLLG
                     FILYTAFVWGSDSFALLCVVRGVLSSSPGLFLVVTLAFLVKSPMYGVHMWLPKAHVEA
                     PVAGSMFLAGILLKLGGYGLVRFMGVLNLVGVMYSLVVCLCVFGGVVASVVCCVQTDA
                     KSLVAYSSVGHMGLALGGLMSGGYWGLGGGYLLMVAHGLTSCGMFYLVGELYKSYSSR
                     MLFVIRGGVGNLFGINLWLAFMCGFNAAAPPSLSLCSEVILCISLISYSLWFSVLVGA
                     LGFLSCLYSWSFYCNTQTGCYPAWARAFHSTSYSYNQSLVCVSIVFPLVGLSLCCEYG
                     KFF"
     gene            complement(3848..4375)
                     /gene="ND6"
     CDS             complement(3848..4375)
                     /gene="ND6"
                     /codon_start=1
                     /transl_table=5
                     /product="NADH dehydrogenase complex 6"
                     /protein_id="BAB62762.1"
                     /db_xref="GI:15128586"
                     /translation="MTLMIFLSMSITLLCSSVFSAHPLVLTVKVLLLATTISLTLAHI
                     TTWYAYMLYMVMVGGMLVMFTYISSLSPNGIFQLKPQLAHLATTLIPGFLLAHSTSST
                     PSTLNTQDHHNTPENFICFFLENGNEKLLLTSATILLLALLMSMTLLPRTKAPMRPTI
                     FYSSHMMHSNMLCNY"
     tRNA            complement(4377..4443)
                     /product="tRNA-Gly"
     gene            complement(4448..5326)
                     /gene="ND1"
     CDS             complement(4448..5326)
                     /gene="ND1"
                     /codon_start=1
                     /transl_table=5
                     /product="NADH dehydrogenase complex 1"
                     /protein_id="BAB62763.1"
                     /db_xref="GI:15128587"
                     /translation="MAATVVVALVGMAFLTLLERKSLGYMQLRKGPNKLGLTGLPQPL
                     ADAMKLLTKTTSTPTICNPIAMSVAPLLALALSALLWHLYPTTHSVSHKSLGLLLFIC
                     ISATAVYSIMVGGWSTNSKFALLGAMRAMAQTISYEIPMILTLIFYGLISNTLDLSAF
                     CENLSLKFKGLLIIPMTLVWLTIMLAETNRAPFDFAEGESELVSGFNVEYSGTKFAML
                     FMAEYLNILFMGLLSSILLLNSTSWAPLFTFFFLLARGTLPRHRYDLMMGMAWESLIP
                     ITLTFLLLASPALLMP"
     tRNA            complement(5360..5423)
                     /product="tRNA-Leu"
     tRNA            5426..5488
                     /product="tRNA-Val"
     tRNA            complement(5494..5559)
                     /product="tRNA-Ile"
     tRNA            complement(5566..5634)
                     /product="tRNA-Cys"
     tRNA            complement(5634..5702)
                     /product="tRNA-Gln"
     gene            6479..8245
                     /gene="ND5"
     CDS             6479..8245
                     /gene="ND5"
                     /codon_start=1
                     /transl_table=5
                     /product="NADH dehydrogenase complex 5"
                     /protein_id="BAB62764.1"
                     /db_xref="GI:15128588"
                     /translation="MKLSGKSASAKSDSCTPLVWASTFLLSCFVLWFIWFGGVISTAV
                     VLEWEFFSACGFSLSVLLLLDFLGALFSFVVCLISGCVFIFSVSYMSGDKFHSLFYSL
                     VAAFVAAMNILILIPNLVFVLLGWDLLGIISFLLVVYYQNSVSVGAGMLTVLMNRIGD
                     VFLVLAIGFSSSAGIWGILEVEQLAGQVVWVGVLLVGAGMTKSAQIPFSVWLPAAMAA
                     PTPVSALVYSSTLVTVGVYFLFRHYHVLMCVNGLLPLLSKVGCLTLLMASLGACLELD
                     IKKLVALSTLSHLGFMVYVLGVGYPVLSVFHLLSHALFKSLLFLCAGHYMHEVGCSQD
                     IRQMSGVGWGSSPLVMACIIIGLNSLCGVPYLSGFYSKDAILEGSMTSFVGALEILCL
                     VVGAGASCLHAMRLLLYSIFGPLGGLPLVGESGVSGFVAFPVLLLALGSICFSYVMQQ
                     AWAEASLSFSLSFLAKVGLFLALNLGVVILATSVLGFGYSGGSLYGGFSSRLMAVKLF
                     LSSMWFFRWWSFAVPGVWFSCGSLTVSAMEMGWMEVIGGRGVGGSFVGLGSKLWVMEG
                     ISVLNMLRLAGGVLLVLGVHYF"
     tRNA            complement(8280..8347)
                     /product="tRNA-Phe"
     gene            complement(8377..9528)
                     /gene="cytb"
     CDS             complement(8377..9528)
                     /gene="cytb"
                     /codon_start=1
                     /transl_table=5
                     /product="cytochrome b"
                     /protein_id="BAB62765.1"
                     /db_xref="GI:15128589"
                     /translation="MQKPTRKSNSMLNIMNSSVYDLPAPMNLSTLWNTGSLLGLCLVI
                     QILSGIFLAIHYTPDTNYAFSSVVHIVRDVNFGWMLRNMHATGASLFFLLAYVHIGRG
                     IYFSSYLFTKMWLSGVVLLFTLMATAFLGYVLPWGQMSYWGAPVITNLLSVIPHFGDL
                     LVTWIWGGFTVANGNTKPILCVPLSPSIHNPSYCMHPPHASTRKRLNNPLGLSSNTSL
                     IPFHPFYTLKDLVGFLVFTASLMAVCMFSPLLISDPENFVPANPLSTPTHIQPEWYFL
                     FAYAILRAIPSKMGGVLALASSILVLLMMPLTHLNTMRGMTFYPASQPLFWALAASFF
                     VLTWLGHMPTEPPLILMSQLVTALYFSLMLSLPASGAPWDKLIFTHLNK"
     tRNA            complement(9529..9592)
                     /product="tRNA-Pro"
     tRNA            complement(9592..9658)
                     /product="tRNA-Asn"
     tRNA            complement(9682..9747)
                     /product="tRNA-Leu"
     rRNA            complement(9748..11081)
                     /product="16S ribosomal RNA"
     tRNA            complement(11082..11144)
                     /product="tRNA-Tyr"
     tRNA            complement(11149..11213)
                     /product="tRNA-Thr"
     tRNA            complement(11216..11283)
                     /product="tRNA-Lys"
     rRNA            complement(11283..12149)
                     /product="12S ribosomal RNA"
     tRNA            12150..12219
                     /product="tRNA-Arg"
     tRNA            complement(12224..12288)
                     /product="tRNA-Trp"
     tRNA            complement(12291..12354)
                     /product="tRNA-Met"
     gene            complement(12340..13335)
                     /gene="ND2"
     CDS             complement(12340..13335)
                     /gene="ND2"
                     /codon_start=1
                     /transl_table=5
                     /product="NADH dehydrogenase complex 2"
                     /protein_id="BAB62766.1"
                     /db_xref="GI:15128590"
                     /translation="MTPLFVLLLLTSTLLTISSTNAMFMWMMLELNMLAFIPLTQTHN
                     STTETEASIKYLIPQSFGSSLFMASVLLMPMTQHSNTLTTTALILKLGGVPLHSWFPA
                     VMQSINPTTALILSTWQKAGPLLLLTIPHLAHTPIIISSSVMSALWGSTAGLNQTNLL
                     KLMAFSSINHLGWLLMASLFNSLIPTIYLLAYSLTALPIFMYMKTPKIKTYVTTLTPP
                     LNNYAQLTMVINMLSLAGMPPLSMFISKIPIIALMTQKLLLPLGLLLVSTAVSLYFYL
                     SLSIMMTLNLNSSLQPTNEKGFQIMPIIAFTASTLFQFFHTTLMIXSICSMGKMS"
     tRNA            complement(13345..13413)
                     /product="tRNA-Glu"
     tRNA            complement(13443..13508)
                     /product="tRNA-Ser"
     tRNA            complement(13515..13580)
                     /product="tRNA-Ser"
     tRNA            complement(13586..13655)
                     /product="tRNA-Ala"
     gene            13747..14106
                     /gene="ND3"
     CDS             13747..14106
                     /gene="ND3"
                     /codon_start=1
                     /transl_table=5
                     /product="NADH dehydrogenase complex 3"
                     /protein_id="BAB62767.1"
                     /db_xref="GI:15128591"
                     /translation="MKMVIACGVFSVLVSVAMMGLGWVLSGRYLWGVRELSSPFECGF
                     DPVGSSRVGFSLRFFGLMILFIVFDFETVLLLPFVFWSGMGLDKGLGVVEFVGFLVIL
                     LVGVVYEMKEGALEWGF"
     gene            14142..14991
                     /gene="CO2"
     CDS             14142..14991
                     /gene="CO2"
                     /note="TAA stop codon is completed by addition of 3' A
                     residues to the mRNA"
                     /codon_start=1
                     /transl_except=(pos:14991,aa:TERM)
                     /transl_table=5
                     /product="cytochrome c oxdase subunit 2"
                     /protein_id="BAB62768.1"
                     /db_xref="GI:15128592"
                     /translation="MSRWSQLGLQEGTSVLGVEVHGLYDYSMFIIVLVFSFVAYLMLK
                     SLCHKVTGRVYVDSQWLEVLWTVMPFWLLLALGLPSIKLLYLMDEINLPEATVKVVGH
                     QWYWSYEYSDVRGSSYSYDSYLIPDSAMEEGYRLLEVDNRCVVPTLLTIRGLVTSDDV
                     IHSWAIPSSAIKVDGVPGRINQVSLCFINSGVFYGQCSELCGVNHSFMPICVESVSVE
                     VYSSWIVDNHNNVLKEMGGRPESWTWWGLLVAVVSGIGKGLYWLGSMYGMFLYYLFYY
                     SFYVPGK"
     tRNA            14992..15055
                     /product="tRNA-His"
     gene            15371..>16967
                     /gene="CO1"
     CDS             15371..>16967
                     /gene="CO1"
                     /codon_start=1
                     /transl_table=5
                     /product="cytochrome c oxidase subunit 1"
                     /protein_id="BAB62769.1"
                     /db_xref="GI:15128593"
                     /translation="MYCCLRWLFSTNHKDIGSLYLMSALWWGLVGLSLSVVIRAELGH
                     PGGLMHNDQLYYSVVTAHAFVMIFFVVMPAMMGGIGNWLVPIMLGCPDMAFPRLNNVS
                     FWLLAGAGFLLGWSMFVEGGCGTGWTIYPPLSSSAFHSGVSVDILIFSLHLAGLSSIL
                     GSLNFITTILGMRSDILRAERMTLLVWSVLCTAGLIVASFPVLAGAITMLLTDRNFNT
                     SFFDPSGGGDPILFMHLFWFFGHPEVYIIIIPAFGVVSHVILYFSAKKVVFGQLGMIF
                     AIMGIGAMGFVVWGHHMFTVGLDVDTRAYFTGATMVIAIPTGIKVFSWLSTMIGSAMP
                     FWPAFLWSLGFVFLFTLGGLTGVILSHSSLDVVLHDTYYVTAHFHYVLSMGARVWLVF
                     WVLLLMSGYVWGDSTPRWLKVQFYLLFLGVNLTFFPQHFLGLAGMPRRCSDYAGVYYP
                     WNAVSSWGSILSVVSVFWFLCCVLESLVSCRSVVYGGALSVSIEWCENLFPVAFHSYS
                     QVAMGVSAEACLMESGVCGVGTSE"
ORIGIN      
        1 gtgaagttaa aagaaattcg taggccgttt catctggttg agataagtcc gtggccactt
       61 ttttcctctg tgagggctgt ttgtcttgtt gtgggttttg taagttggct gagtggtggt
      121 tctttgtgcc tcttgttttt gggggttggg cttgtttcag cagttttgtt tcaatggtgg
      181 cgtgatatta tccgagagag aaaccaaggt tgacatacta ggtatgttgc tagtaatgtt
      241 cgtttaggga tggttttgtt tattgtgtca gaagttttct ttttttttgg gtttttttgg
      301 gcatttttta ggtgtaggtt ggtcccagga gttgaagtag ggagagtttg gccgcctgtc
      361 ggcattgtcc cgttgaaccc atttgggttg cctttattaa acacagctgt gttgttgggc
      421 tctggggtga gggtcacttg agcccaccat gctgtgttgg ctggggatcg gaaggaagcg
      481 atgattggat tggtttttac tattatgata gggttgtatt tcacattttt gcaggcttgt
      541 gagtatgtgg aatgctcttt ttctatcgcg gatagtgttt atgggtcttt attttatgta
      601 atgactgggt ttcacggggt acatgtagtt atggggaccc tgattttgtc tgtagggttt
      661 tttcgttgtt ttggttttgg gttttctagg gagcgacatt tggggttaga gcttggtatt
      721 tggtactggc actttgtgga tgttgtttgg atttgtttgt ttttgtgcgt gtattggtgg
      781 ggtggataac cctaaaagtt aaatgctgac agatattttt tcctctttgg atttttacta
      841 tgtaaatgaa agtcgtaggt attttatttc ttggttaagg tattttgggt ttgtggttgg
      901 agggctggct gtgtaccccc aaaagggggg gttttgggtg ggggggtctt ggtttttgcg
      961 ggttgttcat tctttaatgg gggtggtttt tcagattgtt gttgattgca agggttatcg
     1021 ttttggtggg tttaggttgg gctgtgttgg ggggttttga atgcttgtac tactaaactt
     1081 tggtggtatg gttcctggga gtgctagttt aactaggcag ctttctgttg gcttgtcgtt
     1141 ggctttattg tggtggtctt ggtctaccct aaggggttgt ttctatagtt gaaaaaggtt
     1201 tttggggcat ttattaccgt taggtacgcc tgttgtgttg tgtcctttaa taatcttaat
     1261 cgaaagggtt agggtattga ttcgtcctgt aactttggct gttcggttag ttgctaatat
     1321 cactatgggg catcttgttt taagcttgat gggggataat ttgattgggg gggggagggt
     1381 gattgtgggg gcttatggtg ttgtttgagt tctttgtttg cggtttgcag gcctatgtgt
     1441 ttactttgtt ggtgagtttg tatagggctg atcaccctag gtgttaaggg gggattaggg
     1501 ctatagctga ggggttaagc tttgaacggt ggaatgaaga ttgttggttc tttgaaaagc
     1561 ttgtgggtac cgctcaaatg cctcaattta gtccaatgtc ttgggttttt attggtttgt
     1621 ttttggtggg tgtactattg gttatttgtg ttggggtttg gtggggtggg tcaaatggtt
     1681 attctgttgt gcgtttgaaa gccggcggta gttgtgctcg tttgtttgtg tggggaaaat
     1741 ctttaggcgg taaagtttgg gaagttagtt tatagaaaaa catggggttg tcaaccccaa
     1801 aaggcttgag ttttgcgctt ccttgatgaa acgtaccctg gacatgtttg ttgaaattgt
     1861 agaagagata tacacggctt ctccgtgcgg tacggttttt gttttttttt tgtttttttt
     1921 gtatatattt gtgacaattt actctttgtg ggttggtcct gaagggcata agaaagttgt
     1981 cgataaaacg aaaaaggtag tgtggggtag tggtaaggca atgaaggagg cgagtgttaa
     2041 ggggaggaag agagttaaaa gtgcaaagaa gaaaaagcag gagggtgccg atgtaggggg
     2101 ggaggggttg ttgtcagatg ctgcggttcc ggtcaaaaag aaaaaggtga ctaagaaact
     2161 taaagagcaa ggaagtaagt aagttgtaat aagcgtcggt ttagggtata atcaaagtgc
     2221 ggtatgcgta gttttggttg tgctggctat ttcgtgtatt atgttccagc gtcataggct
     2281 tctaatagtt ttgttggggt ttgaggtttt taggcttgtt ttgttttctt gttttatcag
     2341 ggtttttggt gttatacaaa cgccagtggg gcttagtttg gtttttttgt gtttggaggt
     2401 ttgcgtaatg tccgtgtgtt tagcattaat ggttaagctt gtgaggtgtg tcgggagtga
     2461 ttacgtgggg gtggcttctc ttgggagtga tttttagtgt ggttcttagg atttgacttg
     2521 ccttattagc tagttgattg tgtgggcaat taaggtggtg ggtagtcact tgagtttgtc
     2581 agttaagtgt gcttgcaatt attcttgggg ggtttatggg ggttggggtt cccaattgta
     2641 atcttggagg tgagttttgt tgtgatgaag tttcttgtgg gtttatctgg ttgtctgcgt
     2701 ttattgctag tctgaggctg gtaagaagtg gggatatctt ggctagaaaa gatagtagca
     2761 gtgtgttttt ggttgctgtt gttagcttat gcttggttct gtgtgtttgt tttgctacgg
     2821 actctttatt tgtgttttat gtcttgttcg agtctaggct aatccctacc ctatttatta
     2881 tttgtggttg ggggtatcag ccagagcgcc tgcgagccgg taaatacttg gtgttgtata
     2941 tggttagggc gtctttaccc ttgctaggtt ttatccttta cacagctttt gtgtggggga
     3001 gtgataggtt tgctttgctt tgtgttgtgc ggggggtatt gtcatctagc cctgggttgt
     3061 ttttggtagt gactttagct tttttggtaa aatcccccat atacggtgta catatatggc
     3121 ttcctaaggc gcatgtagag gctccggttg ctggttctat atttttagct ggtattcttt
     3181 taaagttagg ggggtatggg ctggtgcgtt ttatgggggt cctaaatcta gttggtgtta
     3241 tgtatagact tgtggtttgc ttatgcgttt ttggtggtgt tgtggcaagt gtggtttgtt
     3301 gtgttcagac tgatgctaag agtttggtgg cttattcttc tgtggggcat atgggcttgg
     3361 cgttaggggg gttgatgtct ggtggctatt gggggttggg cggtggctat cttttaatag
     3421 ttgctcatgg cttgacttcg tgtggtatgt tttatctagt gggggaatta tacaagagct
     3481 atagttctcg catgttgttt gttattcgag ggggagttgg taatttgttt ggaattaatc
     3541 tgtggttggc ttttatgtgc ggatttaatg ctgctgctcc accgtctttg aggttgtgca
     3601 gggaggtaat tttgtgtatc tccttgatta gctactcttt gtggttttct gttttggtgg
     3661 gggctttagg gtttttatcg tgcttgtatt cgtggtcttt ttactgtaac acccagactg
     3721 ggtgttaccc tgcatgggca cgtgcatttc atagcaccag gtactcatac aaccaaaggt
     3781 tggtgtgtgt gtctattgtt tttcctttag tggggttgag tttatgctgc gagtatggta
     3841 aatttttcta gtaattacat agtatattcc tgtgtattat gtgggatgaa tagaaaatgg
     3901 ttggtcgtat tggggctttt gttcggggga gtaaagttat tgatataagt aaggctaata
     3961 aaagaattgt tgcggacgtt agtaagagtt tttcatttcc attctctaaa aagaagcaga
     4021 taaagttctc tggggtattg tggtgatctt gggtgttaag ggtgcttgga gttgagctgg
     4081 ttgagtgagc cagtaaaaag cctgggatta gggtcgtggc tagatgagct agttgtggtt
     4141 ttaattgaaa aattccgttg ggggatagcg acgagatata ggtaaatatc actagtattc
     4201 cccccactat gactatgtat agtatgtagg cgtatcatgt ggtgatatgg gcgagggtta
     4261 aggaaatagt agtagctaat agtagaactt tgacggttaa tactagtggg tgggcagaaa
     4321 agacactgct gcagagtaaa gtgatcctta tggacaaaaa aattattagt gttatgtata
     4381 ctgaccttca taggtctttc tgcttggaag gcagctgtac aggagtaggg atactatcag
     4441 tatcggttta gggtatcaag agggctgggc tagcaagtaa aaggaatgtc agagtgattg
     4501 ggataaggct ttctcaagct atgcccatta ttaggtcata tcggtggcgt gggagtgtgc
     4561 ctcgtgccag caaaaaaaag aaggtgaaga ggggtgctca gcttgttgag ttaagaagca
     4621 ggatacttga gagaagtcct ataaaaagaa tgtttaagta ctctgccatg aagagtatgg
     4681 caaattttgt accagagtac tccacattga acccagacac cagttctgac tccccttctg
     4741 cgaagtcaaa tggtgcgcgg tttgtttctg ctagtatgat tgttaatcaa accagggtta
     4801 ttgggatgat gagcagccct ttgaatttta gtcttaagtt ttcacaaaag gctcttaggt
     4861 ctaacgtatt tctgatgagt ccgtagaaga ttagggttag aattatcgga atttcataag
     4921 aaattgtctg ggctattgct cgtatagccc ctagaagtgc gaattttgaa ttggttcttc
     4981 atcccccgac tataatagag taaactgccg ttgctgagat gcagataaac aatagtaggc
     5041 ctaatctttt gtgtgacaca gagtgcgtag ttgggtatag gtgtcagagt aaagcggata
     5101 aggcgagggc tagtaatggt gctactgaca ttgcaattgg gttgcagatt gttggtgttg
     5161 atgtagtttt ggttagcagt tttatagcgt ctgctagagg ttgagggagg ccagtcaaac
     5221 caagtttatt ggggcctttt cgaagttgta tgtagccgag tgatttgcgc tctagcaagg
     5281 ttaagaacgc tattccgacc agtgctacaa ctacagtagc tgctattttg ggttgtggtg
     5341 tggggtcatt gtgacatgtg gagggagagt taagcctcat tgttaggtct taggcctaaa
     5401 gcattgtatt tctgccatcc ctcatgttag ggggccaaag ccagtttttt ggtgtaagca
     5461 agatatatta tgtgtatatt accctaatca ggtaagtgtc agaggaacta cctcatgttt
     5521 aacctcatca aagtaatccg ttcgtgccgg cgtgacactg aggggaggtc ctggccagaa
     5581 tggcttcggt aaagttgcag tttactatat tatgttactt tatactacag gacttgtggg
     5641 cggagctgtt gacttcctct ttgtaactca aatttacatg tgcgtagtaa cactagctca
     5701 cagtgcatga tcttctgacc aagtctagta agttagttta caaatatttg tgtaatcttt
     5761 aggaatttaa acctttacag taaggtgagg aatcaggggg gggggttaaa aggggggtta
     5821 aggttaagat tagtagaggt ataggagtta aggagagttc ctttggtaag gtagtttaaa
     5881 gaataaagag aagacagtag gttaaggtta gttgagttcc taggattagg catctttcat
     5941 tagaggtata ggagttaagg agagttcctt tggtaaggta gtttaaagaa taaagagaag
     6001 acagtaggtt aaggttagtt gagttcctag gattaggcat ctttcattag aggtatagga
     6061 gttaaggaga gttcctttgg taaggtagtt taaagaataa agagaagaca gtaggttaag
     6121 gttagttgag ttcctaggat taggcatctt tcattagagg tataggagtt aaggagagtt
     6181 cctttggtaa ggtagtttaa agaataaaga gaagacagta ggttaaggtt agttgagttc
     6241 ctaggattag gcatctttca ttagaggtat aggagttaag gagagttcct ttggtaaggt
     6301 agtttaaaga ataaagagaa gacagtaggt taaggttagt tgagttccta ggattaggga
     6361 tctttcatta gaggtatagg agttaaggag agttcctttg gtaaggtagt ttaaagaata
     6421 aagagaagac agtaggttgt ggtccttcag ttgtacccgc aggttccctt gctaggtgat
     6481 aaagttgagt ggaaaaagtg cttcagcaaa aagtgatagc tgtactccgt tggtgtgggc
     6541 tagcacgttc cttttgagtt gttttgtttt atggtttatt tggtttggtg gggttatctc
     6601 tactgctgtt gtcttagagt gggagttttt tagtgcttgt gggttttctt taagggtttt
     6661 gcttttgtta gattttttag gggctttgtt ttcttttgtg gtttgtctga tcagtggttg
     6721 tgtttttatc tttagggtta gatatatgag aggggataag ttccacaggc ttttttactc
     6781 tttggttgct gcttttgtag cggctataaa cattttaatc cttatcccga atttggtgtt
     6841 cgttttacta gggtgggatc ttttaggtat tatttctttc ttgttggttg tttattacca
     6901 gaatagtgta tcggtggggg cagggatatt gactgtgctg ataaatcgta ttggggatgt
     6961 ttttttagtg ttagctattg ggtttagctc tagggctggt atttggggga ttttggaggt
     7021 tgagcagctt gctgggcaag ttgtttgggt gggggttttg ttggttggtg ccgggataac
     7081 caagagggct caaattccct tttcggtgtg gttgccggct gctatggcag ccccgacacc
     7141 tgtttctgcg ttagtgtact cttctacctt ggttactgtg ggggtttact ttttgttccg
     7201 gcattatcat gttttgatgt gtgtgaatgg cttgcttcct ttattgagaa aggttgggtg
     7261 tttaactttg ttaatagcta gtttgggggc ttgtcttgag ctggacatta aaaagttagt
     7321 ggctttgtct actttaaggc atttggggtt tatggtctat gttttagggg ttgggtatcc
     7381 ggttcttagg gtttttcact tacttaggca tgccctgttt aagtccttgc tgtttctttg
     7441 tgcggggcat tatatgcatg aggttggttg ctcgcaagat attcgtcaaa tatctggtgt
     7501 tgggtggggc aggtcacccc tagtgatagc ttgcattatt atcgggctta attccctttg
     7561 cggggtacct tatctgagtg ggttttactc aaaggatgct attcttgaag ggtctatgac
     7621 ttcttttgtt ggtgctttag agattctttg tttggttgta ggtgctgggg ctaggtgtct
     7681 gcatgcaata cggctcttgt tgtatagaat tttcggacca cttggggggc tgccgttagt
     7741 gggggagtct ggtgttaggg ggtttgttgc gttccctgtt ttattgttgg ctcttgggag
     7801 gatttgcttt aggtacgtga tgcagcaagc ttgggctgaa gcttctttaa ggttcagttt
     7861 gaggtttttg gccaaggttg gattgttttt ggccttgaat ttgggggtgg ttattttggc
     7921 tacaagagtg ctaggttttg ggtacagcgg gggtaggctg tatgggggtt tctccagacg
     7981 acttatggct gttaagttgt ttttgaggag aatgtgattc tttcgttggt ggagttttgc
     8041 tgttcccggg gtttggttta ggtgcgggtc tcttaccgtg agggctatag aaatggggtg
     8101 gatggaggtg attgggggtc gtggggttgg tggcaggttt gtggggttgg ggtcaaaact
     8161 ctgggttata gaggggatta gtgttttaaa catattgcga cttgccggtg gggttttatt
     8221 agtattgggt gtgcattatt tttaaagttt aattgctggt ggtttagggg atggtcggat
     8281 gggagcgagt ttgttctatc ttaacatttt cagtgttgtg ctttagtggg gtttaagcta
     8341 cacccccgcg cccctttttt gttaaggtta attgggttat ttatttagat gggtgaaaat
     8401 aagtttgtct catggggcgc ccctggcggg gaggcttagc attagagaaa aatatagggc
     8461 agttacaagc tgccttataa ggataagggg cggttcagtc ggtatgtggc cgagtcatgt
     8521 taacacaaag aaggatgctg ctaaggctca aaataatggt tggcttgctg ggtaaaaggt
     8581 catgccacgt attgtgttta gatgtgtaag tggtattatt agaaggacta ggattgaaga
     8641 tgccaaggca agcactccgc ccatttttct tgggatggca cgtagaatgg cgtaggcaaa
     8701 cagaaagtat cactcaggtt gaatgtgtgt tggtgtggat aggggattgg ctgggacgaa
     8761 gttttctggg tcagagatta atagggggga gaatatacat accgctatga gactagcggt
     8821 gaaaactagg aatccgacga ggtcttttag ggtgtagaat gggtgaaacg ggataagaga
     8881 tgtgttgctg gatagcccta gggggttgtt gagccgtttt cgtgtagaag catgaggtgg
     8941 atgcatacaa tagctaggat tgtgaatgga aggagaaagt ggaacacaaa gaatcggttt
     9001 agtgttgccg ttggcaacag taaatcctcc tcagattcat gttactagaa ggtcgccgaa
     9061 atgcgggatg acagacaaaa ggttggtgat tactggtgct ccccaataag atatttgccc
     9121 ccacggaaga acgtagccga ggaaggctgt ggccattaag gtaaagagga gtactacacc
     9181 tgatagccat attttggtaa acaagtaaga agagaagtag attcctcggc caatgtgcac
     9241 gtaggcaagt agaaaaaata aggaggcccc tgtggcatgt atatttcgca gcattcagcc
     9301 aaagtttacg tcacgaacga tgtggactac ggagctaaag gcgtaatttg tatcgggtgt
     9361 gtaatggatt gccaaaaaaa tcccagaaag gatttggatt actaagcata gccccaagag
     9421 tgagcccgtg tttcatagag tggataggtt tattggggct ggtaggtcgt aaaccgatct
     9481 gttcatgata tttagtattg agtttgattt acgggttggt ttttgcactc agaaagttaa
     9541 cttgttaaat ctaaagctcc caaagctttt attttttata aactactctc tgaaagtaaa
     9601 tgaaattttg gttcatagcc tgctagttaa cagctagctg cttgagagct tttactttag
     9661 ttttggcgag taaatcgagg tgttgcaagt agatttaagg tctttttttt aagcctaaat
     9721 taaaggtatt gagtatacta acctgcagac tagtaaatta gcggttagcg atgtggactt
     9781 tgtcatgttt gtgttacttg aagagattta gtagagcact tgtgcaagtg tgcctctttg
     9841 ggtcctttcg tacaataaag agtgtggttg tgagggaaaa gatagaatcc aacctagctc
     9901 tcgccggtct taactcagct cgtgtagggg gtttgcagtc gaacagactg gcagatgttc
     9961 ttagtggctg cgccaagttg ctttccctaa gccaacatcg aggtcgcaaa cccagctttc
    10021 aatgcgtact cttaagctgg attacgctgt tatccccggg gtaactgcgg tatgtgcctt
    10081 agcaagtttt ttattggttt tagtgatccg ttgtggaggt tttatctact ccaaggttgc
    10141 cccaaccaac ctcattcctt agcaacttgt gttggtaggc ttaaagttat gaggggagtt
    10201 ccgcggggtc tttttgtctt tttccttcat ctaagtcttt tcacttagag gaaaagttat
    10261 ctttccgtgg gtgatacagt tcttccctgt tttgcctttc actggctcct aattagagag
    10321 ctgtttatta cgctacctta gcacgctcac gctaacgcgg ccatttaata gttaaatcat
    10381 ggggcaggca gtatctctta tgggtggggg tcaagagacg atgtttttgg taaacaggca
    10441 gggtaggatt ttgccgagtt cattactcac ggtggttact ctgggatgta gtttgatgag
    10501 tataacatgc agggtgctct gggagctgat ttatgatact aatagtttgc cgtttcgttg
    10561 aagcatttat tgcgctgcag ggttccttgg tgggtagagt tgagggtgaa ttttggtggg
    10621 aaagttcatt tcctgtaacg gattttgtgg gctgttttta ggcctattcg cgaaggtttg
    10681 gttatgtgta cttctaaact ctagcgagct tgtccccgct agattttctc caccaaaggg
    10741 tttcttttat gcttctggtg gggggcactt atatgccttt gaggaacaac cagctatcag
    10801 gcgattcgtc aggtattttg cttctattac cagctgtact ttaagtaatg acacactaat
    10861 ggttattgct ggtaatagct cctcgctttt cgggggacaa cataagggtt ggtggggttg
    10921 ttgcaactac ctgatgcaaa aggtagggga attaagccat tcttgtgaat agaggggata
    10981 ggcccttgcg gttgtgtggg attttaagtt gtgtgggttt gtacttatgt atgcgtgggt
    11041 ttactttaag gacagtcgtg ttcgagctta ctcgggttct gtgcaatggg cttttggggc
    11101 cattgaaaga tttacagtct tttgcctaag tcggccactt ttgcgtaagc cttagggctt
    11161 aagccttctg tgatttacaa gaccactgct tggtaagtat aagcttcatt agggcatcca
    11221 tgaagtttgt gtaactgttt ttaagttaaa agcttaatgc ctgatagtct cggccatcat
    11281 gggtttagtc taggggcaac ttccgatacc cctactgtgt tacgacttat cccgatttaa
    11341 gtatcgggag tgacgggcga tttgtgcgca ttctagttct tgttcaggct gtagtagtgt
    11401 tgtaacctta cttttaagtc ctcctttata gcagaaattt cattctcttt tggatgcttg
    11461 ataggcattt gtatcccatg agctgctttg tgttggctat atgtcacctg tgttagcaag
    11521 atgtagtctt gggtgtctcc ttttattttg ttggtgtgca gacttaaaac ggccatacat
    11581 aagctgttaa ctaacaaagc ttcggtgttc gtgggttatc gaattaagcc acaggatccc
    11641 ctaataaggt gtagaatacc gccacgcttt ttaagtttgg aactttcgtt tttagagttt
    11701 ggagtgttgg gccacgcgat aggcgggtat ctaatccgcg tcttgtaggt gtggtttgtt
    11761 agggtacgtt ttggggtgat gacttgtttg ggtatactta ttttgttaca aatttcactt
    11821 ttgggttgta agattgaagt cagaggtggg tttggtacct ttatgtcaac gtgtgaatta
    11881 attccgagtt ggggtctaac cgcgactgct ggcacccctt tggtcactat aagtttacca
    11941 ttcttgcggc ctagtttcct agcttaggca atatagctca ttggtgttgc gggcaagtgc
    12001 ctttggcggt agttttgtcc aatgttcgaa tgtgtattac tatgtgttta acagcgttac
    12061 tacacagggg tacgattcgc aagccactta gattaccata tgaagtttga cggcaataat
    12121 taatctgaca tcagagcgaa gtgttctaga gcaaagggaa ctcgatgaga agttcgtagt
    12181 atgggccgaa accatagtgc tgttgtagct tcctttgggc tctaagggct ggtttaggga
    12241 ttaccaatta aaactttgaa ggcttttagt tttattagct taagcccttg tggcgagaga
    12301 gtgtgatcat ttttgggtta tgggcccact agcttagagt tagcttatct tacctataga
    12361 acagatgctg ntaatcataa gggtagtgtg aaagaattgg aaaagtgtag atgctgtgaa
    12421 ggcgatgatg ggcatgattt ggaagccttt ctcgtttgtg ggttgtagag atgagttgag
    12481 gttaagggtt attataatag atagagaaag gtagaaatac agactgactg cggtgctaac
    12541 gaggagtagt cctagtggta ataggagctt ttgtgttatt aaggcaataa tcgggatttt
    12601 gctgataaac atagatagtg gtggcattcc cgctagggaa agtatattga taaccatggt
    12661 taattgtgca taattgttaa gaggtggggt tagggttgtg acgtaggttt tgatttttgg
    12721 ggtttttatg tacataaaaa ttgggagtgc tgttagtcta taggctagca ggtagatggt
    12781 tgggattagt gagttaaaca gtgaggctat gagtagtcat cccaggtgat tgatagatga
    12841 gaaggctatt agtttaagaa gatttgtttg gtttaagcca gctgtacttc ctcatagtgc
    12901 tcttataact cttgaggaaa taataatggg tgtgtgtgcc aggtgaggga ttgtgaggag
    12961 aaggagtggt cctgcttttt gtcatgtgct taggataaga gcagttgttg ggttaataga
    13021 ttgtatgaca gctggaaatc agctgtgtag cggaactccg cctagtttta ggatgagggc
    13081 tgtggtagtt agggtattcg agtgttgggt tattggtata agtaggacgg aggctatgaa
    13141 tagccttgag ccgaaggatt gtgggatgag atacttgatg gacgcttctg tctctgttgt
    13201 ggagttgtgg gtttgggtaa gcgggatgaa ggccagcata tttaattcta gcattattca
    13261 cataaatata gcgtttgttg atgaaattgt aagcagggtt cttgttagga gtaaaagtac
    13321 aaagagaggg gttatggtct tcgtaagtta gctactgtta gtcagcattt tcggcttgaa
    13381 agtccgacgt gttggggttt ataccaagct aatgtataaa gagcctaggt tggttagaga
    13441 agagaagcaa aaggagttaa acctcttttt ctttggttag aagcctaaga ttgattatcg
    13501 atcgcttctc tggaagaaga tggacgagtc gaacgtcctt cgttctggtt tcaagtcaga
    13561 gtgttaaaag ccttatcttc tgtttggggt tgaggggcac gtttgagccc tattgttagg
    13621 tgcaagttaa ctcttttagg ttaaagtact caaccgtaag taaacgcttt atggttgttt
    13681 atttattggt gtggtgagaa gaataaataa agagttagtt agtaggagga ggaggttggt
    13741 ggaggaatga aaatggtgat tgcttgcggt gttttttctg ttttggtaag ggtggcgatg
    13801 atgggcttag ggtgagttct tagtggtcgg tacttgtggg gtgtgcgtga gctaagaagt
    13861 ccgtttgagt gtgggtttga tccagttggg tcttctcggg ttgggttttc tttgcggttt
    13921 tttgggttaa taattttgtt cattgtcttt gactttgaga cagtgttgtt gttgcctttt
    13981 gtgttttgat ccggtatggg gttggataag gggcttgggg tagttgagtt cgtggggttt
    14041 ttggtgattc ttttggttgg ggttgtctat gagatgaaag agggtgcttt agagtggggg
    14101 ttttaggggt taatgccccg gccgcgtgtt ggtttagcaa aatgagccgt tgaagtcagc
    14161 ttgggttgca ggaaggtact agtgttttag gtgtagaggt tcatgggcta tacgattata
    14221 gcatgtttat tattgttttg gtttttaggt ttgtagcgta tcttatgcta aagagtttgt
    14281 gccacaaggt aaccggtcgg gtttatgtgg ataggcagtg gttggaagtc ttgtgaaccg
    14341 ttataccatt ttggcttttg ttagccttag gcttacctag gattaagctg ctttatttga
    14401 tggatgagat caaccttcct gaagccactg ttaaagtggt ggggcatcag tggtattgaa
    14461 ggtatgagta ttctgatgtt cgcggtagta ggtacaggta tgactcctac ttgattccag
    14521 attcagcaat agaggagggt tatcggcttc tggaggttga taatcggtgt gttgttccga
    14581 ctttgttgac tattcgaggg ttagttacgt ctgatgatgt aattcactcg tgggccattc
    14641 cttctagggc tattaaagtg gatggggttc ctgggcgtat taatcaggtt agtttgtgtt
    14701 tcattaattc tggtgttttt tatgggcaat gtagtgaact gtgcggggtt aaccactctt
    14761 ttatacctat ttgtgttgag tctgtttcgg tagaagttta taggagctga attgttgata
    14821 accataataa tgtgttgaaa gagatggggg gacgacctga aaggtgaact tggtggggtc
    14881 tgttggttgc tgtagtaagg gggattggga aaggattgta ttggcttggg aggatatacg
    14941 gtatgtttct ttattattta ttttactata ggttttatgt tccgggtaag tttgttgttg
    15001 ttgggagttg aggatttgtg tggtgagtca ttaggagttc cgtgattgtt gtaaagtggt
    15061 tggtgtggtt tgggaattct cctatggagg ctgttaggta tgctgttggg tgtttggttg
    15121 ctaatatttg gagtgttgtt gtgttttttg tgactagtcc tgtagtggct gtttggtggc
    15181 ttgttaaggg gttttgtggg gttgtggttg gttttgtttg gttttctctc tatgcttttg
    15241 aggctgtttt gaatagttta tctaggttta ctggggatgg gtttcaggaa tttgttgtgg
    15301 ataatgtgag gtggaatact aagaagtttc tttgaattct gtcaaatcga tataagggtg
    15361 ggtagcggtg atttattgct gtttgcgttg actgttttcc actaaccata aggatattgg
    15421 aagtttatat ttgatatcag ctttgtgatg gggtttggtg ggtttgtctt taagggttgt
    15481 gattcgggcg gagcttggtc atcctggcgg attaatacat aatgatcagt tatactactc
    15541 tgtagttacg gctcatgctt ttgtaataat tttttttgtt gttataccgg ctataatggg
    15601 gggtattggg aattggcttg ttccgattat gttggggtgt ccagatatag cctttcctcg
    15661 tttgaacaat gtgaggtttt ggttattggc aggtgctggg tttttgttgg ggtgatctat
    15721 gtttgtggag ggtgggtgtg gtactgggtg aactatttac ccgcctttgt cgagtagtgc
    15781 ttttcactca ggggtttctg tggacattct tatcttttct ttacatctgg ctggtctttc
    15841 ctctatttta gggtcactaa attttattac gactatttta gggatgcgaa gggatatctt
    15901 acgggcagag cgtatgactt tactcgtttg gtctgtgcta tgcactgcgg gtttgattgt
    15961 ggcatctttt ccggtattag caggggccat caccatgttg ctaacagatc gtaattttaa
    16021 tacctctttc tttgatcctt cggggggggg agatccaatc ctttttatgc atttgttttg
    16081 gttttttggg catccggagg tttatatcat tattatccct gcttttgggg ttgtttcgca
    16141 tgtgattttg tacttttctg ctaaaaaggt tgtttttggt caattaggta tgatttttgc
    16201 aattataggt attggggcga tggggtttgt tgtttggggg catcatatgt ttactgtggg
    16261 gttggatgta gatactcggg cttactttac tggggctacg atggtaattg ctatccccac
    16321 tgggattaag gtttttaggt gacttagaac aatgattggt tctgctatgc cgttttgacc
    16381 tgcgtttttg tggtctttgg ggtttgtttt cttattcact ttaggtggtc ttactggggt
    16441 gattttgtcc cactcttctt tggatgttgt tctgcacgac acttactatg ttactgcaca
    16501 ctttcattat gtcctaagaa tgggggcccg tgtttggctt gttttctggg ttttgttatt
    16561 gatatccggt tatgtttggg gtgactctac accccgttgg cttaaagtgc agttttattt
    16621 actttttttg ggggttaatc ttactttttt ccctcagcat tttttggggc ttgctggtat
    16681 accccgtcga tgttctgatt atgctggtgt ttattatccg tgaaatgctg tttcttcttg
    16741 gggatcgatt ttgtctgtgg tgtctgtgtt ttgattcttg tgttgtgtgt tggagtcgct
    16801 tgtttcttgt cgtagcgtgg tttatggcgg ggcattaagt gtgtctattg agtggtgtga
    16861 gaatttgttc cctgtggctt ttcactcgta taggcaggtt gctatgggcg ttagagcaga
    16921 ggcatgtttg atggaaaggg gggtttgtgg ggtgggtacg agagaag
//
6楼2013-04-23 09:19:13
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

erlei

木虫 (正式写手)

引用回帖:
4楼: Originally posted by genomelin at 2013-04-23 07:06:38
GO to "http://www.ncbi.nlm.nih.gov/genomes/OrganelleResource.cgi?opt=organelle&taxid=6544"
click "Download"-> "download the list of accessions"-> fileA
GO to ...

附件是上传的99个线粒体基因组的GB文件
7楼2013-04-23 10:03:13
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通回帖

137167741

至尊木虫 (著名写手)

★ ★
感谢参与,应助指数 +1
wizardfan: 金币+2, 应助指数-1, 谢谢参与,不过回帖更倾向于交流,而不是应助 2013-04-23 07:05:01
第一、什么物种
第二、什么叫“析出”
总有一天我要修改用户名。
2楼2013-04-22 09:37:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

erlei

木虫 (正式写手)

引用回帖:
2楼: Originally posted by 137167741 at 2013-04-22 09:37:32
第一、什么物种
第二、什么叫“析出”

双壳纲
析出是就是将十二个编码基因从线粒体全基因组序列中截取下来
3楼2013-04-22 10:24:48
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

erlei

木虫 (正式写手)

引用回帖:
4楼: Originally posted by genomelin at 2013-04-23 07:06:38
GO to "http://www.ncbi.nlm.nih.gov/genomes/OrganelleResource.cgi?opt=organelle&taxid=6544"
click "Download"-> "download the list of accessions"-> fileA
GO to ...

谢谢!
5楼2013-04-23 08:47:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

erlei

木虫 (正式写手)

wizardfan: 编辑内容 2013-04-24 06:36
引用回帖:
5楼: Originally posted by erlei at 2013-04-23 08:47:53
谢谢!...

Atp6,ATP8,COX1,COX2,COX3,ND1,ND2,ND3,ND4,ND4L,ND5,ND6,16sRNA,12sRNA等基因,各位高手有谁帮忙将这些编码基因截取下来,附件是全基因组GB文件,希望有人可以帮忙做一下!

不好意思,前面电脑卡了,没传上去,这次传上去了

[ Last edited by wizardfan on 2013-4-24 at 06:36 ]

» 本帖附件资源列表

  • 欢迎监督和反馈:小木虫仅提供交流平台,不对该内容负责。
    本内容由用户自主发布,如果其内容涉及到知识产权问题,其责任在于用户本人,如对版权有异议,请联系邮箱:xiaomuchong@tal.com
  • 附件 1 : GB文件.zip
  • 2013-04-23 10:05:57, 1.21 M
8楼2013-04-23 10:06:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

genomelin

银虫 (小有名气)

【答案】应助回帖

★ ★ ★ ★ ★
erlei: 金币+5, ★★★很有帮助 2013-04-24 07:59:48
引用回帖:
8楼: Originally posted by erlei at 2013-04-23 05:06:25
不好意思,前面电脑卡了,没传上去,这次传上去了...

将 tag “gene” 改为 “product”
因为你的文件中有些不是统一的mito GBK格式
推荐只用 NC 类的,其它的有可能有错误
另外NC 类也是有注释错误的,需要你做个简单clustaw,看是不是有的注释到了相反链上

» 本帖附件资源列表

  • 欢迎监督和反馈:小木虫仅提供交流平台,不对该内容负责。
    本内容由用户自主发布,如果其内容涉及到知识产权问题,其责任在于用户本人,如对版权有异议,请联系邮箱:xiaomuchong@tal.com
  • 附件 1 : 123.fa
  • 2013-04-23 17:09:25, 1.69 M
9楼2013-04-23 17:12:49
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

erlei

木虫 (正式写手)

wizardfan: 小木虫的目的是互相提高水平,而不是单纯找人帮忙 2013-04-27 08:26:20
引用回帖:
9楼: Originally posted by genomelin at 2013-04-23 17:12:49
将 tag “gene” 改为 “product”
因为你的文件中有些不是统一的mito GBK格式
推荐只用 NC 类的,其它的有可能有错误
另外NC 类也是有注释错误的,需要你做个简单clustaw,看是不是有的注释到了相反链上...

在麻烦您一下,能不能帮我把这些和上面的一样,也做一下,谢谢

» 本帖附件资源列表

  • 欢迎监督和反馈:小木虫仅提供交流平台,不对该内容负责。
    本内容由用户自主发布,如果其内容涉及到知识产权问题,其责任在于用户本人,如对版权有异议,请联系邮箱:xiaomuchong@tal.com
  • 附件 1 : 新整理的2.zip
  • 2013-04-26 10:43:23, 550.56 K
10楼2013-04-26 10:43:07
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 erlei 的主题更新
信息提示
请填处理意见