| 查看: 2075 | 回复: 17 | |||
| 当前主题已经存档。 | |||
[交流]
NCBI(美国国立生物技术信息中心) 简介
|
|||
|
随着又一个千年的到来,人类基因组计划即将胜利完成。与此同时,诸如大肠杆菌、结核杆菌、啤酒酵母、线虫、果蝇、小鼠、拟南芥、水稻、玉 米等等其它一些模式生物的基因组计划也都相继完成或正在顺利进行。人类基因组以及其它模式生物基因组计划的全面实施,使分子生物数据以爆炸性速度增长。在计算机科学领域,按照摩尔定律飞速前进的计算机硬件,以及逐步受到各国政府重视的信息高速公路计划的实施,为生物信息资源的研究和应用带来了福音。及时、充分、有效地利用网落上不断增长的生物信息数据库资源,已经成为生命科学和生物技术研究开发的必要手段。核酸和蛋白质序列、结构、功能分析软件已经成为生物学、医学、药物学、农学和环境 科学等领域的必备工具。 早在1988年,美国的参议员 Claude Pepper 已意识到信息计算机化过程方法对指导生物医学研究的重要性,发起了在1988年11月4日建立国立生物技术信息中心(NCBI)的立法。NCBI是在NIH的国立医学图书馆(NLM)的一个分支。NLM是因为它在创立和维护生物信息学数据库方面的经验被选择的,而且这可以建立一个内部的关于计算分子生物学的研究计划。NCBI的任务是发展新的信息学技术来帮助对那些控制健康和疾病的基本分子和遗传过程的理解。它的使命包括四项任务: · 建立关于分子生物学,生物化学,和遗传学知识的存储和分析的自动系统。 · 实行关于用于分析生物学重要分子和复合物的结构和功能的基于计算机的信息处理的,先进方法的研究。 · 加速生物技术研究者和医药治疗人员对数据库和软件的使用。 · 全世界范围内的生物技术信息收集的合作努力。 NCBI通过下面的计划来实现它的四项目的: 基本研究 NCBI有一个多学科的研究小组包括计算机科学家,分子生物学家,数学家,生物化学家,实验物理学家,和结构生物学家,集中于计算分子生物学的基本的和应用的研究。这些研究者不仅仅在基础科学上做出重要贡献,而且往往成为应用研究活动产生新方法的源泉。他们一起用数学和计算的方法研究在分子水平上的基本的生物医学问题。这些问题包括基因的组织,序列的分析,和结构的预测。目前研究计划的一些代表是:检测和分析基因组织,重复序列形式,蛋白domain和结构单元,建立人类基因组的基因图谱,HIV感染的动力学数学模型,数据库搜索中的序列错误影响的分析,开发新的数据库搜索和多重序列对齐算法,建立非冗余序列数据库,序列相似性的统计显著性评估的数学模型,和文本检索的矢量模型。另外,NCBI研究者还坚持推动与NIH内部其他研究所及许多科学院和政府的研究实验室的合作。 数据库和软件 在1992年10月,NCBI承担起对GenBank DNA序列数据库的责任。NCBI受过分子生物学高级训练的工作人员通过来自各个实验室递交的序列和同国际核酸序列数据库(EMBL和DDBJ)交换数据建立起数据库。同美国专利和商标局的安排使得专利的序列信息也被整合。 GenBank是NIH遗传序列数据库,一个所有可以公开获得的DNA序列的注释过的收集。GenBank同日本和欧洲分子生物学实验室的DNA数据库共同构成了国际核酸序列数据库合作。这三个组织每天交换数据。 孟德尔人类遗传(OMIM),三维蛋白质结构的分子模型数据库(MMDB),唯一人类基因序列集合(UniGene),人类基因组基因图谱,分类学浏览器,同国立癌症研究所合作的癌症基因组剖析计划(CGAP)。 Entrez是NCBI的为用户提供整合的访问序列,定位,分类,和结构数据的搜索和检索系统。Entrez同时也提供序列和染色体图谱的图形视图。Entrez是一个用以整合NCBI数据库中信息的搜寻和检索工具。这些数据库包括核酸序列,蛋白序列,大分子结构,全基因组,和通过PubMed检索的MEDLINE。Entrez的一个强大和独特的特点是检索相关的序列,结构,和参考文献的能力。 杂志文献通过PubMed获得,PubMed是一个网络搜索界面,可以提供对在MEDLINE上的九百万杂志引用的访问,包含了链接到参与的出版商网络站点的全文文章。 BLAST是一个NCBI开发的序列相似搜索程序,还可作为鉴别基因和遗传特点的手段。BLAST能够在小于15秒的时间内对整个DNA数据库执行序列搜索。 NCBI提供的附加的软件工具有:开放阅读框寻觅器(ORF Finder),电子PCR,和序列提交工具,Sequin和BankIt。所有的NCBI数据库和软件工具可以从WWW或FTP来获得。 NCBI还有E-mail服务器,提供用文本搜索或序列相似搜索访问数据库一种可选方法。 教育和训练 NCBI通过赞助会议,研讨会,和系列演讲来培养在应用于分子生物学和遗传学的计算机领域的科学交流。一个科学访问学者项目已经成立,来培养同外部科学家的合作。作为NIH内部的部分研究项目,也提供博士后工作位置。 |
» 猜你喜欢
拟解决的关键科学问题还要不要写
已经有8人回复
26申博
已经有3人回复
存款400万可以在学校里躺平吗
已经有22人回复
最失望的一年
已经有4人回复
国自然申请面上模板最新2026版出了吗?
已经有19人回复
请教限项目规定
已经有3人回复
基金委咋了?2026年的指南还没有出来?
已经有10人回复
基金申报
已经有6人回复
推荐一本书
已经有13人回复
疑惑?
已经有5人回复
» 本主题相关商家推荐: (我也要在这里推广)
NCBI工具概述
|
数据检索 - 文本搜索 · Entrez - 对GenBank, EMBL, DDBJ, PIR-International, PRF, Swiss-Prot, and PDB数据库中的核酸和蛋白,包括了来自>70000个物种的序列序列数据提供整合的访问,同时提供对3D蛋白结构,基因组图谱信息和 PubMed MEDLINE 的访问。Entrez包含了对每个数据库记录的预先计算好的相似搜索,产生一个相关序列,结构,和 MEDLINE 记录的表。Entrez可以用很广泛的文本方式来搜索,比如作者名字,杂志名字,基因或蛋白名字,物种,唯一的标号(如:accession number,序列ID,PubMed ID,MEDLINE UID),和其他的术语,根据被搜索的数据库来确定。使用新的 Linkout服务,外部资源可以被链接到Entrez纪录。 · 批量Entrez - 允许你用一批的方式来用Entrez检索大量的核酸或蛋白序列,并把他们保存在你计算机的磁盘上。有三种方法来提交一个查询: 1)输入一个含有GI或accession number列表的文件, 2)指定一个物种名字或更高的分类来检索那个类的所有序列。 3)输入一个Entrez搜索查询。搜索结果将被直接保存到你的计算机上。 · 查询E-Mail服务器 - 用Entrez PubMed查询引擎来检索核酸序列,蛋白序列,三维结构,和 PubMed MEDLINE 纪录。如果要获得帮助文件,给query@ncbi.nlm.nih.gov写一封只有内容为 HELP 的E-Mail。 · 网络Entrez - 一个WWW Entrez基于TCP/IP的客户-服务器版本。直接通过 Internet 来连接 NCBI 的数据库来检索数据。数据以二进制的方式来传输,减少网络传输的带宽要求。有PC,Mac,Unix,版本的客户软件。 · dbEST, dbGSS, dbSTS搜索页面 -EST, GSS, 和STS序列可以从两种方法获得:GenBank(通过Entrez)的EST/GSS/STS部分,和分开的但相关的数据库 dbEST/dbGSS/dbSTS。两种来源的序列和 accession number 是一致的,但是纪录的格式不一样,dbEST/dbGSS/dbSTS 纪录包括了一些基于BLAST搜索结果增加的注解,包括上至15最佳匹配的核酸和蛋白。dbEST, dbSTS, dbGSS搜索页面还允许用克隆号码来搜索。 · 引用匹配 - 允许你找到任何一篇在 PubMed 数据库中的文章的 PubMed ID 或 MEDLINE UID,给出书目信息(杂志,卷,页码等)。 · 单篇文章的引用匹配。 · 许多文章的批量引用匹配。 · E-mail引用匹配也是可以的,也可以用于单篇或许多文章。如果要获得帮助文件,给citation_matcher@ncbi.nlm.nih.gov写一封只有内容为HELP的E-Mail。 序列相似搜索 · BLAST主页 - 访问 BLAST 程序,概要,帮助文件,和FAQs。 · Gapped BLAST (2.0) - 一种BLAST版本,允许在它产生的对齐(alignments)中存在缺口。统计有效性的评估是基于使用随机序列的优先模拟。在不久的将来,所有对 Gapped BLAST 的访问都要通过 QBLAST。 · QBLAST - 一种新的系统,允许用户以他们方便的方式检索 Gapped BLAST 结果,并且可以用各种格式选项多次格式化他们的结果。这个系统也使NCBI更有效的使用计算资源,更好的为大家服务。到1999年秋季,QBLAST 系统用于所有的 BLAST 搜索。 · PSI-BLAST - 位点特异迭代BLAST - 用蛋白查询来搜索蛋白数据库的一个程序。所有被BLAST发现的统计有效的对齐被总和起来形成一个多次对齐,从这个对齐,一个位置特异的分值矩阵建立起来。这个矩阵被用来搜索数据库,以找到额外的显著对齐,这个过程可能被反复迭代一直到没有新的对齐可以被发现。 · PHI-BLAST - 模式发现迭代 BLAST - 用蛋白查询来搜索蛋白数据库的一个程序。仅仅找出那些查询序列中含有的特殊模式的对齐。 · RPS-BLAST - Reverse Position-Specific BLAST · Taxonomy BLAST - an implementation of Gapped BLAST (2.x) that groups hits by source organism, according to information in NCBI's Taxonomy database. · BLAST两个序列 - 一个基于BLAST的工具,对齐两个核酸或蛋白的序列,产生一个成对的DNA-DNA或蛋白-蛋白序列比较。 · IgBLAST -IgBLAST被开发出来以便于分析在 GenBank 中的免疫球蛋白的序列。它允许用 blastp 或 blastn 来搜索 nr 数据库或一个由免疫球蛋白生殖系变化区基因的特殊的数据库。搜索可以限制在人类或小鼠的基因。IgBLAST 执行三个主要的功能: 1)报告与查询序列最相似的可变,D,或J区, 2)根据 Kabat et al. 来注解免疫球蛋白 domains (从FWR1到FWR3), 3)对于搜索核酸或蛋白 nr 数据库,通过匹配 IgBLAST 的发现和最接近的生殖系变化区基因来简化识别相关序列的过程。 · PowerBLAST -PowerBLAST是一个程序,允许对非常长的序列进行快速的 gapped BLAST 搜索,它把序列分割开,对每个部分搜索,然后把结果组装起来。包含在 Sequin中的 PowerBlast 版本使用了新的强大的 gapped BLAST 算法,过滤和物种特异的输出特点还仍旧保留。 · BLAST E-mail服务器 - 基于e-mail的序列相似搜索服务,接受FASTA格式的核酸或蛋白序列。如果要获得帮助文件,给blast@ncbi.nlm.nih.gov写一封只有内容为HELP的E-Mail。 · 网络BLAST - 一个WWW Entrez基于TCP/IP的客户-服务器版本。直接通过Internet来连接NCBI的数据库来检索数据。有PC,Mac,Unix,版本的客户软件。 · 单独的BLAST - 下载可用于本地执行使用的BLAST。二进制版本有IRIX 6.2, Solaris 2.6, DEC OSF1 (ver. 4.0d), LINUX, 和 Win32系统。BLAST数据库同样可以下载。 专门的BLAST页面 · BLAST人类染色体 - 人类染色体测序页面的一部分。 · BLAST against mouse chromosomes. · BLAST against Drosophila melanogaster genome sequence - see additional information on the Drosophila genome above. · BLAST against dbSNP - additional information about dbSNP is above. · Microbial Genomes BLAST Databases - BLAST against finished and unfinished microbial genomes. · BLAST against P. falciparum only, all Plasmodium, or all Toxoplasma in GenBank. · BLAST against P. falciparum 3D7 Genome Project finished and unfinished sequences. 序列分析 · BLAST - 见上 · VecScreen - 一个工具,在序列分析和提交之前用来确定一个核酸序列是否有载体,接头或连结序列。VecScreen 被开发来对付公开数据库中的载体污染问题。在开始进行任何一种序列分析前把序列用VecScreen检查一下都是有用的,因为在序列中存在载体序列可能会导致错误的BLAST结果。 · ORF Finder - 一个图形分析工具,用于在用户提供的序列或数据库中的序列中寻找被选择的最小长度的开放阅读框。用标准的或替代的遗传密码来确定所有开放阅读框。推断出的氨基酸序列可以用各种格式来保存,还可以用 WWW BLAST 到序列数据库中进行搜索。ORF Finder 同 Sequin 序列提交软件捆绑在一起。单独的程序可以从 NCBI 的 ftp 站点下载。 · Sequin - 一个提交工具,包括了ORF Finder,一个对齐浏览器/编辑器,和一个链接到 PowerBLAST。更详细的见上 Sequin。 · CD-Search - The Conserved Domain Search Service (CD-Search) can be used to identify the conserved domains present in a protein sequence. · e-PCR 电子PCR - 将一个查询序列同已经定位的STSs比较,来发现查询序列的可能的图谱定位。E-PCR通过查找在的DNA序列中与定位标记的PCR引物非常吻合的子序列来找到STSs。这个子序列一定要有正确的顺序,方向,和间隔,以至他们可以合理的启动一个扩增出正确分子量的PCR产物。最新版本的e-PCR搜索除了NCBI dbSTS数据库以外的其他资源: 1)人类:GDB,Genethon遗传图谱,GeneMap'99,Stanford G3图谱v2,Whitehead GB4图谱,Whitehead YAC图谱,NHGRI chr 7图谱,WUSTL chr X图谱,NCBI RH图谱,和 2)小鼠:Whitehead遗传图谱,Whitehead RH图谱,Whitehead YAC图谱。e-PCR可以通过WWW查询,或可以从NCBI ftp站点的/pub/schuler/e-PCR目录下载。 · COGnitor - 将你的序列同COGs数据库比较,来确定它属于的相邻组的簇。单独的COGs程序也是可以获得的。COGnitor可以以批的模式来运行,同很多的COGs数据库中的蛋白比较,并可以从ftp站点下载。 · 疟原虫遗传学和基因组 - 提供与疟原虫遗传学和基因相关的数据和信息。资源包括物种特异的序列BLAST数据库(恶性疟原虫,所有疟原虫,以及弓形虫),基因组图谱,连锁标记,以及遗传学研究信息。链接到其他的疟原虫网站和相关的寄生虫遗传学数据库包括弓形虫。 · 反转病毒资源 - 收集了一批资源用于特别支持反转病毒的研究。资源包括,一个基因型工具用BLAST算法来确定一个查询序列的基因型,一个对齐工具(alignment)用于多个序列的通用对齐,一个HIV-1自动序列注解工具,以及16种反转病毒的可以在GenBank,FASTA和图形方式来查看的注解图谱及链接到其他相关序列纪录。 · SAGEmap - 基因表达的串行分析(SAGE)是一种实验技术用来定量分析基因的表达。提供CGAP SAGE(Serial Analysis of Gene Expression)库的差异显示。也包含了对在人类GenBank记录中的SAGE标签的完整分析,在人类GenBank记录中一个UniGene的标志被分配给了每个含有一个SAGE标签的人类序列网站建设过程的描述,分析工具,参考文献,定义,和定位数据可以从站点上下载。 · CGAP DDD - 数字差异显示 - 一个在线工具,用来比较从挑选出来的cDNA库的计算基因表达谱。 3-D Structure Display and Similarity Searching · Cn3D - "See in 3-D", 一个用于NCBI数据库的结构和序列相似显示工具,它允许观察3-D结构和序列-结构或结构-结构同源比较。Cn3D用起来就象你浏览器上的一个帮助工具。 · VAST搜索 - 结构-结构相似搜索服务,将一个新解出的蛋白结构的三维坐标同在MMDB/PDB数据库中的比较。VAST搜索计算出可能会交互浏览的临近结构的列表,通过分子图形来查看重叠和对齐。 · CD-Search - The Conserved Domain Search Service (CD-Search) can be used to identify the conserved domains present in a protein sequence. CD-Search uses RPS-BLAST 同上。 |
2楼2006-11-11 16:01:38
GenBank 简介
|
· 什么是GenBank? GenBank 是一个有来自于70,000多种生物的核苷酸序列的数据库。每条纪录都有编码区(CDS)特征的注释,还包括氨基酸的翻译。GenBank属于一个序列数据库的国际合作组织,包括EMBL和DDBJ。 · 纪录样本 - 关于GenBank的各个字段的详细描述,以及同Entrez搜索字段的交叉索引。 · 访问GenBank - 通过 Entrez Nucleotides来查询。用 accession number,作者姓名,物种,基因/蛋白名字,还有许多其他的文本术语来查询。关于 Entrez 更多的信息请看下文。用 BLAST 来在 GenBank 和其他数据库中进行序列相似搜索。用E-mail来访问Entrez 和 BLAST 可以通过 Query 和 BLAST 服务器。另外一种选择是可以用 FTP 下载整个的 GenBank 和更新数据。 · 增长统计 - 参见公布通知的2.2.6(每个分类的统计),2.2.7(每个物种的统计),2.2.8(GenBank增长)小节。 · 公布通知,最新 - 最近和即将有的变化,GenBank 的分类,数据增长统计,GenBank 的引用。 · 公布通知,旧 - 同上相同,是过去公布的统计。 · 遗传密码 - 15个遗传密码的概要。用来确保GenBank中纪录的编码序列被正确的翻译。 向GenBank提交数据 · 关于提交序列数据,收到 accession number,和对纪录作更新的一般信息。 · BankIt - 用于一条或者少数条提交的基于WWW的提交工具软件。(请在提交前用 VecScreen 去除载体) · Sequin - 提交软件程序,用于一条或者很多条的提交,长序列,完整基因组,alignments,人群/种系/突变研究的提交。可以独立使用,或者用基于TCP/IP的"network aware"模式,可以链接到其他NCBI的资源和软件比如Entrez和PowerBLAST。(请在提交前用VecScreen去除载体) · ESTs - 表达序列标签,短的、单次(测序)阅读的cDNA序列。也包括来自于差异显示和 RACE 实验的 cDNA 序列。 · GSSs - 基因组调查序列,短的、单次(测序)阅读的cDNA序列,exon trap 获得的序列,cosmid/BAC/YAC 末端,及其他。 · HTGs - 来自于大规模测序中心的高通量基因组序列,未完成的(阶段0,1,2)和完成的(阶段3)序列。(注意:完成的人类的HTG序列可以同时在 GenBank 和 Human Genome Sequencing页面上访问。) · STSs - 序列标签位点。短的在基因组上可以被唯一操作的序列,用于产生作图位点。 · 注:SNPs - 人类的和其他物种的遗传变异数据可以提交到NCBI数据库的单核苷酸多态性库中(dbSNP)。 国际核苷酸序列数据库合作组织 · GenBank,DDBJ,EMBL - 合作计划的概述,并链接到相应的主页。GenBank,DDBJ(DNA Data Bank of Japan),and EMBL (European Molecular Biology Laboratory)数据库共享的数据是每天都交换的,因此他们是相等的。数据纪录的格式和搜索方式可能会不一样,但是accession number,序列数据和注解都是一模一样的。即,你可以用accession number U12345在GenBank,DDBJ或EMBL中查找相应纪录,得到的结果是完全一样的序列数据,参考内容等等。 · DDBJ/EMBJ/GenBank特性表 - 特性表格式和标准被合作数据库用在序列记录的注释上,使得数据共享成为可能,包括详细的描述生物特性和特性限定语的附录,以及IUPAC规定的核苷酸和氨基酸的代号。 FTP GenBank 及每日更新 · GenBank普通文件格式 - 参见GenBank记录样本和在GenBank公布通知中的详细描述,下载大多数最近的完全公告和日常积累或非积累更新数据。 · ASN.1格式 - 摘要句法记号1,国际标准组织(ISO)数据表示格式,下载大多数最近的完全公告和日常积累或非积累更新数据。 · FASTA格式 - 定义行号后只跟随序列数据(示例),参见描述数据库的readme文件,包括nt.Z(每天更新的非冗余BLAST核酸数据库,包括GenBank+EMBL+DDBJ+PDB序列,但是不包括EST, STS, GSS, or HTGS序列),nr.Z(每日更新的非冗余蛋白质),est.Z, gss.Z, htg.Z, sts.Z,和其它文件。 |
3楼2006-11-11 16:02:56
NCBI文献数据库介绍
|
· PubMed - 一个关于生物医药科学的检索系统,包括引用,摘要,和杂志的索引术语。它包括直接由出版商提供给 NCBI 的文献引用以及链接到在出版商网址上的全文的 URLs。PubMed 包括 MEDLINE 和 PREMEDLINE 的完整内容。它还包括一些被 MEDLINE 认为超出范围的文章和杂志,(这些文章或杂志)由于内容或在某一时期不在索引范围内。因此 PubMed 是比 MEDLINE 的更大的集合。 · 杂志浏览器 - 允许你去查找收录到PubMed系统的杂志的名字,MEDLINE的缩写,或ISSN号码。 · PubRef(开发中)- 一个关于来自于广大范围的科学杂志的数目记录,和链接到出版商网址的全文。PubRef 包含了 PubMed,加上了来自其它学科的杂志出版商提供的引用和摘要。因此它是比 PubMed 更大的集合。这个计划的启动是因为 NAS 要求为科学领域的电子杂志提供一个"白皮书"服务。 · PubMed中心(开发中) - PubMed 中心是一个无障碍的 NIH 资源,用于在生命科学领域中同业互查的基础研究报告。从2000年一月开始接受杂志文章。所有在 PubMed 中心的材料将由目前任一主要的摘要和索引服务中列出的杂志提供,或者在编辑委员会中拥有3个以上有主要资金机构的研究经费的拥有人的杂志提供。 · OMIM - 在线人类孟德尔遗传-经常更新的人类基因和遗传失调的目录,有链接到其它相关的文献参考,序列记录,和相关数据库。 · 书籍 - 同书籍出版商合作NCBI为网络改编了教科书,并把他们链接到PubMed-生物医药书目数据库。这是为了给PubMed提供背景信息,这样使用者可以探究在PubMed搜索结果中不熟悉的概念。目前收录的书有: Molecular Biology of the Cell, 3rd ed. Alberts B., Bray D., Lewis J., Raff M., Roberts K., Watson J.D., 1994, Garland Publishing. · 外部链接 - 一个登记服务,用于建立从在Entrez中的特定的文章,杂志,或生物数据到外部网址的链接。第三方可以提供一个URL,资源名字,关于他们网址的简要的描述,和关于从NCBI数据的哪里他们希望建立链接的详细说明。这个详细说明可以用对Entrez有效的布尔查询来写,也可以用特定的文章或序列的标志列表来写。这样NCBI PubMed的用户将可以通过"NCBI小房间"服务(开发中)来选择哪个外部链接在他们的搜索中是可见的。 · 引用匹配 - 允许你找到任何一篇在PubMed数据库中的文章的PubMed ID或MEDLINE UID,给出书目信息(杂志,卷,页码等)。 · 单篇文章的引用匹配。 · 许多文章的批量引用匹配。 · E-mail引用匹配也是可以的,也可以用于单篇或许多文章。如果要获得帮助文件,给citation_matcher@ncbi.nlm.nih.gov写一封只有内容为HELP的E-Mail。 |
4楼2006-11-11 16:04:58
NCBI分子数据库介绍
|
核酸序列(nucleotides) · Entrez核酸 - 用accession number,作者姓名,物种,基因/蛋白名字,以及很多其它的文本术语来搜索核酸序列记录(在GenBank + PDB中)。更多的关于Entrez的信息见下。如果要检索大量数据,也可使用Batch Entrez(批量Entrez)。 · RefSeq - NCBI数据库的参考序列。校正的,非冗余集合,包括基因组DNA contigs,已知基因的mRNAs和蛋白,在将来,整个的染色体。Accession numbers用NT_xxxxxx, NM_xxxxxx, NP_xxxxxx, 和NC_xxxxxx的形式来表示。 · dbEST - 表达序列标签数据库,短的、单次(测序)阅读的cDNA序列。也包括来自于差异显示和RACE实验的cDNA序列。 · dbGSS -基因组调查序列的数据库,短的、单次(测序)阅读的cDNA序列,exon trap获得的序列,cosmid/BAC/YAC末端,及其他。 · dbSTS -序列标签位点的数据库,短的在基因组上可以被唯一操作的序列,用于产生作图位点。 · dbSNP - 单核苷酸多态性数据库,包括SNPs,小范围的插入/缺失,多态重复单元,和微卫星变异。 完整的基因组 · 参见 Genome 和 Maps 部分,包括各种物种资源,人,小鼠,大鼠,酵母,线虫,疟原虫,细菌,病毒,viroids,质粒。 · UniGene - 被整理成簇的EST和全长 mRNA 序列,每一个代表一种特定已知的或假设的人类基因,有定位图和表达信息以及同其它资源的交叉参考。序列数据可以以 cluster 形式在 Unigene 网页下载,完整的数据可以从FTP站点 repository/UniGene 目录下下载。 1. 奶牛 UniGene 2. 人类 UniGene 3. 小鼠 UniGene 4. 大鼠 UniGene 5. 斑马鱼 UniGene · BLAST - 将你的序列同核酸库中的的序列比较,检索相似的序列。(更详细的信息见下面 Tools/Sequence 相似搜索部分) 蛋白序列(proteins) · Entrez蛋白 -用accession number,作者姓名,物种,基因/蛋白名字,以及很多其它的文本术语来搜索蛋白序列记录(在GenPept + Swiss-Prot + PIR + RPF + PDB中)。更多的关于Entrez的信息见下。如果要检索大量数据,也可使用Batch Entrez(批量Entrez)。 · RefSeq - NCBI数据库的参考序列。Curated, 非冗余集合包括基因组DNA contigs,已知基因的mRNAs和蛋白,在将来,整个的染色体。Accession numbers用NT_xxxxxx, NM_xxxxxx, NP_xxxxxx, 和NC_xxxxxx的形式来表示。 · FTPGenPept - 下载"genpept.fsa.Z"文件,这个文件包含了从GenBank/EMBL/DDBJ记录中翻译过来的FASTA格式的氨基酸序列,这些记录都有一到两个CDS特性的描述。 · Conserved Domain Database (CDD) - 蛋白质经常包含若干模块或域,每个有不同的进化源及功能。CD-Search 服务可用来标记保存域中的蛋白质序列。 完整的基因组 · 参见 Genome 和 Maps 部分,包括各种物种资源,人,小鼠,大鼠,酵母,线虫,疟原虫,细菌,病毒,viroids,质粒。 · Entrez基因组 - 提供了一个编码区的概要和各种物种的分类表(TaxTable)。编码区概要列出了在基因组中所有的的蛋白,并提供链接到FASTA文件和BLAST。分类表总结了蛋白BLAST分析的结果,建议他们的可能功能,并用颜色编码的图来显示物种同其它物种之间的关系(参见下面'Genomes和Maps,'部分Entrez基因组的一般描述) · FTP基因组蛋白 - 从ftp站点的genbank/genomes目录下下载各种物种的FASTA格式的氨基酸序列*.faa和蛋白表文件*.ptt。参见readme文件。蛋白表也可以在Entrez基因组中看到。 · PROW - Web上的蛋白资源,关于大约200种人类的CD细胞表面分子的简短官方向导。互相检索,为每个CD抗原提供大约20中标准信息的分类(生化功能,配体,等等) · BLAST - 将你的序列同蛋白库中的的序列比较,检索相似的序列。(更详细的信息见下面 Tools/Sequence 相似搜索部分) 结构(structures) · 结构主页 - 关于NCBI结构小组的一般信息和他们的研究计划,另外也可以访问分子模型数据库(MMDB)和用来搜索和显示结构的相关工具。 · MMDB:分子模型数据库 - 一个关于三维生物分子结构的数据库,结构来自于X-ray晶体衍射和NMR色谱分析。MMDB是来源于Brookhaven蛋白数据库(PDB)三维结构的一部分,排除了那些理论模型。MMDB重新组织和验证了这些信息,从而保证在化学和大分子三维结构之间的交叉参考。数据的说明书包括生物多聚体的空间结构,这个分子在化学上是如何组织的,以及联系两者的一套指针。利用将化学,序列,和结构信息整合在一起,MMDB计划成为基于结构的同源模型化和蛋白结构预测的资源服务。MMDB的记录以ASN.1格式存储,可以用Cn3D, Rasmol, 或 Kinemage来显示。另外,数据库中类似的结构已经被用VAST确认,新的结构可以用VASTsearch来同数据库进行比较。 · Cn3D - "See in 3-D", 一个用于NCBI数据库的结构和序列相似显示工具,它允许观察3-D结构和序列-结构或结构-结构同源比较。Cn3D用起来就象你浏览器上的一个帮助工具。 · VAST - 矢量同源比较搜索工具-一个在NCBI开发的计算算法,用于确定相似的蛋白三维结构。每一个结构的"结构邻居"都是预先计算好的,而且可以通过MMDB的结构概要页面的链接访问。这些邻居可以用来确认那些不能被序列比较识别的远的同源性。 · VAST 搜索 - 结构-结构相似搜索服务。比较一个新解出的蛋白结构和在MMDB/PDB数据库中的结构的三维坐标。VAST搜索计算一系列可能会被交互浏览的结构邻居,用分子图形来观察重叠和同源相似。 分类学(taxonomy) · NCBI的分类数据库主页 - 关于分类计划的一般信息,包括分类资源和同NCBI分类学家合作的外部管理者的列表。 · 分类浏览器 - 搜索NCBI的分类数据库,包括大于70000个物种的名字和种系,这些物种都至少在遗传数据库中有一条核酸或蛋白序列。可以检索一个特定种或者更高分类(如属,科)的核酸,蛋白,和结构记录。如果有新物种的序列数据被放到数据库中,这个物种就北加到(分类)数据库中。NCBI的分类数据库的目的是为序列数据库建立一个一致的种系发生分类学。 · 分类 BLAST - 详细的信息见下面 Tools/Sequence 相似搜索部分。 |
5楼2006-11-11 16:07:13
6楼2006-11-12 10:17:17
7楼2006-11-12 10:58:23
dongzw
金虫 (正式写手)
- 应助: 0 (幼儿园)
- 金币: 1459.8
- 散金: 166
- 帖子: 793
- 在线: 16.6小时
- 虫号: 119076
- 注册: 2005-11-27
- 性别: GG
- 专业: 基因组学

8楼2006-11-16 19:17:25
9楼2006-12-03 17:28:04
10楼2006-12-03 22:12:05













回复此楼
