24小时热门版块排行榜    

查看: 722  |  回复: 2
当前主题已经存档。

ssjyming

铁虫 (初入文坛)

[交流] 蛋白质的结构预测和分子设计

蛋白质的结构预测和分子设计

来鲁华 徐筱杰  唐有祺

(北京大学化学系 100871)

1.蛋白质结构预测和分子设计的必要性

蛋白质所具有的功能在很大程度上取决于其空间结构,因此对于蛋白质空间结构的研究在蛋白质工程中有着极其重要的意义。X射线晶体学方法是至今为止研究蛋白质结构最有效的方法,所能达到的精度是任何其他方法所不能比拟的,它的缺点是蛋白质的晶体难以培养,晶体结构测定的周期较长。近年发展起来的多维核磁共振方法可以直接测定蛋白质在溶液中的构象,但是由于对样品的需要量大、纯度要求高,被测定的蛋白质的分子量一般不超过20000等原因,也受到很大限制。相比之下,蛋白质氨基酸序列被测定的数目由于DNA测序的实现而高速增长,生物工程的发展又迫切需要从结构上来认识所研究的对象,从而更有目的地对蛋白质进行改造。对蛋白质结构的研究是现代分子生物学的基础之一,可以说分子生物学所进行的一切研究都离不开结构信息做指导。因而迫切需要一种不依赖晶体培养、迅速、简便易行的测定蛋白质结构的方法。利用蛋白质的一级结构所提供的氨基酸序列信息来进行高级结构预测的方法就是应这种需要而发展起来的。

实验表明某些蛋白质在体外的一定条件下解聚失活后可以自动折叠而恢复其原有高级结构与活性,这也就意味着蛋白质的氨基酸序列及环境决定其三维构象。C.B.Anfinsen等人早在1961年就指出了这一点。虽然近年来对蛋白质在体内折叠过程的研究发现体内有“分子伴侣”参与其过程,但“分子伴侣”在蛋白质分子伸展与折叠过程中可能只是起到了消除不正确折叠与促成正确折叠的作用,或者只是起到了稳定折叠中间体的作用,有关蛋白质高级结构的信息仍全部包含在其一级结构中。蛋白质的一级结构决定高级结构这一论点,仍然是进行蛋白质结构预测的理论基础。

2.蛋白质结构预测的有关手段

蛋白质的结构预测是目前分子生物学研究中迫切需要解决的问题。已有许多科学家致力于这方面的工作。北京大学化学系结构化学实验室在这方面也开展了不少工作,但由于蛋白质结构的复杂性,至今尚未有人找到类似于DNA与蛋白质序列对应关系的密码子。目前的结构预测工作还是基于对已知蛋白质结构规律的总结、吸收、利用,即所谓的“基于结构知识的蛋白质结构预测”(Knowledge-Based Protein Modeling)。蛋白质结构预测研究的发展大体可分为两个阶段。

第一阶段属于对蛋白质空间结构进行消化的阶段 随着蛋白质晶体结构数据的积累,人们对于蛋白质的空间结构进行了大量的研究和分析,得出了许多经验规律。例如,蛋白质的结构可分为4类:α,β,α/β,α+β;典型β蛋白质的结构由2个β折叠片构成,疏水残基侧链伸向2个β片的内部而构成疏水性核心;典型α蛋白的结构有α螺旋束等;α+β类蛋白的结构则是由2个平行的β折叠与1个α-螺旋构成的结构单元而形成的;β-转角(β-turn)可以分为Ⅰ、Ⅰ′、Ⅱ、Ⅱ′、343Ⅲ等类型,这就使得人们对蛋白质的高级结构有了较为深入的认识。这方面的工作在蛋白质晶体学发展的初期就开始了,现在仍在继续。随着新蛋白质晶体结构的测定以及对原有数据更深入的分析,不断有新的结构类型被发现,对蛋白质结构规律的认识也将更加深入。同时也有人对已有的晶体结构数据进行了统计处理,发展了从蛋白质的一级结构预测其二级结构的方法。在以后的20多年中关于二级结构预测的方法又有了不少发展,但总的来说准确度均不超过65%,成为蛋白质空间结构预测的一个制约条件。

第二阶段主要是试图利用理论计算的方法得到蛋白质的高级结构模型分子力学方法在处理小分子体系上的成功运用,激励着人们开始将其应用到蛋白质及核酸体系中,所根据的基本原理是蛋白质的活性构象对应于体系自由能最小的状态,在某种条件下也可认为是能量最小的状态。但由于蛋白质体系庞大,可变参数繁多,数学处理上的整体极小问题难以解决,所以无论是能量优化方法还是以后发展起来的分子动力学方法都无法从理论上解决使蛋白质折叠成正确构象的问题,只能进行在已有大体正确的结构参数后的局部结构优化或动力学模拟。利用理论计算方法直接从一级结构得出蛋白质的空间结构的努力就目前的情况来看还有很大的困难。

在理论上遇到了一时难以跨越的障碍后,人们又回过头来在已有的晶体结构数据中寻找规律。近年来新发展起来的一些方法以及构建三级结构的方法都基于实验数据的积累。例如二级结构预测的模式匹配方法就是在分类总结了已知结构蛋白质结构规律的基础上建立的。最近发展起来的利用神经网络算法进行二级结构预测的方法也是先对已有的结构进行学习,然后在此基础上进行预测。虽然仅靠一级结构的氨基酸序列信息的从头预测方法目前还存在着许多困难,但借助于一些其他信息还是可以成功地建立起立体结构模型的。这方面最为成功的一个例子就是T.Blundell等发展的利用同源蛋白质的结构进行结构预测的方法,其原理是同一家族中的蛋白质结构和功能类似,利用同族中已知的蛋白质结构就可以建立起未知结构蛋白质的模型。作者所在的实验室对同源蛋白结构预测方法进行了改进,其计算流程见下图。



3.蛋白质结构预测方法的应用条件与范围

目前的研究工作尚未达到直接从蛋白质的序列就可以预测出其高级结构的水平,还需要长期不懈的努力,但在某些方面已经有了突破。可以进行的工作大体上可以分为以下几类:

(1)在已知结构(如晶体结构)的基础上利用分子动力学方法研究蛋白质分子、核酸分子或复合物的动态性质。

(2)利用能量优化或分子动力学方法对结构模型进行优化(以消除某些不合理之处);或者是在整体结构已知的情况下建立点突变体的结构。

(3)借助于类似物的结构参数建立未知蛋白质的结构。

(4)结合2D-NMR数据或X-RAY粗结构数据或其他的实验数据建立蛋白质的整体模型结构模型。

(5)在上述条件均不符合的情况下,根据一级结构进行二级结构预测,准确度<65%。

(6)在已知二级结构的基础上(二级结构预测的准确度是目前一个难以逾越的障碍)进行片段堆积,根据从已知结构得出的一些规则进行筛选,挑选可能的结构,往往得到多种可能性,尚不能得到唯一的正确堆积方式。

(7)建立复合物或多聚体的结构(在单体结构已知的情况下),参考复合物或聚合物本身的性质,利用几何匹配和最大接触面积规则进行。

4.蛋白质分子设计

蛋白质的分子设计就是为有目的的蛋白质工程改造提供设计方案。虽然经过漫长岁月的进化,自然界已经筛选出了数量众多、种类各异的蛋白质,但天然蛋白质只是在自然条件下才能起到最佳功能,在人造条件下往往就不行,例如工业生产中常见的高温高压条件。因而需要对蛋白质进行改造,使其能够在特定条件下起到特定的功能。蛋白质的分子设计又可按照改造部位的多寡分为三类:第一类为“小改”,可通过定位突变或化学修饰来实现;第二类为“中改”,对来源于不同蛋白的结构域进行拼接组装;第三类为“大改”,即完全从头设计全新的蛋白质(de novo design)。有关全新蛋白质设计的内容请参见文献,本文不赘述。

常见的蛋白质工程改造包括提高蛋白的热、酸稳定性,增加活性,降低副作用,提高专一性以及通过蛋白质工程手段进行结构-功能关系研究等。由于对蛋白质结构-功能关系的了解不够深入,成功的实例还不很多,因此更需要在蛋白质分子设计的方法学上开展深入研究。

蛋白质的分子设计可分为两个层次,一种是在已知立体结构基础上所进行的直接将立体结构信息与蛋白质的功能相关联的高层次的设计工作,另一种是在未知立体结构的情形下借助于一级结构的序列信息及生物化学性质所进行的分子设计工作。此处只探讨第一类分子设计,因为在利用三级结构信息的同时也运用了一级结构序列及有关生化信息,第一类的分子设计工作实际上已包含了第二类工作,而后者实际上是在不得已的情形下所进行的努力。

蛋白质分子设计的过程简单说来就是首先建立所研究对象的结构模型,在此基础上进行结构-功能关系研究,然后提出设计方案,通过实验验证后进一步修正设计,往往需要几次循环才能达到目的。一般的分子设计工作可以按以下五个步骤进行:

(1)建立所研究蛋白质的结构模型,可以通过X射线晶体学、二维核磁共振等测定结构,也可以根据类似物的结构或其他结构预测方法建立起结构模型。

(2)找出对所要求的性质有重要影响的位置。同一家族中的蛋白质的序列对比、分析往往是一种有效的途径。需要认真考虑此种性质受哪些因素的影响,然后逐一对各因素进行分析,找出重要位点,这是分子设计工作的关键。

(3)选择一系列的在(2)中所选出位点上改变残基所得到的突变体,一方面使蛋白质可能具有所要求的性质,另一方面又尽量维持原有结构,使其不做大的变动。尽量在同源结构中此位点已有的氨基酸残基序列中进行选择,同时考虑残基的体积、疏水性等性质的变化所带来的影响。

(4)预测突变体的结构。

(5)定性或定量计算优化所得到的突变体结构是否具有所要求的性质。能否成功地进行分子设计,除了要求有好的计算机软件和高质量的力场以外,还要求工作者有一个坚实的结构化学和物理化学基础,同时对所研究的问题有一个深入细致的了解。

5.北京大学蛋白质分子设计系统

虽然蛋白质分子设计是生物工程中必不可少的一个环节,国际或国内也都进行了大量的工作,但迄今为止尚没有一个完整的分子设计系统,多为孤立的、互不相通的程序或数据库,给蛋白质分子设计工作造成了很大的不便。因此我们着手研制了一个蛋白质分子设计系统,力图将我们自行研制的程序、第二代数据库和引进的程序与数据库统一到一个系统中来,一方面便于成果推广,另一方面也为用户更快更好地进行蛋白质的分子设计提供了方便。

北京大学蛋白质分子设计系统(PEPMODS:PekingUniversityProteinMolecularDesignSystem)立足于集中现有的各种蛋白质结构预测和分子设计的方法,尽可能多地为用户提供方便。鉴于目前蛋白质的结构预测和分子设计方法主要是在现有结构数据的基础上进行的分层次的预测和计算,因此将整个分子设计系统分为两大部分——蛋白质结构信息相关数据库和蛋白质分子设计程序包。蛋白质结构信息相关数据库是在引进数据源的基础上自行研制的高分支相关数据库,可方便地对于蛋白质、核酸和多肽的序列及结构信息进行查询,还具有多种结构比较和描述的功能,为蛋白质的分子设计提供了可靠的基础。蛋白质分子设计程序包包含有自行研制的及引进的各种蛋白质结构预测和分子设计程序,主要按照蛋白质分子设计的层次分为序列分析、二级结构预测、同源蛋白质结构预测、蛋白质突变体结构预测、蛋白质的性能预测和蛋白质的分子设计六个部分,可以较为全面地为蛋白质的分子设计提供服务。

整个分子设计系统设计成菜单驱动式,用户可以很方便地从菜单上选择自己所需要的功能。蛋白质分子设计系统VAX版本以VAX-11VMS操作系统为依托,主要由FORTRAN和C语言写成。要求机器内存大于8MB,硬盘大于400MB,其中硬盘的容量可以根据用户对数据库的不同需求而进行调整。由于目前蛋白质结构、功能预测及分子设计还远未完善,因此,北京大学蛋白质分子设计系统也需要进一步的发展、补充和完善。 
回复此楼

» 收录本帖的淘帖专辑推荐

交叉知识

» 猜你喜欢

» 本主题相关商家推荐: (我也要在这里推广)

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

labrat

木虫 (著名写手)

0.5

thanks, good info! have any more in english?
2楼2006-05-24 12:01:27
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

robertxu

1

,楼主能不能把书给我发一份,非常感谢!robertxu1@sina.com
3楼2006-05-24 21:47:48
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 ssjyming 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见