24小时热门版块排行榜    

CyRhmU.jpeg
查看: 3378  |  回复: 11

cnlics

木虫 (小有名气)

[交流] 【原创】从头建模和从头计算已有6人参与

“从头”这个名词,学化学的人更熟悉,量子化学、量子力学中,利用薛定谔方程解析波函数,进而计算原子、分子的能量状态分布,是十分常见行为,这对于研究蛋白质结构的人来说,实在是太有诱惑力了,因为很显然地,如果能计算出蛋白质结构,从实用性这一点来说,谁计算得多,意味着谁就能发现、拥有更多的药靶。但受限于目前的计算能力,对蛋白质或者较大的肽段进行波函数计算需要的时间非常长,在实际工作中要做大量简化,引入分子动力学方法,使得计算蛋白质结构成为可能,随着计算机计算的进步,蛋白质结构计算方法也会一直进化着。

“从头”这个词对应的拉丁语翻译为ab initio,当然,也可以是更为粗略的理解,比如理解为de novo。对于精细的化学计算方法,学生物的一般会感觉头疼的,米氏方程已经是生化中相当复杂的公式了,多变量方程中,系数的拟合、参数求解会难到一大批学生物的。我把以前整理的东西发出来,可能会加上一些说明,希望纯粹学生物的人能理解,更希望能利用现成的一些工具实现自己的目的,也因为此,帖子就不放在“分子模拟”目录下了,希望能起到抛砖引玉的作用。

内容提要:

第一部分  蛋白质结构与分子建模
第二部分  蛋白质结构建模基础
第三部分  从头预测方法
第四部分  Rosetta方法
第五部分  从头计算

[ Last edited by cnlics on 2010-9-16 at 15:23 ]
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
回帖支持 ( 显示支持度最高的前 50 名 )

cnlics

木虫 (小有名气)

第二部分 蛋白质结构建模基础

2.1建模一般过程见下图


2.2结构建模方法:
•从头建模
•比较或同源建模
•折叠识别或者穿针引线(threading)方法

2.3力场决定分子折叠机理
力场是一种描述分子构象或者说原子坐标决定分子能量的数学函数。力场是分子内部化学键的拉伸,弯曲,扭曲以及范德华力、静电相互作用等作用的总和。

常用力场有:
CHARMM (Harvard)                            http://yuri.harvard.edu/
GROMOS96 (Groningen/ETHZ)            http://www.igc.ethz.ch/gromos
AMBER (Scripps)                                http://amber.scripps.edu
SYBYL                                                 Tripos Inc.
DISCOVER                                         MSI Inc.
……..

2.4非键相互作用(即,不是通过化学键而产生的作用)
•静电相互作用。计算方法是:

•氢键作用。计算方法:

•疏水作用。计算方法为HINT

•范德华力:利用Lennard-Jones函数计算


2.5简化的结构模型方法
•格点模型
•离散状态非格点(off-lattice)模型
•通过局部结构预测,减少构象搜索空间

Bonneau R. et al.Annu. Rev. Biophys. Biomol. Struct. 30:173–89 (2001 )

2.5.1格点模型:简化方法为,用格点表示肽链
优点:分析、计算简单
缺点: 难以表示精细的几何取向(例如链扭曲);骨架结构精确性不会超过格点间距的一半。


2.5.2离散状态格点模型

降低复杂度的方法:仅允许特定的支链构象且肽链的化学键转动受限(即将支链限定为单一的构象;肽链骨架限定为特殊的φ/ψ角度组合等)

缺点: ω角总是平面角(0或者180°)

2.5.3通过局部构象预测,限定总体构象搜索空间
降低复杂度的方法:利用局部构象的偏向性(biases)或者序列基元(motif)降低复杂度

缺点:局部构象的偏向性(biases)程度、强度非常依赖序列;不同的序列中,序列基元非常倾向于采取单一的局部构象

2.5打分函数
基于溶剂化的打分方法:总结已知蛋白质中各位点的溶剂化程度;弄清各氨基酸在各位点出现的频率。
配对相互作用:某俩残基有多大可能互相靠近
二级结构安排:打分评估二级结构的元件之间匹配的程度。

[ Last edited by cnlics on 2010-9-18 at 19:42 ]
3楼2010-09-14 00:55:43
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通回帖

cnlics

木虫 (小有名气)

第一部分 蛋白质结构与分子建模

分子建模对象可以分为大、小分子两类:
•大分子:蛋白质,酶,聚合物,DNA等
•小分子:水分子,普通有机、无机化合物,药物,除草剂,杀虫剂等

分子建模内容包括:
•显示分子
•研究构象、结构
•研究分子性质
•预测新分子的性质
•分子比较
•研究分子相互作用
•研究反应机理
•预测反应机理

1.1 蛋白质的结构层次和结构元件
•活性位点,模块,结构核心,折叠
•结构域,结构基元
•家族,超家族
•结构元件
•结构的类型
•1-4级结构

1.2 蛋白质结构分类规律:拉氏图(Ramchandran plot)


1.3结构相关的假设与实践
结构假设:
•蛋白质的肽链会折叠形成唯一的3D结构
•处于自由能最低状态
•不同的序列,可以有相同的折叠方式
•结构形成存在驱动力

实践经验:
•蛋白质天然结构与未折叠状态之间的能量差别非常小
•蛋白质的天然结构往往不是能量最低状态,但与其他可能的结构相比,最接近最低自由能状态

[ Last edited by cnlics on 2010-9-18 at 18:40 ]
2楼2010-09-14 00:41:44
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

cnlics

木虫 (小有名气)

Part III: ab initio prediction methods
3.1 Scoring functions
Molecular Dynamics simulations(MD)
Monte Carlo (MC) simulations
Pathway Models
Combined Hierarchical Approach
Genetic Algorithms
more…….

3.2 Ab initio prediction:Using pathway models
Pathway models combine the scoring function and the search.
HMMSTR-CM: a fragment library (knowledgebased potentials ) + a set of nucleation/propagation-based rules(for building a protein contact maps)

3.3 Ab initio prediction: TOUCHSTONE
                                 ----- threading based tertiary restraints


SICHO (SIde CHain Only) model
Prediction of tertiary restraints:side chain contact(PROSPECTOR); consensus contacts
Structure selection with an atomic potential:Monte Carlo simulations;

Kihara D. et al .PNAS , 98  (18) :10125–10130(2001)

3.4 Ab initio prediction: Combined Hierarchical Approach
highly simplified tetrahedral lattice model:all-atom models
combined allatom knowledge-based scoring function:three smaller subsets
consensus-based distance geometry procedure
Samudrala R. et al.PROTEINS: Structure, Function, and Genetics Suppl 3:194–198 (1999)

3.5 Ab initio prediction: more….
Distance geometry-based
Ramachandran Plots-based
Rosetta

Huang ES et al. J. Mol. Biol. (1999) 290, 267-281.
Bernasconi A. et al.ERCIM News No.43 (2000 )
4楼2010-09-14 00:59:20
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

cnlics

木虫 (小有名气)

Part IV: Rosetta

4.1 What’s CASP:Critical Assessment of Structure Prediction (homology modeling, threading, and ab-initio)


Every two years in Dec, community-wide blind test of prediction methods
Experimentalists announce some protein sequences that they are going to resolve structurally
CASP put these sequence on web for pediction with deadline
Computational biologists submit their predictions
CASP evaluates the predictions according to the results resolved by experimentalists


http://PredictionCenter.llnl.gov/caspi/  ( i = 1,2,3,4,5. )
http://www.forcasp.org/


4.2 Rosetta at CASP:an example taken from CASP5


4.3 Rosetta : the method

Model:        Narrow the search with local structure Prediction
Scoring function(Solvation-based & Pair interactions)        
Method outline (two steps)
Get tiny pieces:sequence profile alignment
Put them together:Monte-Carlo method;                 Bayesian scoring function


Chivian D. et al.PROTEINS: Structure, Function, and Genetics 53:524–533 (2003)

4.3.1 Get tiny pieces:Construction of I-sites library

Assumption Distribution of conformations sampled for a given nine residue segment of the chain is reasonably well approximated by the distribution of structures adopted the sequence(and closely related sequences) in known protein structures.
Method Fragment libraries for each three and nine residue segment of the chain are extracted from PDB using sequence profile alignment

4.3.2 Get tiny pieces: construction procedure
Construct profiles (PSI-BLAST like) for each solved structure
Collect each possible segments of fixed length (len = 3, 9, 15)
Perform k-means clustering of segments
Check each cluster for a “coherent” structure (in terms of dihedral angles
Prune incoherent structures
Iteratively refine remaining clusters by removing structurally different segments, redefining cluster membership, etc.

4.4.1 Put them together: Procedure

For representative proteins, backbones were assembled from a library of 1000 different 5-residue fragments.

4.4.2 Put them together: Monte Carlo
Search the resulting conformational space with Monte-Carlo method
Bayesian scoring function:Chose the most likely structure given the sequence:

4.4.3 Put them together: Scoring Function

4.5 Using Rosetta: Comparative modeling
Detection of the best parent for each putative domain: Blast or PSI-Blast parents or Pcons parents
Sequence alignment to that parent: K*SYNC (kitchen sink)
Modeling of structurally variable regions:match with DSSP assigned secondary structure
Optimization to increase the physical reasonableness of the final model:fragment replacement and random angle perturbations
Reassemble the complete chain when domains were parsed and processed individually:evaluated by a coarse energy function


4.6 Using Rosetta: De Novo structure predictions
Fragment libraries for each three and nine residue segment
Monte Carlo procedure with energy function favoring compact structures, buried hydrophobic residues, and paired beta strands

low free energy models : MC Minimization procedure to relieve backbone atomic clashes
MC minimize an all-atom energy function
Bonneau R. et al.J. Mol. Biol. (2002) 322, 65–78

4.7 Using Rosetta: Automated Method for Full Chain Structure Prediction
Robetta: de novo, comparative, or mixed models
Secondary structure prediction from the JUFO-3D method
5楼2010-09-14 01:20:03
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

cnlics

木虫 (小有名气)

Part V: ab initio calculation ----Quantum Mechanics

5.1 Quantum mechanics
ab initio calculation:
computer storage capacity
processor performance

5.2 Schrödinger equation
Approximations:
Born-Oppenheimer approximation
Single particle approximation
Linear combinations of atomic orbitals (LCAO)
….

5.3 QM vs MD

5.4 Power of QM
• Bond and reaction energies
• Molecular energies and structures (thermochemical stability)
• Energies and structures of transition states (activation energies)
• Reaction pathways, kinetics and mechanisms
• Charge distribution in molecules (reactive sites)
• Substituent effects
• Electron affinities and ionisation potentials
• Vibrational frequencies (IR and Raman spectra)
• Electronic transitions (UV/Visible spectra)
• Magnetic shielding effects (NMR spectra)
diverse and novel chemical environments
transition states and chemical reaction

5.5 Weak of QM
Large molecules (n ~ 10-30 atoms) :
possible using the basic theory (i.e., Hartree Fock approximation) with minimal basis sets, whereas calculations on chemical reactions between simple diatomic molecules can be performed with state-of the-art model chemistries
Very large systems (n ~50 atoms or more):
only possible with less sophisticated models

Waiting for more powerful computer……
6楼2010-09-14 01:22:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sunwm9

木虫 (小有名气)


小木虫(金币+0.5):给个红包,谢谢回帖交流
好像很有意义,但我没看懂。辛苦了!!!
7楼2010-09-14 07:12:34
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

dingxianlo

金虫 (正式写手)

感觉不错,可惜我知识太狭窄没看懂!! 不过
未来掌握在自己手中,希望通过这个网站认识更多的朋友,能在学习、工作、生活上相互帮忙。爱拼才会赢!
8楼2010-09-19 11:01:30
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

无风的小屋

金虫 (小有名气)


小木虫(金币+0.5):给个红包,谢谢回帖交流
LZ发帖子,弄个超链接不久得了吗?总是连续发好几个。你应该是搞structure  of  protein.
Nocross,nocrown.
9楼2010-09-19 15:24:17
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

cnlics

木虫 (小有名气)

这是我以前找材料写的东西,网上没有链接。
10楼2010-09-19 17:06:28
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 cnlics 的主题更新
普通表情 高级回复(可上传附件)
信息提示
请填处理意见