24小时热门版块排行榜    

查看: 13631  |  回复: 44
本帖产生 9 个 模拟EPI ,点击这里进行查看

奋斗1s

金虫 (正式写手)


[交流] 分子模拟时间越长越好吗?

如题,在对蛋白质做分子动力学模拟的时候,我用Gromacs先进行了3ns的MD运算,然后又进行了2ns,对接结果发现后者不如前者,但通过蛋白质评价发现后者的各项指标要好一些,请各位高手讨论一下MD多长时间比较好呢?
回复此楼

» 收录本帖的淘贴专辑推荐

分子模拟 模型 - 模拟 - 统计 - 热力学 MDs-Gromacs 计算
gromacs 蛋白模拟与改造 分子模拟 精华帖转载
分子模拟 PBS作业排队系统 计算化学 分子动力学模拟

» 本帖已获得的红花(最新10朵)

» 猜你喜欢

» 本主题相关商家推荐: (我也要在这里推广)

» 本主题相关价值贴推荐,对您同样有帮助:

» 抢金币啦!回帖就可以得到:

查看全部散金贴

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
回帖支持 ( 显示支持度最高的前 50 名 )

ChemiAndy

木虫 (正式写手)



奋斗1s(金币+1):谢谢参与
奋斗1s(金币+10): 很详细,谢谢这位兄弟的指点呀! 2011-07-01 08:21:38
平衡态模拟的时间长度取决于所感兴趣的性质的弛豫周期。获得感兴趣性质的的统计平均值,需要在不同的弛豫周期采样3-10次。比如,键的振动,振动一次10fs算一个周期,你需要采样至少50fs。分子扩散的数量级在ns,中等肽链loop-closing需要10ns数量级,形成alpha螺旋的弛豫周期在200ns量级,beta结构在1-10微秒,等等。

弛豫周期的长度取决于某种运动的持续多久以后就与先前的状态无关了,或者忘记了。所有的运动都有多个状态,这个运动所要穿越的自由能垒,决定了该运动的弛豫周期。这就是为什么我们可以模拟一个过程(如蛋白质折叠)的平均特征时间,根据阿伦尼乌斯公式,反推自由能垒。

然而,平均特征时间为200ns的过程,并不意味着你跑200ns就一定能模拟到该过程的发生。它能否向你要的最终态跑去,也是个概率问题。可能很快跑过去,也可能很慢,甚至完全跑不过去,即使能垒不高。因为你只有少数几个分子阿。而实验观测的是10^23数量级的分子的统计结果。不过一般来说,采样时间取特征时间的10倍以上,都可能获得感兴趣的性质的良好的平均值。

那么,如何知道一个过程或某个性质的平均驰豫时间呢?以体积弛豫为例,如果你plot整个体积数据随时间变化的曲线,你会看到体积在平均值上下浮动。它受到盒子内分子相互作用,振动,扩散的内在驱动,有多种频率的波动。瞬时的波动是受分子振动驱动的的,而缓慢的,长周期的上下浮动是受到分子聚合,扩散驱动的,但是不容易看出来。怎么估计这种缓慢浮动的周期呢?有几种方法估计:

一是计算相关函数,看看相关函数中,从任一时刻开始,体积数据之间需要多久时间就不再有相互的关联了(相关函数值趋近于0); 这段时间长度,就是特征弛豫时间;该方法适合与考察扩散运动的时间特征,计算自扩散系数,黏度等。

第二种方法是block avergage方法,看看多大的block计算得到的均方偏差RMSD与你取的block size无关。做法是把你的trajectory分成很多等长的小段,每一段称为block, 每段长度称为block size, 有的称window size(e.g., 5ps),对于每一种block size的取法(比如,5ps, 10ps, 15ps, 20ps....),你计算每个block的平均值average,根据所有的block average你可以得到它们的均方偏差RMSD,Plot你的RMSD随block size变化的曲线,你会发现,曲线逐渐升高,但在某个size(比如20ps)之后成为平台区,与window size无关了(再之后会剧烈升降,进入混沌状态),那么该性质的特征弛豫时间为20ps。而20ps block得到的RMSD就是你对该过程或性质的相对误差。(很多人用全部数据的MSD做为误差,是不严密的。因为所谓独立测量,必须是测量结果之间没有相关性。我们MD模拟和实验测量一样,也要从不相关的各个block中间取值阿兄弟们)

第三种方法,计算波动谱。我们知道振动有振动谱,那波动自然也有波动谱。比如体积波动,将体积数据进行自相关计算,并做傅立叶变化,可以得到一个谱图。上面有一系列峰,在不同的频率上。不同频率即反映了波动的时间长短,而峰面积显示了与该频率的运动的相关性。面积最大的峰自然就是其特征峰了。根据其频率可以计算其运动的特征时间。(红外光谱就是这么计算的,它保留整个盒子的dipole,然后分解为很多不同频率的运动,不同频率的运动对应不同模式的振动,它们对盒子的总dipole的变化有贡献,傅立叶一分解就出来了)所以,只要是某种运动对某种性质有贡献,都可以通过对该性质的自相关函数-傅立叶变化分解出其特征频率,继而得到其特征时间。

PS,上面我用到驰豫时间relaxation time这个概念,它其实指的是体系受到特定能量的激发以后,逐渐衰退decay到正常状态所需的时间。因为这个时间是与受到激发的那种运动的运动周期直接相对应的,所以该体系没有受激发的时候,那种运动的周期也可以称relaxation time弛豫时间。

再次回到楼主提出的问题上,模拟时间是否越长越好。可以肯定的说是的,但是没有必要。且不说成本,机时,能量,地球,绿色啥的问题,单说分子动力学模拟本身,是揭示相关运动的时间特征,从而定量估算内在驱动的能量特征。 搞到蛋疼才够酷阿兄弟

[ Last edited by ChemiAndy on 2011-6-30 at 14:19 ]

需要说明的是,上面的讨论均是指采样阶段,隐含着模拟已达到平衡的要求。而审稿人要求模拟时间加长的,一般是因为担心体系并没有达到平衡,或者说担心体系停留在一个局部最小的亚平衡态。亚平衡态体系可能在几百个纳秒之后突然跳到另外一个亚平衡态。体系在多个亚平衡态之间跳跃是正常的。这样的多态体系很难定义其平衡态,因为很难预知究竟有多少个亚态,也不知道亚态之间的能垒有多高,所以唯一的办法就是尽可能的延长模拟时间。关于多态体系平衡的问题,囿于计算能力和研究周期限制,文献中较少涉及。
8楼2011-07-01 02:24:58
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ChemiAndy

木虫 (正式写手)


★ ★ ★ ★ ★ ★ ★ ★ ★ ★
zh1987hs(金币+10, 模拟EPI+1): 谢谢! 2011-07-01 19:48:29
引用回帖:
Originally posted by 奋斗1s at 2011-06-30 19:27:56:
我是模拟方面的新手,有很多地方不懂。您的回帖对我帮组很大,不知可不可以麻烦您给我介绍一下这方面比较实用的书籍或是传给我一些相关的资料呢?邮箱:xieyunfeng110@yahoo.cn

不知道你说的“实用”是指什么,不过我知道国内出版的书都死气沉沉,就是简单的知识摘抄和堆积。因此我建议你在学习的早期从国外的经典教材入手。

搞计算模拟研究,有3个层次的东西需要分清,即Science上的,Method和technique。每个层次都要有最好的教材在手!

- Science是你要解决的问题,比如蛋白质构象理论,离子水合理论,或者是材料设计理论,化学反应,能量存储等。它在你的研究中往往是个背景性的东西。抓住你的研究和本领域最前沿的概念,理论的关系,非常重要。一般来说,我们搞的东西往往仅仅是对它们其中某一个方面的验证,或应用,或拓展。这方面的书也因人而异。不过,所有的问题大体上可以分为热力学和动力学两大类。而物理化学就是你需要的东西。

- Method,或theoretical method是指分子模拟方法,是我们用于研究Science问题的工具。包括结构-能量理论(量子力学和分子力场)和模拟方法理论两大块。其中模拟方法(MD, MC)根源于统计热力学的系综理论。我们正在经历一个从经典唯象热力学方法向分子热力学方法过渡的时代,分子模拟是其中最重要的工具之一;如果能搞清为什么能把模拟结果转化为宏观观测结果,如何设计一个新的系综来模拟一个具体的问题,你就走在了历史的最前沿。不过,对于我们大多数人来说,并不搞方法,而是应用而已。方法已经在软件里了,我们跟在人家屁股后头混个文凭就好。有时候甚至懒得弄清这些方法是怎么回事。

- Technique是操作软件的技巧。怎么用MaterialsStudio, Gromacs, NAMD, 怎么用Gaussian,怎么搭盒子,怎么画图;它是其中最不重要的方面,却是耗费了我们95%时间的东西。以至于我们根本没有时间去考虑Science的问题,有木有?!!

回到你的问题上,我给你推荐几本经典教材。

(1) Introduction to statistical mechanics, David Chandler, 搞清系综理论以后,方知啥是分子模拟;这本书87年出版以后没动过。为什么?字字经典。现在做分子模拟的青年们都是看着本书成长起步的。

(2) Computer simulation of liquid, M.P. Alen 分子模拟的理论,算法,思想,数据处理,此书为圣经,不可不膜拜;常备一本,常伴一生。

(3) 其实最重要的我觉得还是一本好的物理化学书,能把热力学,动力学,量子化学,和光谱贯穿讲透,可惜我一直没有找到。国外的书我看的是Peter Atkins的,已经到了第8版。国内的物理化学教材,以复旦范康年的最好,可以最大程度上给你一个很全面的视野。但是国内物化书的通病是化学有余,物理不足;经典有余,统计不足。并且不下功夫再版。(不要看傅献彩的物化,它在我当年初次接触物化的时候投向我内心深处一个恐惧的阴影。多年以后我一直思考一个问题,傅老师,你为何在没有实际例子的情况下用一堆熵和焓的抽象概念去谋害一个个渴望学习的幼小心灵?您懂不懂平衡态与非平衡态,理想态与实际状态的区别?历史上提出可逆过程的根本目的是什么?物理化学方法看待世界的本质思想是什么?悲摧啊青年们)

从热力学到统计分子热力学,可以帮助我们从宏观走到微观,而光谱又帮助我们从微观回到宏观统计现象。所以统计和光谱很重要。光谱学,我并非指简单的红外选律,拉曼活性这些表面的东西,而是指原子的电子结构与外界电磁场(光子)的作用和响应,以及简洁无比的Fermi-Golden rule. 这个定律正是从分子原子运动的微观可测量的相关函数-傅立叶变换得到宏观观测结果的精髓。要充分理解,最好实际做一下这方面的模拟。但是这方面的教程很少。好在在Alen的书里面有提及。

Good luck!

PS: 上面提到的两本书(1)(2)在小木虫上应该很容易下载到。[ Last edited by ChemiAndy on 2011-7-2 at 00:26 ]
15楼2011-07-01 11:23:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wavingsea9911

木虫 (小有名气)


★ ★ ★ ★ ★ ★
奋斗1s(金币+1):谢谢参与
zh1987hs(金币+5, 模拟EPI+1): 谢谢 2011-07-01 19:49:20
奋斗1s(金币+4): 恩,谢谢您的指点! 2011-07-01 21:55:33
奋斗1s(金币+1): 2011-07-01 22:02:18
只对一个蛋白质构象进行的动力学模拟,一般用于对同源建模的结果进行构象优化,目标是去除模型中的高能键、高能角等不合理的构象。我假定楼主也是这个目的。那么时间是否越长越好呢?
  我个人认为不是这样。因为根本的一个问题就是,作为动力学模拟起点的模型构象未必是(或者说一定不是)该蛋白质的真实构象。以这个起点开始模拟过程,随着时间的推移,我们期望的结果是:该构象会向真实构象靠拢,最后稳定在真实构象上。但实际的情况更可能会是:各种构象偏差逐渐放大,最后稳定于一个完全不同于实际的构象,或者整个结构发生坍塌,发展成一团不知所以的肽链。
  另一个问题是溶剂体系的问题,如果在真空条件下对酶蛋白,特别是膜蛋白进行动力学优化,如果不加约束,很难得出正确的结果。
  但值得注意的是,错误的动力学模拟结果的蛋白质评价指标也可能会很好,因为动力学模拟一定会让体系向能量最低的方向发展。所以,蛋白质评价指标只是佐证,不是铁证。
  最后的结论是,用于蛋白质模型优化的动力学模拟,时间长短不是很重要,个人认为1-5ns都可以。关键是要对该蛋白的真实构象有一个概念,以此控制动力学模拟的走向,保证系统向正确的方向发展。
  8楼的阐述很细致,是很好的理论基础。遇到具体问题还要具体分析。
17楼2011-07-01 15:31:55
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ChemiAndy

木虫 (正式写手)


★ ★ ★ ★ ★
送鲜花一朵
zh1987hs(金币+5, 模拟EPI+1): 谢谢 2011-07-06 08:01:50
To yongleli大侠:

1,你所给文献的例子揭示的应该是模拟前“验证力场准确性”的重要性,而不是从根本上否定非极化力场。

该文献说是经典非极化力场不能反映蛋白-配体结合位点的一根关键氢键,然而使用极化力场就行,模拟与实验一致。俺觉得这不能称为“用传统的力场(非极化)本质上是不能正确模拟”,因为力场方法和所有的实验方法一样,不同的力场有其特有的精度precision和准确度Accuracy两方面。精度是说其采样的事件的能量可以精确到多大,准确度是相对平均值的偏差RMSD(误差)。采样精度由力场决定。采样准确度由模拟方法以及事件本身波动大小(不确定性)决定。

(2)力场的精确度precision决定所能模拟什么样的体系,性质,和过程

非极化力场的精确度在10kcal/mol的数量级(5~20kcal/mol)。极化力场可达1kcal/mol数量级。因此,简单说,如果一个体系,它两种状态的能量差在10kcal/mol,我们就能用力场来计算它在这两种状态下的分布概率的差。

具体到蛋白构型,单根氢键H-bond的能量恰在~10kcal/mol,在你所给文献中,非极化力场不能正确描述它完全有可能。

一般情况下,对于模拟蛋白构型,非极化力场还是能够胜任的,因为蛋白构型折叠与非折叠构型的能量差显然比较大,解折叠的过程的能垒也比较大。已发表的很多模拟已经告诉我们,非极化力场在模拟构型方面与实验的符合度是基本令人满意的。然而,如果要比较折叠状态下,个别位点的几何结构,这就取决于该位点不同结构的能量差,如果小于10kcal/mol,那么由于力场精度问题,得出的结果可能就是错误的。

再然而,错误也是有限的。想象一下我们拿了一个尺子,如果它的精确度是10cm,意味着测量值的十位上数字是精确的,个位上估计的,个位以下没有意义。假如我们用这个尺子比较一堆木棍的长度,那么,只要所有的木棍长度大于1cm,那么尽管我们不能准确知道每根木棍的长度,但是其相对长度还是能够依靠个位数字上的估计值比较得出。这恰如自由能的计算,自由能是用力场这根尺子,去测量每个构象的能量,从而得出在每种构象上的分布概率,再由概率确定各种性质,或者过程前后的热力学自由能差和动力学自由能垒。也就是说,如果构型的能量差虽然小于10kcal/mol,但是如果大于1kcal/mol,结果仍然具有一定意义。

上面力场精确度我讲的是数量级,因为不同力场质量也不一样。怎么办呢?模拟前要验证力场准确性。这也是前贴的重点。

总之,在当前非极化力场水平下,若该性质由能量小于10kcal/mol数量级的能量波动确定, 则定量预测实验值没有意义,但是,定性结果基本满意。


(3) 力场精确度对模拟时间的影响

对平衡态性质,模拟时间由该性质的弛豫周期决定;对非平衡过程的话,模拟时间由该过程的能垒决定。

[ Last edited by ChemiAndy on 2011-7-5 at 11:32 ]
29楼2011-07-05 23:42:45
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

leimiao_hit

木虫之王 (文学泰斗)



奋斗1s(金币+1):谢谢参与
分子模拟时间越长越好
3楼2011-06-30 17:34:47
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wavingsea9911

木虫 (小有名气)


引用回帖:
Originally posted by ChemiAndy at 2011-07-02 22:29:07:
感谢17楼补充。我在8楼说了很多,其实没有很好地回答楼主的问题,做Docking,模拟时间要多久。

Docking的本质是看看哪个药物小分子(底物)与蛋白的结合最好。我不知道楼主打算从哪几个方面来考察对接是 ...

感谢ChemiAndy在23楼做的进一步说明。目前的情况好像是,一个初学者的模糊问题引发了我和ChemiAndy向不同方向的深入讨论。我很怀疑目前的回复能对楼主解决他自己的问题起到多大的帮助作用。
  更深入的讨论对于这个帖子来说可能会有离题过远之嫌,我建议不妨开一个新帖,讨论不同情况下MD时间长度的选择问题。看来这个话题的关注度还是非常高的。
25楼2011-07-03 21:14:05
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通回帖

奋斗1s(金币+1):谢谢参与
奋斗1s(金币+5): 2011-07-01 08:07:24
引用回帖:
Originally posted by 奋斗1s at 2011-06-30 16:00:04:
如题,在对蛋白质做分子动力学模拟的时候,我用Gromacs先进行了3ns的MD运算,然后又进行了2ns,对接结果发现后者不如前者,但通过蛋白质评价发现后者的各项指标要好一些,请各位高手讨论一下MD多长时间比较好呢?

“对接结果发现后者不如前者”

如何判断结果的好与坏呢?难道模拟的结果是我们主观预期的就是好的,否则就不是好的?

比如说你从两个不同的初始构象出发,运行相同时间的MD,一个观测到对接,而另一个没有对接。那么,你的结论是第一个模拟比第二个结果要好?
2楼2011-06-30 17:08:06
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

caoximin

禁虫 (正式写手)


奋斗1s(金币+1):谢谢参与
本帖内容被屏蔽

12楼2011-07-01 08:04:34
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

奋斗1s

金虫 (正式写手)


引用回帖:
Originally posted by yahoohoo at 2011-06-30 17:08:06:
“对接结果发现后者不如前者”

如何判断结果的好与坏呢?难道模拟的结果是我们主观预期的就是好的,否则就不是好的?

比如说你从两个不同的初始构象出发,运行相同时间的MD,一个观测到对接,而另一个没 ...

我这样做MD相当于第二次以第一次为基础,初始构象确实不同,但我是想要对接结果的,请您指点一二,
13楼2011-07-01 08:11:47
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

奋斗1s

金虫 (正式写手)


引用回帖:
Originally posted by ChemiAndy at 2011-07-01 02:24:58:
平衡态模拟的时间长度取决于所感兴趣的性质的弛豫周期。获得感兴趣性质的的统计平均值,需要在不同的弛豫周期采样3-10次。比如,键的振动,振动一次10fs算一个周期,你需要采样至少50fs。分子扩散的数量级在ns,中 ...

我是模拟方面的新手,有很多地方不懂。您的回帖对我帮组很大,不知可不可以麻烦您给我介绍一下这方面比较实用的书籍或是传给我一些相关的资料呢?邮箱:xieyunfeng110@yahoo.cn
14楼2011-07-01 08:27:56
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hyliao

铜虫 (小有名气)


★ ★ ★
奋斗1s(金币+1):谢谢参与
zh1987hs(金币+2): 谢谢 2011-07-01 19:48:44
奋斗1s(金币+5): 谢谢指点 2011-07-01 21:54:30
模拟的时间可以先大概试一下不同的时间,得到不同时间的情况。如果也达到动态平衡那就没必要再增加时间了。是否达到平衡最后可以用nve测试一下。如何能量没有漂移那么应该就达到平衡了。
16楼2011-07-01 14:00:59
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

奋斗1s

金虫 (正式写手)


引用回帖:
Originally posted by ChemiAndy at 2011-07-01 11:23:12:
不知道你说的“实用”是指什么,不过我知道国内出版的书都死气沉沉,就是简单的知识摘抄和堆积。因此我建议你在学习的早期从国外的经典教材入手。

搞计算模拟研究,有3个层次的东西需要分清,即Science上 ...

好的,再次感谢您,它(系统)不让我给您金币了,不过您也不会在乎,呵呵)
18楼2011-07-01 21:52:35
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

奋斗1s

金虫 (正式写手)


引用回帖:
Originally posted by hyliao at 2011-07-01 14:00:59:
模拟的时间可以先大概试一下不同的时间,得到不同时间的情况。如果也达到动态平衡那就没必要再增加时间了。是否达到平衡最后可以用nve测试一下。如何能量没有漂移那么应该就达到平衡了。

我想问您一下那个nve是什么软件?怎么使用?可以给我简单说一下吗?
19楼2011-07-01 21:54:46
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ChemiAndy

木虫 (正式写手)


editing....

[ Last edited by ChemiAndy on 2011-7-1 at 14:48 ]
20楼2011-07-02 02:20:52
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hyliao

铜虫 (小有名气)


★ ★ ★
奋斗1s(金币+2): ok thanks a lot! 2011-07-02 08:44:03
zh1987hs(金币+3): 谢谢 2011-07-02 09:57:31
引用回帖:
Originally posted by 奋斗1s at 2011-07-01 21:54:46:
我想问您一下那个nve是什么软件?怎么使用?可以给我简单说一下吗?

nve不是什么软件,而是微正则系综。它的意思保持粒子数,体积,能量不变。
如果结构没达到平衡态,能量就会漂移。很多分子模拟的软件都有,只需要根据不同软件的使用格式调用就行了。比如我用的是lammps。命令如fix 1 all nve.(1代表自定义的一个编号,all代表我定义的一个组,nve则为该命令的保留字)。
21楼2011-07-02 07:27:28
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

huanghl2010

木虫 (著名写手)


★ ★
奋斗1s(金币+1):谢谢参与
zh1987hs(金币+1): 谢谢 2011-07-02 16:41:50
当然时间越长越好。但得考虑时间成本和计算成本啊
22楼2011-07-02 10:51:36
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ChemiAndy

木虫 (正式写手)


★ ★ ★ ★ ★ ★ ★ ★ ★ ★
zh1987hs(金币+10, 模拟EPI+1): 谢谢CHEM 2011-07-02 23:28:30
引用回帖:
Originally posted by wavingsea9911 at 2011-07-01 02:31:55:
只对一个蛋白质构象进行的动力学模拟,一般用于对同源建模的结果进行构象优化,目标是去除模型中的高能键、高能角等不合理的构象。我假定楼主也是这个目的。那么时间是否越长越好呢?
  我个人认为不是这样。因为 ...

感谢17楼补充。我在8楼说了很多,其实没有很好地回答楼主的问题,做Docking,模拟时间要多久。

Docking的本质是看看哪个药物小分子(底物)与蛋白的结合最好。我不知道楼主打算从哪几个方面来考察对接是否“好”,好不好有很多定性和定量的指标。最常用的热力学指标有平均能量差(焓变),和结合自由能。不过,最重要的还是要看你的底物和结合位点的功能关系。比如有的结合位点的功能是要打开蛋白的通道的,那对接后通道尺寸就是主要指标;有的位点是催化反应的,那么就要求结合构型有利于反应,结合自由能再大也不行滴。

从楼主模糊的描述来看,似乎有能量或自由能(“对接结果”)和蛋白构型(“蛋白质评价”)两种评价标准。而且后2ns不如前3ns,这里面说明2个问题,1.不同的评价指标有不同的弛豫周期,对模拟时间的要求不一样;2.前后模拟结果有变化,说明体系尚未达到平衡,或者说已经平衡,但是是在单个弛豫周期内单调变化。

建议:1. 明确衡量对接评价指标以及相应的热力学/几何结构的微观观测量;2. Plot这些微观观测量,看看是否已经平衡,是否已经完成一个弛豫周期,如果没有,就一定要继续探索下去。3. 看些相关体系(相同蛋白或同家族蛋白)Docking方面的Review,了解这个领域的通常的问题,要求和广泛接受的做法。

最后回应一下17楼wavingsea9911 的不同意见,17楼从一个特定的例子 -- 同源建模以后对体系的松弛(结构优化)为例 -- 说明模拟时间长短并非越长越好。这个我是同意的。并非只有以采样为目的的模拟才是模拟,所以模拟时间不能一概而论。

但是17楼说模拟的构象会坍塌到一个“错误”的构型(“实际的情况更可能会是:各种构象偏差逐渐放大,最后稳定于一个完全不同于实际的构象,或者整个结构发生坍塌,发展成一团不知所以的肽链。”)这个我觉的稍有不妥。相空间中没有错误构型,只有能量高的构型。既然我们说相空间,这里就包含了一切可能构象。只是有些能量太高,出现概率小到可以忽略。但是既然这部分是高能构象,那体系怎么可能“坍塌”到高能构象上呢?这有3个可能:1力场错了,2这个高能构象恰好是你初始构象的一个局部最小,与全局最小之间的能垒很高,滑到里面出不来了;3这个构象跟你说的“最稳定”的折叠构象的能量很接近,它也属于这个蛋白在水里面出现概率很大的一种状态。因此,这3种情况不能用来证明“模拟时间未必越长越好”。只要是在相空间进行的有效采样(力场正确),都给我们关于蛋白构象分布的有用信息。当然,这里我只是在字眼和大道理上较真, 其实17楼只是在强调采样必须有效effective(“控制动力学模拟的走向,保证系统向正确的方向发展。”)而不是否定采样必须充分sufficient。不过鉴于这些概念对于初学者很重要,我就补充一下。

[ Last edited by ChemiAndy on 2011-7-2 at 10:10 ]
23楼2011-07-02 22:29:07
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

奋斗1s

金虫 (正式写手)


引用回帖:
Originally posted by ChemiAndy at 2011-07-01 11:23:12:
不知道你说的“实用”是指什么,不过我知道国内出版的书都死气沉沉,就是简单的知识摘抄和堆积。因此我建议你在学习的早期从国外的经典教材入手。

搞计算模拟研究,有3个层次的东西需要分清,即Science上 ...

谢谢啦
24楼2011-07-03 11:38:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yongleli

木虫 (正式写手)


★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
奋斗1s(金币+1):谢谢参与
zh1987hs(金币+10, 模拟EPI+1): 非常感谢 2011-07-05 12:47:28
引用回帖:
Originally posted by ChemiAndy at 2011-07-02 22:29:07:
感谢17楼补充。我在8楼说了很多,其实没有很好地回答楼主的问题,做Docking,模拟时间要多久。

Docking的本质是看看哪个药物小分子(底物)与蛋白的结合最好。我不知道楼主打算从哪几个方面来考察对接是 ...

这里我要回答ChemiAndy版友的一个小疑问,并讲另外一个关于模拟时间的问题。

关于傅献彩的物化,我们本科时候学习的是另一本,比较偏向化工,习题很多是学校的老师们在做项目时遇到的问题。虽然公式没怎么详细推导,但是让我们觉得学了物化就能干很多事了。我的毕业后在化工设计院工作的同学们确实也是觉得受益匪浅。后来到了南大和山大考察,发现原来老师们虽然用傅献彩的书,但是并不按照书本教。能否把具体的熵焓等概念讲明白就看老师个人功力了。一般是可以的。这也和两校物化课时特别多有关。

做分子动力学模拟,是否模拟时间越长越好?如果计算的模型能够正确反映真实的体系,我觉得是时间越长越好。毕竟理论上,时间系综经过无穷长时间可以遍历相空间中每一个点。但是实际上我们都知道这是不可能的,而且有时候初条件会严重影响模拟的结果。第二点,比如要模拟binding过程或者steered MD,一条轨迹往往也不够。因为如C版友所言,事件的发生有几率性,而MD由于模拟的时间有限(真实世界中1s是很快的时间,但是全原子分子模拟中这几乎是不可能的任务),一条轨迹未必能在有限时间中观测到体系发生想要的变化。

但是还有一点需要注意,MD模拟两大基本问题一是抽样,另一个是力场。
目前的力场我们一般认为它们是行为很好的,可以反应生物大分子的性质。但是某些情况下,比如带电配体的binding,含金属的生物分子,传统的力场很可能不能很好的模拟。用传统力场模拟的话,短时间内体系跟XRD结构接近,但是长时间之后就会变成非自然的构象。比如上世纪90年代Kollman模拟了一个体系,只做了几百ps,但是后来的研究发现这个体系用AMBER力场来做的话在4ns之后会变成非自然构象。这是因为固有的力场中能量最小点不是天然产物的能量最小点。这方面的工作比如
http://pubs.acs.org/doi/abs/10.1021/ja807374x
揭示了用传统的力场本质上是不能正确模拟的,遑论抽样了。
26楼2011-07-05 12:37:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
★ ★ ★ ★ ★ ★
奋斗1s(金币+1):谢谢参与
ghcacj(金币+5, 模拟EPI+1): 谢谢,这个帖子很热啊 2011-07-05 13:35:09
非常感谢楼上诸位高手的讨论~作为一个MD的纯粹应用者来说,理论上很深刻的东西还是不懂,就我们应用的角度来说,主要考虑的是MD能为我们的实验理论解释做一些什么,就我们进行的工作来说,主要思考以下的问题:
1.热稳定性,能否通过MD找到蛋白的热敏感区域,从而对其进行针对性的改造
2.活性位点关键氨基酸的作用,通过长时间的MD,找到蛋白和配体结合时可能发生的构象改变,找到特定氨基酸对结合影响的原因
那么结合上个专家所言,时间和力场应该是结合起来考虑的,如果力场不合适,比如现在没有发现能够很好模拟金属酶的力场(QM/MM除外),那么进行长时间的模拟也不一定能取到蛋白质的真实构象,采用现在通用的AMBER,CHARMM或GROMOS的话,不知道力场对结果的影响大不大,在这种情况下,我觉得长时间的模拟还是很有必要的,现在很多文献都做到ms级别,用于研究酶的变构效应,毕竟许多反应需要的时间不是ns级别的,可能需要将时间延长到一定尺度才有可能观察到对应的变化,一点拙见,请指正
27楼2011-07-05 12:54:30
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

奋斗1s

金虫 (正式写手)


非常感谢各位的指点,从各位的回复中我学到了很多,也发现自己在模拟方面有很多很多地方都还不懂不懂,期望能够在各位虫友的帮助下逐步提高自己,再次感谢各位!
28楼2011-07-05 17:19:20
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ChemiAndy

木虫 (正式写手)


★ ★ ★ ★ ★
zh1987hs(金币+5, 模拟EPI+1): 谢谢 2011-07-06 08:01:38
To zh1987hs版主:

(1)确定蛋白热稳定性的“热敏感区域”,其实就是确定unfolding过程的起始步。假定存在多个竞争的起始unfolding区域,考虑到每个起始步有不同的能垒,那么,我们可以模拟多次来确定从每个区域起始的概率。但是,如果这些起始unfolding步的能垒差较大,在10kcal/mol左右,预测结果应该没问题。能量差小了,恐怕就不好说。不过,用可极化力场可以大大提高结果准确性。

所需的模拟时间呢,由起始unfolding能垒确定,代入阿伦尼乌斯公式,可以得到特征反应时间t,取这个时间的3-10倍,就是你的模拟要跑的时间尺度。当然,如何估计起始unfolding能垒就是个大问题。一般由实验确定,或者类似体系的模拟结果推测。

(2)考察活性位点残基与底物结合的几何构型变化所需的模拟时间,也是一个能量问题,即这些构型变化索要翻越的能垒。方法同上。准确性分析也类似。
30楼2011-07-06 00:03:35
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gzgzgz

铜虫 (小有名气)



奋斗1s(金币+1):谢谢参与
引用回帖:
Originally posted by ChemiAndy at 2011-07-05 23:42:45:
To yongleli大侠:

1,你所给文献的例子揭示的应该是模拟前“验证力场准确性”的重要性,而不是从根本上否定非极化力场。

该文献说是经典非极化力场不能反映蛋白-配体结合位点的一根关键氢键,然而使用极化力 ...

"非极化力场的精确度在10kcal/mol的数量级(5~20kcal/mol)。极化力场可达1kcal/mol数量级"
这个估计是如何得到的?针对某些测试体系的benchmark后的回归统计结论?是大部分的极化力场还是某种,比如AMEOBA?

[ Last edited by gzgzgz on 2011-7-6 at 02:38 ]

» 本帖已获得的红花(最新10朵)

31楼2011-07-06 02:34:06
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ChemiAndy

木虫 (正式写手)


★ ★ ★ ★ ★
送鲜花一朵
zh1987hs(金币+5, 模拟EPI+1): 谢谢 2011-07-06 08:02:09
引用回帖:
Originally posted by gzgzgz at 2011-07-05 13:34:06:
"非极化力场的精确度在10kcal/mol的数量级(5~20kcal/mol)。极化力场可达1kcal/mol数量级"
这个估计是如何得到的?针对某些测试体系的benchmark后的回归统计结论?是大部分的极化力场还是某种 ...

问的好!

这个还真没有出处,印象的来源是导师和读过的一些paper。硕士的老板,是开发力场的,这么提过。后来读博士选的一个分子模拟的课,那老师是Mackerell的学生,发展CHARMM和可极化力场的,他也大致这么说过,加深了印象。我感觉他们也未必能肯定的说个结论。只能说,这个估计是个数量级估计,是根据分子模拟能否适用于特定体系和过程的经验总结,而非严密的统计结论。举个实例,液体混合焓一般在正负几个kcal/mol,俺一哥们用了3-4年的时间搞清了一件事,排除模拟方法的影响,所有非极化力场不能得到任何定性或定量准确预测结果;极化力场(induced dipole model)可以得到定性准确的预测结果(不同体系和组成)。几年青春得到的结论阿,兄弟们。再比如,离子水合,有没有极化,得出的water-water相关时间差别一倍以上。TIP3P(非极化)的扩散系数是实验值的2倍。采用极化力场以后,这些性质和实验值的差别大大缩小。而对于这些性质,恰好是在零点几个到数个氢键的精度范围,所以说10kcal/mol与1kcal/mol分别是非极化力场和极化力场的精度范围,大差不差。

这里你可能会问,不同力场之间,质量差别大不大?还是经验结论,非极化力场这种粗糙的模型,模拟凝聚态体系性质,主要是vdW参数和静电作用参数起作用。只要这些参数的取值在一定的合理范围内,所得到的模拟结果差别不是很大。为什么呢?一般含极性分子或离子,金属等的体系,vdW的吸引能作用并不大,主要起一个排斥作用,决定体系的体积性质;凝聚体系之所以能凝聚,还是静电参数决定的,即体系的电荷分布,或者说介电常数。如果介电常数差别不大,其中的带电粒子的运动差别就不大。对于有些精细的过程,能量差在几个kcal/mol的,不同的力场得出的结论不一样,纯属偶然,没有任何意义。非极化力场根本不足以表现这些细节过程。

[ Last edited by ChemiAndy on 2011-7-5 at 16:42 ]
32楼2011-07-06 04:54:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gzgzgz

铜虫 (小有名气)


受教。另有一问,假如非极化力场的能量精度在5~20kcal/mol (9~30个300K热自由度涨落),那么是否意味着某些以往的基于FEP计算的所谓“精确”到2~3 Kcal/mol的值意义不大?
33楼2011-07-06 08:19:58
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ChemiAndy

木虫 (正式写手)


★ ★ ★ ★ ★ ★ ★ ★ ★ ★
zh1987hs(金币+10, 模拟EPI+1): 谢谢! 2011-07-06 15:16:08
报道的自由能“精确到”2-3kcal/mol,应该是准确度Accuracy,即独立采样结果间的均方偏差。衡量的是多次采样值在平均值周围分布的偏离程度。这个与该模型系统的波动(不确定度)和采样方法即FEP技术有关。举例来说,比如体系的尺寸很小,那么波动就大。波动值大概与粒子数目的平方根的成反比sigma~1/SQRT(N)。另外,FEP方法中,你的Window(微扰步数)取的越多,你的结果就越“精确”。这个报道的精度值必然有其计算方法的参考文献,你可以去验证一下。

上面说的模拟的数值结果的精确度Accuracy是2-3kcal/mol,与其本身物理精度precision只有10kcal/mol并不矛盾。因为分子模拟的数值精度可能达到小数点后很多位,它们虽然不是物理意义上准确的能量值,但却对数值模拟的稳定性(能量守恒)很重要,对衡量模型体系的尺寸效应,采样的有效性很重要,我们当然可以按这些“高精度”的数值结果计算出来达到个位数的数值误差。


问题是,用一把精度为10kcal/mol的尺子,“估算”出自由能在2-3kcal/mol的采样波动,是否有物理意义?这个很少有论文去讨论这个报道的准确度与力场精度本身的联系。我的想法是,自由能衡量的是什么呢?是体系在不同能量状态上的分布概率。只要产生的概率分布是对的,自由能就可能是精确的。那精度为10kcal/mol的尺子,我们能估读能量到个位,则必然能反映由个位数能量决定的概率分布的不同,从而得出2-3kcal/mol的精确度。这个估读有物理意义,则自由能准确度也有物理意义。


因此,教科书上提到FEP都说是“估算”自由能,这个估算指的就是物理意义上的估算,就是指用低精度模型(low precision)去大致估量可能超出当前物理精度范围的过程的自由能过程。而所报道的“精确度”(Accuracy,or error, 就是“结果+正负2~3kcal/mol”) 指的是数值意义上的精确度。

Precision与Accuracy定义与区别:精度Precision是采样结果的有效位数,是由测量工具即“尺子”决定的;准确度Accuracy(or say error)是各独立采样结果相对平均值的偏差程度,与体系本身性质的波动和采样方式有关。前者属于绝对误差,后者属于相对误差。想象一个问题,具有同样数值位数的ab initio计算结果与分子力学计算结果有啥差别?

[ Last edited by ChemiAndy on 2011-7-6 at 02:13 ]
34楼2011-07-06 15:06:56
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

dubo

金虫 (著名写手)



奋斗1s(金币+1):谢谢参与
引用回帖:
Originally posted by yahoohoo at 2011-06-30 17:08:06:
“对接结果发现后者不如前者”

如何判断结果的好与坏呢?难道模拟的结果是我们主观预期的就是好的,否则就不是好的?

比如说你从两个不同的初始构象出发,运行相同时间的MD,一个观测到对接,而另一个没 ...

非常同意,您的观点

实验的结果不应当主观的认为,或猜测。必须用各个参数表现出来。出现所谓的“坏得、不好的”结果,也不要放弃,也说不定有新的发现。

前段时间我调相结构的时候跟你一样。一看不行,或不好看,就把结果放弃掉了,如果能仔细分析每一个结果,都会有很大发现了。

唉,我们做模拟的,数据都一大堆,关键就是分析数据啊!这才是最重要的!!(我这方面的意志力,也不行,也要加强了,呵呵)

以上是我的观点,大家借鉴。另外,原理上,模拟时间越长越好
35楼2011-07-07 10:15:33
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

dubo

金虫 (著名写手)


引用回帖:
Originally posted by ChemiAndy at 2011-07-01 02:24:58:
平衡态模拟的时间长度取决于所感兴趣的性质的弛豫周期。获得感兴趣性质的的统计平均值,需要在不同的弛豫周期采样3-10次。比如,键的振动,振动一次10fs算一个周期,你需要采样至少50fs。分子扩散的数量级在ns,中 ...

键的振动,振动一次10fs算一个周期??
所有的键都这样吗?
36楼2011-07-07 10:19:18
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ChemiAndy

木虫 (正式写手)



ghcacj(金币+1): 谢谢 2011-07-08 16:51:23
只是随便举个例子。不同的键振动频率不一样,振动周期当然不一样。
37楼2011-07-07 10:22:42
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

qixingbao07

木虫 (正式写手)



奋斗1s(金币+1):谢谢参与
谢谢大牛们
38楼2011-07-08 14:09:16
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

houxuben

木虫 (正式写手)



奋斗1s(金币+1):谢谢参与
Gromacs重现性不是很好.....
39楼2011-07-23 09:15:00
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xiaowu759

铁杆木虫 (著名写手)



小木虫: 金币+0.5, 给个红包,谢谢回帖
这是一个很好的讨论主题
40楼2012-04-20 19:03:59
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hphp_2633819

新虫 (初入文坛)


★ ★
小木虫: 金币+0.5, 给个红包,谢谢回帖
zh1987hs: 金币+1, 谢谢 2012-05-05 12:28:59
我一直觉得对接只考虑能量不考虑熵变的,没时间md才对接。。。千万别太信对接
41楼2012-05-05 02:22:40
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

magicmonk

至尊木虫 (著名写手)



小木虫: 金币+0.5, 给个红包,谢谢回帖
引用回帖:
8楼: Originally posted by ChemiAndy at 2011-07-01 02:24:58
平衡态模拟的时间长度取决于所感兴趣的性质的弛豫周期。获得感兴趣性质的的统计平均值,需要在不同的弛豫周期采样3-10次。比如,键的振动,振动一次10fs算一个周期,你需要采样至少50fs。分子扩散的数量级在ns,中等 ...

请问第三种方法有无软件或代码可以实现?
43楼2014-11-09 20:13:38
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

chuntao118

新虫 (著名写手)


引用回帖:
29楼: Originally posted by ChemiAndy at 2011-07-05 23:42:45
To yongleli大侠:

1,你所给文献的例子揭示的应该是模拟前“验证力场准确性”的重要性,而不是从根本上否定非极化力场。

该文献说是经典非极化力场不能反映蛋白-配体结合位点的一根关键氢键,然而使用极化力场 ...

有道理,赞同。
44楼2014-11-12 08:29:02
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

背包旅客

新虫 (初入文坛)



小木虫: 金币+0.5, 给个红包,谢谢回帖
引用回帖:
15楼: Originally posted by ChemiAndy at 2011-07-01 11:23:12
不知道你说的“实用”是指什么,不过我知道国内出版的书都死气沉沉,就是简单的知识摘抄和堆积。因此我建议你在学习的早期从国外的经典教材入手。

搞计算模拟研究,有3个层次的东西需要分清,即Science上的 ...

一看见就知道是大神!!!赞一个!
45楼2015-01-17 09:27:24
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
简单回复
2011-06-30 17:39   回复  
奋斗1s(金币+1):谢谢参与
bhj5605楼
2011-06-30 18:03   回复  
奋斗1s(金币+1):谢谢参与
bhj5606楼
2011-06-30 18:08   回复  
bhj5607楼
2011-06-30 18:08   回复  
2011-07-01 05:48   回复  
奋斗1s(金币+1):谢谢参与
shuwenhe10楼
2011-07-01 06:10   回复  
奋斗1s(金币+1):谢谢参与
v
2011-07-01 07:56   回复  
奋斗1s(金币+1):谢谢参与
dufuming42楼
2012-09-06 18:38   回复  
相关版块跳转 我要订阅楼主 奋斗1s 的主题更新
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[基金申请] 化学B口多少分能上会呀 +7 WOWO159357 2024-05-22 15/750 2024-05-23 17:25 by shuguang8600
[硕博家园] 博三一直没文章怎么办 +28 133456 2024-05-17 46/2300 2024-05-23 14:35 by 安小樱
[硕博家园] 蹲一个男朋友 +27 伊伊莎贝拉 2024-05-17 53/2650 2024-05-23 13:18 by zbaqgxj
[基金申请] 听说面青地E09已经送了么? +6 叉烧吃叉烧 2024-05-21 9/450 2024-05-23 12:24 by 叉烧吃叉烧
[论文投稿] Neurocomputing 外审结束 +5 mollyzhang_2003 2024-05-23 5/250 2024-05-23 12:03 by nono2009
[电化学] 如何证明电极上镀上金了? 10+4 刻印时光 2024-05-22 4/200 2024-05-23 11:31 by 牵着小猫跑步
[基金申请] 审不上青基又非升即走的青椒 和 牢里踩缝纫机的犯人哪个活的更舒服一点? +18 非非飞远了 2024-05-20 21/1050 2024-05-23 11:03 by zyqchem
[教师之家] 经常觉得挺累的 +9 zylfront 2024-05-22 15/750 2024-05-23 10:05 by ayalex
[教师之家] 来用亲身体会,一起说说年轻老师的辛苦 +20 zylfront 2024-05-17 26/1300 2024-05-23 07:53 by luwangba
[论文投稿] 求推荐期刊 20+4 好困好困a 2024-05-18 5/250 2024-05-22 22:41 by 知识产权服务
[论文投稿] 求能源类,故障诊断,机器学习结合的EI期刊。 36+3 wj0318 2024-05-19 5/250 2024-05-22 22:05 by 知识产权服务
[硕博家园] 又忍不住想吐槽文科的学术圈 +8 nvizqxuf 2024-05-18 10/500 2024-05-22 20:13 by utahh
[教师之家] 执念 +9 459582015 2024-05-16 10/500 2024-05-22 19:28 by 预演556
[论文投稿] 期刊投稿进度 +6 jianhuang9 2024-05-21 8/400 2024-05-22 18:29 by sakuraai
[有机交流] 两个产物点爬小板离得非常近,怎么靠大板提纯 5+6 lljcb 2024-05-18 7/350 2024-05-22 16:35 by DAXIAOZHI
[基金申请] 国社科申请书上传有误,学校已提交到省里,省里还未审核,还能退回修改嘛? 100+3 远山晴岚 2024-05-19 7/350 2024-05-22 12:26 by holypower
[基金申请] 国自然等 80+4 胖虎 2024-05-21 12/600 2024-05-22 09:47 by nono2009
[论文投稿] Angew拒稿重投经历大修返回又送审了 48+4 YOONAZHA 2024-05-18 6/300 2024-05-21 10:35 by jurkat.1640
[论文投稿] SENSORS AND ACTUATORS B-CHEMICAL 15+4 荣小撇 2024-05-20 4/200 2024-05-21 10:07 by ca0yan9
[硕博家园] 又见奇葩学生,可咋办 +25 appleapple2 2024-05-17 30/1500 2024-05-21 09:13 by qyws
信息提示
请填处理意见