| 查看: 15239 | 回复: 44 | |||||||||||||||
| 本帖产生 9 个 模拟EPI ,点击这里进行查看 | |||||||||||||||
[交流]
分子模拟时间越长越好吗?
|
|||||||||||||||
| 如题,在对蛋白质做分子动力学模拟的时候,我用Gromacs先进行了3ns的MD运算,然后又进行了2ns,对接结果发现后者不如前者,但通过蛋白质评价发现后者的各项指标要好一些,请各位高手讨论一下MD多长时间比较好呢? |
» 收录本帖的淘帖专辑推荐
分子模拟 | 模型 - 模拟 - 统计 - 热力学 | MDs-Gromacs | 计算 |
gromacs | 蛋白模拟与改造 | 分子模拟 | 精华帖转载 |
分子模拟 | PBS作业排队系统 | 计算化学 | 分子动力学模拟 |
» 本帖已获得的红花(最新10朵)
» 猜你喜欢
2025冷门绝学什么时候出结果
已经有3人回复
天津工业大学郑柳春团队欢迎化学化工、高分子化学或有机合成方向的博士生和硕士生加入
已经有4人回复
康复大学泰山学者周祺惠团队招收博士研究生
已经有6人回复
AI论文写作工具:是科研加速器还是学术作弊器?
已经有3人回复
孩子确诊有中度注意力缺陷
已经有6人回复
2026博士申请-功能高分子,水凝胶方向
已经有6人回复
论文投稿,期刊推荐
已经有4人回复
硕士和导师闹得不愉快
已经有13人回复
请问2026国家基金面上项目会启动申2停1吗
已经有5人回复
同一篇文章,用不同账号投稿对编辑决定是否送审有没有影响?
已经有3人回复
» 本主题相关商家推荐: (我也要在这里推广)
» 本主题相关价值贴推荐,对您同样有帮助:
对接的分子用于分子动力学模拟的问题
已经有12人回复
分子模拟中MSD的问题讨论
已经有25人回复
扩散系数的计算及体系平衡的判断
已经有4人回复
分子动力学的时间
已经有9人回复
gromacs结果分析怎样分析氢键能和结合能
已经有12人回复
LAMMPS中ReaxFF力场是怎么回事?
已经有17人回复
蛋白质构象模拟
已经有12人回复
关于材料的热力学稳定性 结构稳定性
已经有16人回复
金属功函数的测量方法有几种
已经有5人回复
什么动力学模拟软件可以模拟化学反应过程
已经有13人回复
如何评价误差和变化?
已经有10人回复
做离子液体的分子模拟,用哪个分子模拟的软件好呢?
已经有3人回复
gromacs 中g_msd问题
已经有8人回复
有没有人用Amber做过膜蛋白动力学模拟
已经有14人回复
生测数据的标准差大于平均值,怎么办?
已经有7人回复
AMBER中qm/mm的问题
已经有5人回复
【讨论】分子模拟还是同源建模
已经有16人回复
【求助】msd算法
已经有10人回复
【求助】NAMD和Gromacs哪个简单?
已经有5人回复
【求助】关于用分子动力学来做光谱的问题
已经有14人回复
» 抢金币啦!回帖就可以得到:
湘潭大学化学学院陈华杰教授课题组招收有机/高分子方向的博士研究生
+1/82
真诚脱单
+1/82
华中科技大学2026级申请考核制博士生1名-新型共轭MOF/COF合成及其超电应用方向
+1/79
中科院理化所(北京)招收2026年材料学外招博士生1名(考核制)
+1/78
中国科学院赣江创新研究院特别研究助理/博士后招聘(1-2名)
+1/78
双一流大学湘潭大学“化工过程模拟与强化”国家地方联合工程研究中心招收各类博士生
+1/49
捷克布拉格查理大学(QS260)招收第一性原理计算方向博士生
+1/34
中国科学院深圳先进技术研究院余敏课题组招聘研究助理
+5/30
宁波大学张天宇教授课题组招聘副教授/讲师
+1/29
南京大学能源与资源学院蔡亮课题组诚招博士后、助理研究员(AEM、PEM电解水制氢方向)
+1/15
招募懂有限元、编程能力强的同学,待遇优厚
+1/15
长江大学武汉校区诚招新能源博士(工程热物理、电气、油气)-2025
+1/8
南开大学齐迹课题组诚聘博士后
+1/5
南开大学齐迹课题组诚聘博士后
+1/4
长江大学武汉校区诚招新能源博士-2025
+1/4
有没有一款可以听文献的APP
+1/4
沙特法赫德国王石油与矿产大学(KFUPM)膜分离课题组招生
+1/3
香港科技大学高寒宇课题组博士后招聘
+1/3
上海交通大学 张峻课题组招收2026年申请考核博士生1 名
+1/2
上海交通大学 Jaehyung Ju 课题组招收2026年申请考核博士生1 名
+1/1
★
奋斗1s(金币+1):谢谢参与
奋斗1s(金币+10): 很详细,谢谢这位兄弟的指点呀! 2011-07-01 08:21:38
奋斗1s(金币+1):谢谢参与
奋斗1s(金币+10): 很详细,谢谢这位兄弟的指点呀! 2011-07-01 08:21:38
|
平衡态模拟的时间长度取决于所感兴趣的性质的弛豫周期。获得感兴趣性质的的统计平均值,需要在不同的弛豫周期采样3-10次。比如,键的振动,振动一次10fs算一个周期,你需要采样至少50fs。分子扩散的数量级在ns,中等肽链loop-closing需要10ns数量级,形成alpha螺旋的弛豫周期在200ns量级,beta结构在1-10微秒,等等。 弛豫周期的长度取决于某种运动的持续多久以后就与先前的状态无关了,或者忘记了。所有的运动都有多个状态,这个运动所要穿越的自由能垒,决定了该运动的弛豫周期。这就是为什么我们可以模拟一个过程(如蛋白质折叠)的平均特征时间,根据阿伦尼乌斯公式,反推自由能垒。 然而,平均特征时间为200ns的过程,并不意味着你跑200ns就一定能模拟到该过程的发生。它能否向你要的最终态跑去,也是个概率问题。可能很快跑过去,也可能很慢,甚至完全跑不过去,即使能垒不高。因为你只有少数几个分子阿。而实验观测的是10^23数量级的分子的统计结果。不过一般来说,采样时间取特征时间的10倍以上,都可能获得感兴趣的性质的良好的平均值。 那么,如何知道一个过程或某个性质的平均驰豫时间呢?以体积弛豫为例,如果你plot整个体积数据随时间变化的曲线,你会看到体积在平均值上下浮动。它受到盒子内分子相互作用,振动,扩散的内在驱动,有多种频率的波动。瞬时的波动是受分子振动驱动的的,而缓慢的,长周期的上下浮动是受到分子聚合,扩散驱动的,但是不容易看出来。怎么估计这种缓慢浮动的周期呢?有几种方法估计: 一是计算相关函数,看看相关函数中,从任一时刻开始,体积数据之间需要多久时间就不再有相互的关联了(相关函数值趋近于0); 这段时间长度,就是特征弛豫时间;该方法适合与考察扩散运动的时间特征,计算自扩散系数,黏度等。 第二种方法是block avergage方法,看看多大的block计算得到的均方偏差RMSD与你取的block size无关。做法是把你的trajectory分成很多等长的小段,每一段称为block, 每段长度称为block size, 有的称window size(e.g., 5ps),对于每一种block size的取法(比如,5ps, 10ps, 15ps, 20ps....),你计算每个block的平均值average,根据所有的block average你可以得到它们的均方偏差RMSD,Plot你的RMSD随block size变化的曲线,你会发现,曲线逐渐升高,但在某个size(比如20ps)之后成为平台区,与window size无关了(再之后会剧烈升降,进入混沌状态),那么该性质的特征弛豫时间为20ps。而20ps block得到的RMSD就是你对该过程或性质的相对误差。(很多人用全部数据的MSD做为误差,是不严密的。因为所谓独立测量,必须是测量结果之间没有相关性。我们MD模拟和实验测量一样,也要从不相关的各个block中间取值阿兄弟们) 第三种方法,计算波动谱。我们知道振动有振动谱,那波动自然也有波动谱。比如体积波动,将体积数据进行自相关计算,并做傅立叶变化,可以得到一个谱图。上面有一系列峰,在不同的频率上。不同频率即反映了波动的时间长短,而峰面积显示了与该频率的运动的相关性。面积最大的峰自然就是其特征峰了。根据其频率可以计算其运动的特征时间。(红外光谱就是这么计算的,它保留整个盒子的dipole,然后分解为很多不同频率的运动,不同频率的运动对应不同模式的振动,它们对盒子的总dipole的变化有贡献,傅立叶一分解就出来了)所以,只要是某种运动对某种性质有贡献,都可以通过对该性质的自相关函数-傅立叶变化分解出其特征频率,继而得到其特征时间。 PS,上面我用到驰豫时间relaxation time这个概念,它其实指的是体系受到特定能量的激发以后,逐渐衰退decay到正常状态所需的时间。因为这个时间是与受到激发的那种运动的运动周期直接相对应的,所以该体系没有受激发的时候,那种运动的周期也可以称relaxation time弛豫时间。 再次回到楼主提出的问题上,模拟时间是否越长越好。可以肯定的说是的,但是没有必要。且不说成本,机时,能量,地球,绿色啥的问题,单说分子动力学模拟本身,是揭示相关运动的时间特征,从而定量估算内在驱动的能量特征。 搞到蛋疼才够酷阿兄弟 。![]() ![]() ![]() [ Last edited by ChemiAndy on 2011-6-30 at 14:19 ] 需要说明的是,上面的讨论均是指采样阶段,隐含着模拟已达到平衡的要求。而审稿人要求模拟时间加长的,一般是因为担心体系并没有达到平衡,或者说担心体系停留在一个局部最小的亚平衡态。亚平衡态体系可能在几百个纳秒之后突然跳到另外一个亚平衡态。体系在多个亚平衡态之间跳跃是正常的。这样的多态体系很难定义其平衡态,因为很难预知究竟有多少个亚态,也不知道亚态之间的能垒有多高,所以唯一的办法就是尽可能的延长模拟时间。关于多态体系平衡的问题,囿于计算能力和研究周期限制,文献中较少涉及。 |
8楼2011-07-01 02:24:58
★ ★ ★ ★ ★ ★ ★ ★ ★ ★
zh1987hs(金币+10, 模拟EPI+1): 谢谢! 2011-07-01 19:48:29
zh1987hs(金币+10, 模拟EPI+1): 谢谢! 2011-07-01 19:48:29
|
不知道你说的“实用”是指什么,不过我知道国内出版的书都死气沉沉,就是简单的知识摘抄和堆积。因此我建议你在学习的早期从国外的经典教材入手。 搞计算模拟研究,有3个层次的东西需要分清,即Science上的,Method和technique。每个层次都要有最好的教材在手! - Science是你要解决的问题,比如蛋白质构象理论,离子水合理论,或者是材料设计理论,化学反应,能量存储等。它在你的研究中往往是个背景性的东西。抓住你的研究和本领域最前沿的概念,理论的关系,非常重要。一般来说,我们搞的东西往往仅仅是对它们其中某一个方面的验证,或应用,或拓展。这方面的书也因人而异。不过,所有的问题大体上可以分为热力学和动力学两大类。而物理化学就是你需要的东西。 - Method,或theoretical method是指分子模拟方法,是我们用于研究Science问题的工具。包括结构-能量理论(量子力学和分子力场)和模拟方法理论两大块。其中模拟方法(MD, MC)根源于统计热力学的系综理论。我们正在经历一个从经典唯象热力学方法向分子热力学方法过渡的时代,分子模拟是其中最重要的工具之一;如果能搞清为什么能把模拟结果转化为宏观观测结果,如何设计一个新的系综来模拟一个具体的问题,你就走在了历史的最前沿。不过,对于我们大多数人来说,并不搞方法,而是应用而已。方法已经在软件里了,我们跟在人家屁股后头混个文凭就好。有时候甚至懒得弄清这些方法是怎么回事。 ![]() - Technique是操作软件的技巧。怎么用MaterialsStudio, Gromacs, NAMD, 怎么用Gaussian,怎么搭盒子,怎么画图;它是其中最不重要的方面,却是耗费了我们95%时间的东西。以至于我们根本没有时间去考虑Science的问题,有木有?!! ![]() 回到你的问题上,我给你推荐几本经典教材。 (1) Introduction to statistical mechanics, David Chandler, 搞清系综理论以后,方知啥是分子模拟;这本书87年出版以后没动过。为什么?字字经典。现在做分子模拟的青年们都是看着本书成长起步的。 (2) Computer simulation of liquid, M.P. Alen 分子模拟的理论,算法,思想,数据处理,此书为圣经,不可不膜拜;常备一本,常伴一生。 (3) 其实最重要的我觉得还是一本好的物理化学书,能把热力学,动力学,量子化学,和光谱贯穿讲透,可惜我一直没有找到。国外的书我看的是Peter Atkins的,已经到了第8版。国内的物理化学教材,以复旦范康年的最好,可以最大程度上给你一个很全面的视野。但是国内物化书的通病是化学有余,物理不足;经典有余,统计不足。并且不下功夫再版。(不要看傅献彩的物化,它在我当年初次接触物化的时候投向我内心深处一个恐惧的阴影。多年以后我一直思考一个问题,傅老师,你为何在没有实际例子的情况下用一堆熵和焓的抽象概念去谋害一个个渴望学习的幼小心灵?您懂不懂平衡态与非平衡态,理想态与实际状态的区别?历史上提出可逆过程的根本目的是什么?物理化学方法看待世界的本质思想是什么?悲摧啊青年们 ![]() ![]() )从热力学到统计分子热力学,可以帮助我们从宏观走到微观,而光谱又帮助我们从微观回到宏观统计现象。所以统计和光谱很重要。光谱学,我并非指简单的红外选律,拉曼活性这些表面的东西,而是指原子的电子结构与外界电磁场(光子)的作用和响应,以及简洁无比的Fermi-Golden rule. 这个定律正是从分子原子运动的微观可测量的相关函数-傅立叶变换得到宏观观测结果的精髓。要充分理解,最好实际做一下这方面的模拟。但是这方面的教程很少。好在在Alen的书里面有提及。 Good luck! ![]() ![]() ![]() PS: 上面提到的两本书(1)(2)在小木虫上应该很容易下载到。[ Last edited by ChemiAndy on 2011-7-2 at 00:26 ] |
15楼2011-07-01 11:23:12
★ ★ ★ ★ ★ ★
奋斗1s(金币+1):谢谢参与
zh1987hs(金币+5, 模拟EPI+1): 谢谢 2011-07-01 19:49:20
奋斗1s(金币+4): 恩,谢谢您的指点! 2011-07-01 21:55:33
奋斗1s(金币+1): 2011-07-01 22:02:18
奋斗1s(金币+1):谢谢参与
zh1987hs(金币+5, 模拟EPI+1): 谢谢 2011-07-01 19:49:20
奋斗1s(金币+4): 恩,谢谢您的指点! 2011-07-01 21:55:33
奋斗1s(金币+1): 2011-07-01 22:02:18
|
只对一个蛋白质构象进行的动力学模拟,一般用于对同源建模的结果进行构象优化,目标是去除模型中的高能键、高能角等不合理的构象。我假定楼主也是这个目的。那么时间是否越长越好呢? 我个人认为不是这样。因为根本的一个问题就是,作为动力学模拟起点的模型构象未必是(或者说一定不是)该蛋白质的真实构象。以这个起点开始模拟过程,随着时间的推移,我们期望的结果是:该构象会向真实构象靠拢,最后稳定在真实构象上。但实际的情况更可能会是:各种构象偏差逐渐放大,最后稳定于一个完全不同于实际的构象,或者整个结构发生坍塌,发展成一团不知所以的肽链。 另一个问题是溶剂体系的问题,如果在真空条件下对酶蛋白,特别是膜蛋白进行动力学优化,如果不加约束,很难得出正确的结果。 但值得注意的是,错误的动力学模拟结果的蛋白质评价指标也可能会很好,因为动力学模拟一定会让体系向能量最低的方向发展。所以,蛋白质评价指标只是佐证,不是铁证。 最后的结论是,用于蛋白质模型优化的动力学模拟,时间长短不是很重要,个人认为1-5ns都可以。关键是要对该蛋白的真实构象有一个概念,以此控制动力学模拟的走向,保证系统向正确的方向发展。 8楼的阐述很细致,是很好的理论基础。遇到具体问题还要具体分析。 |
17楼2011-07-01 15:31:55
★ ★ ★ ★ ★
送鲜花一朵
zh1987hs(金币+5, 模拟EPI+1): 谢谢 2011-07-06 08:01:50
送鲜花一朵zh1987hs(金币+5, 模拟EPI+1): 谢谢 2011-07-06 08:01:50
|
To yongleli大侠: 1,你所给文献的例子揭示的应该是模拟前“验证力场准确性”的重要性,而不是从根本上否定非极化力场。 该文献说是经典非极化力场不能反映蛋白-配体结合位点的一根关键氢键,然而使用极化力场就行,模拟与实验一致。俺觉得这不能称为“用传统的力场(非极化)本质上是不能正确模拟”,因为力场方法和所有的实验方法一样,不同的力场有其特有的精度precision和准确度Accuracy两方面。精度是说其采样的事件的能量可以精确到多大,准确度是相对平均值的偏差RMSD(误差)。采样精度由力场决定。采样准确度由模拟方法以及事件本身波动大小(不确定性)决定。 (2)力场的精确度precision决定所能模拟什么样的体系,性质,和过程 非极化力场的精确度在10kcal/mol的数量级(5~20kcal/mol)。极化力场可达1kcal/mol数量级。因此,简单说,如果一个体系,它两种状态的能量差在10kcal/mol,我们就能用力场来计算它在这两种状态下的分布概率的差。 具体到蛋白构型,单根氢键H-bond的能量恰在~10kcal/mol,在你所给文献中,非极化力场不能正确描述它完全有可能。 一般情况下,对于模拟蛋白构型,非极化力场还是能够胜任的,因为蛋白构型折叠与非折叠构型的能量差显然比较大,解折叠的过程的能垒也比较大。已发表的很多模拟已经告诉我们,非极化力场在模拟构型方面与实验的符合度是基本令人满意的。然而,如果要比较折叠状态下,个别位点的几何结构,这就取决于该位点不同结构的能量差,如果小于10kcal/mol,那么由于力场精度问题,得出的结果可能就是错误的。 再然而,错误也是有限的。想象一下我们拿了一个尺子,如果它的精确度是10cm,意味着测量值的十位上数字是精确的,个位上估计的,个位以下没有意义。假如我们用这个尺子比较一堆木棍的长度,那么,只要所有的木棍长度大于1cm,那么尽管我们不能准确知道每根木棍的长度,但是其相对长度还是能够依靠个位数字上的估计值比较得出。这恰如自由能的计算,自由能是用力场这根尺子,去测量每个构象的能量,从而得出在每种构象上的分布概率,再由概率确定各种性质,或者过程前后的热力学自由能差和动力学自由能垒。也就是说,如果构型的能量差虽然小于10kcal/mol,但是如果大于1kcal/mol,结果仍然具有一定意义。 上面力场精确度我讲的是数量级,因为不同力场质量也不一样。怎么办呢?模拟前要验证力场准确性。这也是前贴的重点。 总之,在当前非极化力场水平下,若该性质由能量小于10kcal/mol数量级的能量波动确定, 则定量预测实验值没有意义,但是,定性结果基本满意。 (3) 力场精确度对模拟时间的影响 对平衡态性质,模拟时间由该性质的弛豫周期决定;对非平衡过程的话,模拟时间由该过程的能垒决定。 [ Last edited by ChemiAndy on 2011-7-5 at 11:32 ] |
29楼2011-07-05 23:42:45
3楼2011-06-30 17:34:47
25楼2011-07-03 21:14:05
2楼2011-06-30 17:08:06
★
奋斗1s(金币+1):谢谢参与
奋斗1s(金币+1):谢谢参与
|
本帖内容被屏蔽 |
12楼2011-07-01 08:04:34
13楼2011-07-01 08:11:47
|
我是模拟方面的新手,有很多地方不懂。您的回帖对我帮组很大,不知可不可以麻烦您给我介绍一下这方面比较实用的书籍或是传给我一些相关的资料呢?邮箱:xieyunfeng110@yahoo.cn |
14楼2011-07-01 08:27:56
16楼2011-07-01 14:00:59
18楼2011-07-01 21:52:35
19楼2011-07-01 21:54:46
20楼2011-07-02 02:20:52
21楼2011-07-02 07:27:28
22楼2011-07-02 10:51:36
★ ★ ★ ★ ★ ★ ★ ★ ★ ★
zh1987hs(金币+10, 模拟EPI+1): 谢谢CHEM 2011-07-02 23:28:30
zh1987hs(金币+10, 模拟EPI+1): 谢谢CHEM 2011-07-02 23:28:30
|
感谢17楼补充。我在8楼说了很多,其实没有很好地回答楼主的问题,做Docking,模拟时间要多久。 Docking的本质是看看哪个药物小分子(底物)与蛋白的结合最好。我不知道楼主打算从哪几个方面来考察对接是否“好”,好不好有很多定性和定量的指标。最常用的热力学指标有平均能量差(焓变),和结合自由能。不过,最重要的还是要看你的底物和结合位点的功能关系。比如有的结合位点的功能是要打开蛋白的通道的,那对接后通道尺寸就是主要指标;有的位点是催化反应的,那么就要求结合构型有利于反应,结合自由能再大也不行滴。 从楼主模糊的描述来看,似乎有能量或自由能(“对接结果”)和蛋白构型(“蛋白质评价”)两种评价标准。而且后2ns不如前3ns,这里面说明2个问题,1.不同的评价指标有不同的弛豫周期,对模拟时间的要求不一样;2.前后模拟结果有变化,说明体系尚未达到平衡,或者说已经平衡,但是是在单个弛豫周期内单调变化。 建议:1. 明确衡量对接评价指标以及相应的热力学/几何结构的微观观测量;2. Plot这些微观观测量,看看是否已经平衡,是否已经完成一个弛豫周期,如果没有,就一定要继续探索下去。3. 看些相关体系(相同蛋白或同家族蛋白)Docking方面的Review,了解这个领域的通常的问题,要求和广泛接受的做法。 最后回应一下17楼wavingsea9911 的不同意见,17楼从一个特定的例子 -- 同源建模以后对体系的松弛(结构优化)为例 -- 说明模拟时间长短并非越长越好。这个我是同意的。并非只有以采样为目的的模拟才是模拟,所以模拟时间不能一概而论。 但是17楼说模拟的构象会坍塌到一个“错误”的构型(“实际的情况更可能会是:各种构象偏差逐渐放大,最后稳定于一个完全不同于实际的构象,或者整个结构发生坍塌,发展成一团不知所以的肽链。”)这个我觉的稍有不妥。相空间中没有错误构型,只有能量高的构型。既然我们说相空间,这里就包含了一切可能构象。只是有些能量太高,出现概率小到可以忽略。但是既然这部分是高能构象,那体系怎么可能“坍塌”到高能构象上呢?这有3个可能:1力场错了,2这个高能构象恰好是你初始构象的一个局部最小,与全局最小之间的能垒很高,滑到里面出不来了;3这个构象跟你说的“最稳定”的折叠构象的能量很接近,它也属于这个蛋白在水里面出现概率很大的一种状态。因此,这3种情况不能用来证明“模拟时间未必越长越好”。只要是在相空间进行的有效采样(力场正确),都给我们关于蛋白构象分布的有用信息。当然,这里我只是在字眼和大道理上较真, 其实17楼只是在强调采样必须有效effective(“控制动力学模拟的走向,保证系统向正确的方向发展。”)而不是否定采样必须充分sufficient。不过鉴于这些概念对于初学者很重要,我就补充一下。 [ Last edited by ChemiAndy on 2011-7-2 at 10:10 ] |
23楼2011-07-02 22:29:07
24楼2011-07-03 11:38:25
★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
奋斗1s(金币+1):谢谢参与
zh1987hs(金币+10, 模拟EPI+1): 非常感谢 2011-07-05 12:47:28
奋斗1s(金币+1):谢谢参与
zh1987hs(金币+10, 模拟EPI+1): 非常感谢 2011-07-05 12:47:28
|
这里我要回答ChemiAndy版友的一个小疑问,并讲另外一个关于模拟时间的问题。 关于傅献彩的物化,我们本科时候学习的是另一本,比较偏向化工,习题很多是学校的老师们在做项目时遇到的问题。虽然公式没怎么详细推导,但是让我们觉得学了物化就能干很多事了。我的毕业后在化工设计院工作的同学们确实也是觉得受益匪浅。后来到了南大和山大考察,发现原来老师们虽然用傅献彩的书,但是并不按照书本教。能否把具体的熵焓等概念讲明白就看老师个人功力了。一般是可以的。这也和两校物化课时特别多有关。 做分子动力学模拟,是否模拟时间越长越好?如果计算的模型能够正确反映真实的体系,我觉得是时间越长越好。毕竟理论上,时间系综经过无穷长时间可以遍历相空间中每一个点。但是实际上我们都知道这是不可能的,而且有时候初条件会严重影响模拟的结果。第二点,比如要模拟binding过程或者steered MD,一条轨迹往往也不够。因为如C版友所言,事件的发生有几率性,而MD由于模拟的时间有限(真实世界中1s是很快的时间,但是全原子分子模拟中这几乎是不可能的任务),一条轨迹未必能在有限时间中观测到体系发生想要的变化。 但是还有一点需要注意,MD模拟两大基本问题一是抽样,另一个是力场。 目前的力场我们一般认为它们是行为很好的,可以反应生物大分子的性质。但是某些情况下,比如带电配体的binding,含金属的生物分子,传统的力场很可能不能很好的模拟。用传统力场模拟的话,短时间内体系跟XRD结构接近,但是长时间之后就会变成非自然的构象。比如上世纪90年代Kollman模拟了一个体系,只做了几百ps,但是后来的研究发现这个体系用AMBER力场来做的话在4ns之后会变成非自然构象。这是因为固有的力场中能量最小点不是天然产物的能量最小点。这方面的工作比如 http://pubs.acs.org/doi/abs/10.1021/ja807374x 揭示了用传统的力场本质上是不能正确模拟的,遑论抽样了。 |
26楼2011-07-05 12:37:12
★ ★ ★ ★ ★ ★
奋斗1s(金币+1):谢谢参与
ghcacj(金币+5, 模拟EPI+1): 谢谢,这个帖子很热啊 2011-07-05 13:35:09
奋斗1s(金币+1):谢谢参与
ghcacj(金币+5, 模拟EPI+1): 谢谢,这个帖子很热啊 2011-07-05 13:35:09
|
非常感谢楼上诸位高手的讨论~作为一个MD的纯粹应用者来说,理论上很深刻的东西还是不懂,就我们应用的角度来说,主要考虑的是MD能为我们的实验理论解释做一些什么,就我们进行的工作来说,主要思考以下的问题: 1.热稳定性,能否通过MD找到蛋白的热敏感区域,从而对其进行针对性的改造 2.活性位点关键氨基酸的作用,通过长时间的MD,找到蛋白和配体结合时可能发生的构象改变,找到特定氨基酸对结合影响的原因 那么结合上个专家所言,时间和力场应该是结合起来考虑的,如果力场不合适,比如现在没有发现能够很好模拟金属酶的力场(QM/MM除外),那么进行长时间的模拟也不一定能取到蛋白质的真实构象,采用现在通用的AMBER,CHARMM或GROMOS的话,不知道力场对结果的影响大不大,在这种情况下,我觉得长时间的模拟还是很有必要的,现在很多文献都做到ms级别,用于研究酶的变构效应,毕竟许多反应需要的时间不是ns级别的,可能需要将时间延长到一定尺度才有可能观察到对应的变化,一点拙见,请指正 |
27楼2011-07-05 12:54:30
28楼2011-07-05 17:19:20
★ ★ ★ ★ ★
zh1987hs(金币+5, 模拟EPI+1): 谢谢 2011-07-06 08:01:38
zh1987hs(金币+5, 模拟EPI+1): 谢谢 2011-07-06 08:01:38
|
To zh1987hs版主: (1)确定蛋白热稳定性的“热敏感区域”,其实就是确定unfolding过程的起始步。假定存在多个竞争的起始unfolding区域,考虑到每个起始步有不同的能垒,那么,我们可以模拟多次来确定从每个区域起始的概率。但是,如果这些起始unfolding步的能垒差较大,在10kcal/mol左右,预测结果应该没问题。能量差小了,恐怕就不好说。不过,用可极化力场可以大大提高结果准确性。 所需的模拟时间呢,由起始unfolding能垒确定,代入阿伦尼乌斯公式,可以得到特征反应时间t,取这个时间的3-10倍,就是你的模拟要跑的时间尺度。当然,如何估计起始unfolding能垒就是个大问题。一般由实验确定,或者类似体系的模拟结果推测。 (2)考察活性位点残基与底物结合的几何构型变化所需的模拟时间,也是一个能量问题,即这些构型变化索要翻越的能垒。方法同上。准确性分析也类似。 |
30楼2011-07-06 00:03:35
31楼2011-07-06 02:34:06
★ ★ ★ ★ ★
送鲜花一朵
zh1987hs(金币+5, 模拟EPI+1): 谢谢 2011-07-06 08:02:09
送鲜花一朵zh1987hs(金币+5, 模拟EPI+1): 谢谢 2011-07-06 08:02:09
|
问的好! 这个还真没有出处,印象的来源是导师和读过的一些paper。硕士的老板,是开发力场的,这么提过。后来读博士选的一个分子模拟的课,那老师是Mackerell的学生,发展CHARMM和可极化力场的,他也大致这么说过,加深了印象。我感觉他们也未必能肯定的说个结论。只能说,这个估计是个数量级估计,是根据分子模拟能否适用于特定体系和过程的经验总结,而非严密的统计结论。举个实例,液体混合焓一般在正负几个kcal/mol,俺一哥们用了3-4年的时间搞清了一件事,排除模拟方法的影响,所有非极化力场不能得到任何定性或定量准确预测结果;极化力场(induced dipole model)可以得到定性准确的预测结果(不同体系和组成)。几年青春得到的结论阿,兄弟们。再比如,离子水合,有没有极化,得出的water-water相关时间差别一倍以上。TIP3P(非极化)的扩散系数是实验值的2倍。采用极化力场以后,这些性质和实验值的差别大大缩小。而对于这些性质,恰好是在零点几个到数个氢键的精度范围,所以说10kcal/mol与1kcal/mol分别是非极化力场和极化力场的精度范围,大差不差。 这里你可能会问,不同力场之间,质量差别大不大?还是经验结论,非极化力场这种粗糙的模型,模拟凝聚态体系性质,主要是vdW参数和静电作用参数起作用。只要这些参数的取值在一定的合理范围内,所得到的模拟结果差别不是很大。为什么呢?一般含极性分子或离子,金属等的体系,vdW的吸引能作用并不大,主要起一个排斥作用,决定体系的体积性质;凝聚体系之所以能凝聚,还是静电参数决定的,即体系的电荷分布,或者说介电常数。如果介电常数差别不大,其中的带电粒子的运动差别就不大。对于有些精细的过程,能量差在几个kcal/mol的,不同的力场得出的结论不一样,纯属偶然,没有任何意义。非极化力场根本不足以表现这些细节过程。 [ Last edited by ChemiAndy on 2011-7-5 at 16:42 ] |
32楼2011-07-06 04:54:25
33楼2011-07-06 08:19:58
★ ★ ★ ★ ★ ★ ★ ★ ★ ★
zh1987hs(金币+10, 模拟EPI+1): 谢谢! 2011-07-06 15:16:08
zh1987hs(金币+10, 模拟EPI+1): 谢谢! 2011-07-06 15:16:08
|
报道的自由能“精确到”2-3kcal/mol,应该是准确度Accuracy,即独立采样结果间的均方偏差。衡量的是多次采样值在平均值周围分布的偏离程度。这个与该模型系统的波动(不确定度)和采样方法即FEP技术有关。举例来说,比如体系的尺寸很小,那么波动就大。波动值大概与粒子数目的平方根的成反比sigma~1/SQRT(N)。另外,FEP方法中,你的Window(微扰步数)取的越多,你的结果就越“精确”。这个报道的精度值必然有其计算方法的参考文献,你可以去验证一下。 上面说的模拟的数值结果的精确度Accuracy是2-3kcal/mol,与其本身物理精度precision只有10kcal/mol并不矛盾。因为分子模拟的数值精度可能达到小数点后很多位,它们虽然不是物理意义上准确的能量值,但却对数值模拟的稳定性(能量守恒)很重要,对衡量模型体系的尺寸效应,采样的有效性很重要,我们当然可以按这些“高精度”的数值结果计算出来达到个位数的数值误差。 问题是,用一把精度为10kcal/mol的尺子,“估算”出自由能在2-3kcal/mol的采样波动,是否有物理意义?这个很少有论文去讨论这个报道的准确度与力场精度本身的联系。我的想法是,自由能衡量的是什么呢?是体系在不同能量状态上的分布概率。只要产生的概率分布是对的,自由能就可能是精确的。那精度为10kcal/mol的尺子,我们能估读能量到个位,则必然能反映由个位数能量决定的概率分布的不同,从而得出2-3kcal/mol的精确度。这个估读有物理意义,则自由能准确度也有物理意义。 因此,教科书上提到FEP都说是“估算”自由能,这个估算指的就是物理意义上的估算,就是指用低精度模型(low precision)去大致估量可能超出当前物理精度范围的过程的自由能过程。而所报道的“精确度”(Accuracy,or error, 就是“结果+正负2~3kcal/mol”) 指的是数值意义上的精确度。 Precision与Accuracy定义与区别:精度Precision是采样结果的有效位数,是由测量工具即“尺子”决定的;准确度Accuracy(or say error)是各独立采样结果相对平均值的偏差程度,与体系本身性质的波动和采样方式有关。前者属于绝对误差,后者属于相对误差。想象一个问题,具有同样数值位数的ab initio计算结果与分子力学计算结果有啥差别? [ Last edited by ChemiAndy on 2011-7-6 at 02:13 ] |
34楼2011-07-06 15:06:56
35楼2011-07-07 10:15:33
36楼2011-07-07 10:19:18
37楼2011-07-07 10:22:42
38楼2011-07-08 14:09:16
39楼2011-07-23 09:15:00
40楼2012-04-20 19:03:59
41楼2012-05-05 02:22:40
43楼2014-11-09 20:13:38
44楼2014-11-12 08:29:02
45楼2015-01-17 09:27:24
简单回复
2011-06-30 17:39
回复
奋斗1s(金币+1):谢谢参与
bhj5605楼
2011-06-30 18:03
回复
奋斗1s(金币+1):谢谢参与
bhj5606楼
2011-06-30 18:08
回复
bhj5607楼
2011-06-30 18:08
回复
2011-07-01 05:48
回复
奋斗1s(金币+1):谢谢参与
shuwenhe10楼
2011-07-01 06:10
回复
奋斗1s(金币+1):谢谢参与
v
zhang73110711楼
2011-07-01 07:56
回复
奋斗1s(金币+1):谢谢参与

dufuming42楼
2012-09-06 18:38
回复













回复此楼

。


