|
[求助]
NAMD/lambda-REMD segmentation fault/ Desmond ligand mutation fep
大家好
我计划做一个NMAD FEP/ lambda-REMD 计算两个小分子配体对一个蛋白靶点的结合自由能差异 (relative binding affinity by free energy pertubation), 脚本文件均有CHARMM-GUI input generator 产生。
一共有5个脚本,其中1,2 非常简单,第三个为关键运行脚本如下图附件,其中已经列出我所使用的cluster node 的配置信息,以及namd 的运行代码,namd2 equ_$system.namd >...一行已经运行完毕,没有问题。(实际运行时,加了+p32, 以使得namd/2.13-multicore 使用32个cpu 进行32 threads 的计算)。 问题出在后面的 namd2 + replicas 32... 环节, 错误提示是segmentation fault, 通常的解释是首先怀疑磁盘空间不够用,已经尝试将PBS -l mem=16gb, 增加至 —PBS -l mem=32gb, 仍然出现同样的报错。同样也已经尝试 ulimit -s unlimited, 无效。
为了做trouble shotting, 我没有一次提交附件1的pbs 文件至我所使用的cluster, 也就是没有使用batch 模式,而是使用interactive job模式,即首先申请#PBS -l 所要求的资源,分配我node 后, 手动load 所需运行环境:module load intel/18.0.1.163
module load openmpi/3.1.2-intel
module load namd/2-13-multicore (or namd/2-13-mpi ???)
现在已知代码namd2 equ_$system... 一行运行无错误, 因为手动单独运行该行命令(实际运行时加了 +p32, 因为申请了32 块CPU),几小时后可成功得到结果 equ_site.out (namd/2.13-multicore)
好像无法单独运行 namd2 +replicas ... , 因为互相迭代关系的存在?我尝试单独运行第一行 replicas 即变量为0时 提示restart number wrong。
为了一起运行后面有问题的 namd2 +replicas ,,,, 我删除了没问题的 equ_$system 行, 剩下的部分单独做了一个附件2的脚本。
然后使用命令“csh 附件2.csh” 提交该csh 脚本(node 默认语言环境为bash,而charm-gui 生成脚本为csh),然后就会出现上面提到的segmentation fault. 而是时大量刷屏出现的那种,感觉上replicas 迭代试图运行,但是每一个都遇到该segmentation fault问题,单仅为猜测。
有几个问题:1 namd/2.13-multicore 是否支持 REMD simulation ?
2. 如果需要load namd/2.13-mpi, 如何运行?namd2 ? mpirun ?
3. 是否必须要通过replica exchange MD (REMD) 才能做FEP ?
4. 关于bash/csh 的切换,是否恰当?
谢谢!
附件1.png
附件2.png
附件3.png |
|