| 查看: 1580 | 回复: 3 | |||
| 【奖励】 本帖被评价2次,作者xttide增加金币 1 个 | |||
| 当前主题已经存档。 | |||
[资源]
【分享】转载:AutoDock使用札记
|
|||
|
AutoDock在2.0以前使用的是模拟退火算法(Simulated Annealing Algorithm),在其后的版本中改为了拉马克遗传算法(Lamarckian Genetic Algorithm,LGA)。Autodock和Dock一样,都是基于格点(grid)的计算,首先用围绕受体活性位点的氨基酸残基形成box,然后用不同类型的原子作为探针(probe)进行扫描,计算格点能量,然后对配体在box范围内进行构象搜索(conformational search),最后根据配体的不同构象(conformation),方向(orientation)和位置(position)进行评分(scoring),排序(ranking)。 AutoDock虽然提供了诸如ADT(AutoDock Tools),BDT的图形界面工具,但是我们仍然认为其是一个字符界面运行的分子对接软。由于运算速度不快,所以在字符界面下对于运算的管理更为方便,可以将长时间的运算放在后台运行。对于输入文件的准备问题,Autodock有其自带的一些程序,比如addsol等,同时ADT(AutoDock Tools)也提供了一些python脚本(路径:MGLTools/MGLToolsPckgs/AutoDockTools/Utilities24),可以代替这些程序来进行输入文件的处理。 本手册按照以下顺序编写: Autodock分子对接流程 AutoDock结果分析 AutoDock用于虚拟筛选 AutoDock Tools简介 ※※※※※※ 手册以外的话 ※※※※※※ 1、autodock只能对单分子文件对接(一个文件只含有一个分子),不能对多分子文件筛选,所以,对于含有多个分子的文件(比如multi_mol2以及sdf),需要将之分解为多个单分子文件。有以下方法实现: i)使用babel: $babel -imol2 specs_p0.0.mol2 -o specs.mol2 -split 将生成specs0001.mol2,specs0002.mol2 ... ii)使用splitmol(DOCK软件包中程序,只能对mol2和pdb文件进行分解): $mkdir specs_p0.0 $cd specs_p0.0 $splitmol -mol2 ../specs_p0.0.mol2 将生成split00001,split00002,... 2、利用上面命令分解得到的单分子文件,外面的名称和分子内部的名称不符,可以通过编写教本批量重命名: 适用于ZINC数据库中的mol2数据集: for i in split* do mv $i $(grep ZINC $i).mol2 done 提取包含ZINC所在行的字段,在ZINC数据库中,恰巧为分子的名称。最后,全部命名为ZINC××××××.mol2。 3、AutoDock官方发布版本不能用于并行运算(有的课题组开发了并行版本,但并未发布)。为了提高效率,可以将几十万个分子文件分为几百个部分,每个1000个分子。 将specs数据库的20万个分子文件按照1000个分子为一组(每组为一个目录),分为20个目录 $mkdir specs_0.0_01 $mv specs0.0.mol2 ../specs_0.0_01 利用通配符将前999个分子转移入新文件夹,实现分装目的。 $ls ../specs_0.0_01 | wc [-w] 查看文件个数 4、在AutoDock输入文件的准备中,使用了很多外部程序,比如Sybyl(Tripos Ltd.)。小分子三维结构数据库都有在线免费的。如果想要构建自己的化合物库,可以用ChemDraw(商业)或ISIS/Draw(免费)画好后,存为二维格式(推荐用mol格式),然后用Corina等软件转化成三维结构。 -------------------------------------- ※※※※※※ Autodock分子对接流程 ※※※※※※ 1、受体文件准备: Atudock运算的受体加极性氢(polar hydrogens, essential_only hydrogens),加Kollman United点电荷。首先把PDB蛋白文件中除蛋白以外的所有物质全部删除(可以在Sybyl中操作),保存未macro.pdb。加氢加电荷通过自由软件pmol2q可以很好实现: $pmol2q macro.pdb macro.mol2 选择加氢,加电荷,pmol2q可以输出mol2,pdbq以及pdbqs文件。 在Autodock3中,受体的格式为pdbqs,可以通过如下方法准备: i)通过AutoDock软件包中程序: SGI Irix下运行: %mol2fftopdbq macro.mol2 > macro.pdbq %addsol macro.pdbq macro.pqdbs 以上两个命令可以通过一个命令实现: %mol2topdbqs macro.mol2 Linux下运行: $mol2topdbq macro.mol2 > macro.pdbq $addsol macro.pdbq macro.pqdbs ii)通过ADT中python脚本: $pythonsh $adtpy/prepare_receptor.py -r macro.mol2 [-o macro.pdbqs] -C 注: -C:保留原有电荷 在Autodock4中,受体的格式为pdbqt,与PDB格式类似,包含点电荷 ('Q')和AutoDock4原子类型('T')。可以通过如下方法准备: $pythonsh $adtpy/prepare_receptor4.py -r macro.mol2 [-o macro.pdbqs] -C 注: 也可以由python脚本中的pdbqs_to_pdbqt.py来将autodock3的gpf文件转化。 -o:不加则自动生成文件名相对应的pdbqt文件。 -C:保留原有电荷,否则添加Gaster电荷 2、配体文件准备: 在Autodock3中,配体的格式为pdbq,可以通过如下方法准备: i)通过AutoDock软件包中程序: %deftors lig.mol2 ii)通过ADT中python脚本: $pythonsh $adtpy/prepare_ligand.py -l lig.mol2 [-o lig.pdbq] -C 注: -C:保留原有电荷 -o:不加则自动生成文件名相对应的pdbq文件。 在Autodock4中,配体的格式为pdbqt.可以通过如下方法准备: $pythonsh $adtpy/prepare_ligand4.py -l lig.mol2 [-o lig.pdbqt] -C 注: 也可以由python脚本中的pdbq_to_pdbqt.py来将autodock3的gpf文件转化: $pythonsh pdbq_to_pdbqt -s lig [-o lig.pdbqt] 3、准备GPF(grid parameter file)文件: Autodock3: i)通过AutoDock软件包中程序: $mkgpf4 lig.pdbq macro.pdbqs 注: 程序包中有mkgpf3,不过mkgpf4是其修正后的版本,建议使用mkgpf4,这个与autodock4没有关系。 ii)通过ADT中python脚本: $pythonsh $adtpy/prepare_gpf.py -r macro.pdbqs -l lig.pdbq Autodock4(只能通过ADT中python脚本): $pythonsh $adtpy/prepare_gpf4.py -r macro.pdbqt -l lig.pdbqt [-p gridcenter='x y z'] [-o lig.macro.gpf] 注:也可以由python脚本中的gpf3_to_gpf4.py来将autodock3的gpf文件转化。 -o:输出文件名 -p parameter=value:输入参数值 注: 1、准备gpf文件时,最好通过ADT图形界面进行,这是因为: i)gpf文件中活性位点(center grid)默认根据配体位置定义(auto),需要修改为晶体结构中配体的具体坐标值; ii)盒子(box)大小在图形界面中可以很方便的调整。 iii)在虚拟筛选中需要添加更多的院子类型,在图形界面中操作非常方便。 2、配体的原子类型说明: AD3和AD4的原子类型写法差异很大,而且,在gpf文件中,表达格式差异也很大。在AD4中,各种原子类型写在一行中,每种类型以空格间隔,但是在AD3中,须对每种原子类型的具体参数(作用半径)进行定义,比较繁琐。下面是两种版本中原子类型的写法: ----------------------- AD3: C carbon (aliphatic) A carbon (aromatic) N nitrogen O oxygen P phosphorus S sulphur H hydrogen f iron F fluorine c chlorine b bromine I iodine ----------------------- AD4(共22种,下表中有7中重复,在autodocksuite-4.0.0/src/autodock-4.0.0/AD4_parameters.dat文件) H Non H-bonding Hydrogen HD* Donor 1 H-bond Hydrogen HS Donor S Spherical Hydrogen C* Non H-bonding Aliphatic Carbon A* Non H-bonding Aromatic Carbon N* Non H-bonding Nitrogen NA* Acceptor 1 H-bond Nitrogen NS Acceptor S Spherical Nitrogen OA* Acceptor 2 H-bonds Oxygen OS Acceptor S Spherical Oxygen F Non H-bonding Fluorine Mg Non H-bonding Magnesium MG Non H-bonding Magnesium P Non H-bonding Phosphorus SA* Acceptor 2 H-bonds Sulphur S Non H-bonding Sulphur Cl Non H-bonding Chlorine CL Non H-bonding Chlorine Ca Non H-bonding Calcium CA Non H-bonding Calcium Mn Non H-bonding Manganese MN Non H-bonding Manganese Fe Non H-bonding Iron FE Non H-bonding Iron Zn Non H-bonding Zinc ZN Non H-bonding Zinc Br Non H-bonding Bromine BR Non H-bonding Bromine I Non H-bonding Iodine ----------------------- 注: *默认在gpf中存在的原子类型 $bable -imol2 lig.mol2 -obox box 0.375 4、准备DPF(docking parameter file)文件: Autodock3: i)通过AutoDock软件包中程序: $mkdpf3 lig.pdbq macro.pdbqs ii)通过ADT中python脚本: $pythonsh $adtpy/prepare_dpf.py -r macro.pdbqs -l lig.pdbq Autodock4(只能通过ADT中python脚本): $pythonsh $adtpy/prepare_dpf4.py -r macro.pdbqs -l lig.pdbqt -p ga_num_evals=25000000 -p ga_run=2 -p ga_run=50 注: 也可以由python脚本中的dpf3_to_dpf4.py来将autodock3的gpf文件转化。 -p parameter=value:输入参数值 注: 此处生成的dpf需要编辑其中的参数,对遗传算法的精度进行设置。dpf文件中参数设置: 'ga_' 起始行参数:genetic algorithm 'sw_' 起始行参数:Solis and Wets local search method ga_run:最好在50以上(默认10) 5、通过AutoGrid计算格点能量: $autogrid3/4 -p macro.gpf -l macro.glg 注: AutoGrid默认计算8种原子类型,可以通过修改源代码,使其计算更多院子类型的格点能量。 6、通过AutoDock进行分子对接: $autodock3/4 -p lig.macro.gpf -l lig.macro.glg 注: 和AutoGrid一样,AutoDock默认计算8种原子类型,可以通过修改源代码,使其计算更多院子类型的格点能量。 7、提取结果: $get-docked lig.macro.dlg 注: 生成lig.macro.dlg.pdb文件 -------------------------------------- ※※※※※※ AutoDock结果分析 ※※※※※※ AutoDock产生的构象和评分值(单位kcal/mol,AD4提供了RMSD值)保存为PDB格式,这种格式没有mol2格式操作方便。 1、编写脚本提取PDB文件中的评分值 adgrep3(适用于AutoDock3): egrep 'Run|Final Docked Energy' *.pdb adgrep4(适用于AutoDock3): egrep 'DOCKED: USER Run|Cluster Rank|RMSD from reference structure|USER Estimated' *.dlg 当然,也可以用sort命令进行排序。不过,由于分值和编号不在一行中,排序后,分值和编号就不能对应起来。所以先通过查找替换把二者放在一行中,很简单,就是仅把编号后的回车符删除,这样,分值就自动退到编号的一行,然后对分值排序。在Linux中,回车符为"\n",Windows下为"\r\n"。 $sort -r +n score.txt 2、用于分析AutoDock运算结果中受体-配体相互作用的图形化软件中,理论上最好用的应该是ADT(我没有用过,在Linux下非常慢,可能是由于从工作站上调用,显示延迟的缘故,而在Windows机器上总是无故退出)。我用过的最好用的是Vida(Openeye Ltd.),以前提供2个月的试用版,我还申请过1年的学术用户版,但一年后License过期,就没的用了。当然,把系统时间调整回到License有效期内,还是可以使用(Openeye公司的软件都是精品呵)。Vida可以同时读入受体、参考分子(这里是晶体结构中的配体)和对接得到的构象,显示非常好看的ribbon形态和氢键,作图效果一流,不过操作起来不是很人性化。 AutoDock的手册示例中使用Sybyl软件对结果进行分析,不过Sybyl每次只能从PDB文件中读入1个分子,还是不很方便。 没有尝试UCSF chimera是不是可以,不过,看其对DOCK处理的得心应手,应该差不多。 -------------------------------------- ※※※※※※ AutoDock用于虚拟筛选 ※※※※※※ 利用AutoDock进行虚拟筛选:I.目录结构: $VSTROOT $VSTROOT/Results/ $VSTROOT/scripts/ $VSTROOT/VirtualScreening/ $VSTROOT/VirtualScreening/etc:预先对晶体复合物进行分子对接,用于重现晶体结构结合模式,以此考察分子对接软件是否适用于改体系。 $VSTROOT/VirtualScreening/Ligands:包含所有小分子(pdbqt格式) $VSTROOT/VirtualScreening/Receptor:包含所有受体和参照分子文件(pdbqt格式),以及通过gpf生成的map文件,xyz文件((grid size file),fld文件(grid field file)。 $VSTROOT/VirtualScreening/Dockings:虚拟筛选时,对于每个小分子产生目录。在各目录中:将../Ligands/中对应的小分子文件复制到此处;为../Receptor/中macro.pdbqt以及*map*在此处建立快捷方式;通过python脚本prepare_dpf4.py生成dpf文件;运行autodock进行分子对接。 -------------------------------------- 利用AutoDock进行虚拟筛选:II.脚本解析(csh) i)将配体的mol2文件转化为pdbqt文件(Ligands目录): ########################## #!/bin/csh foreach f(*.mol2) pythonsh $adtpy/prepare_ligand4.py -l $f [-o "$f"qt] [-d ligand_dict.py] end ########################## OR: ########################## #!/bin/bash for f in *.mol2 do pythonsh $adtpy/prepare_ligand4.py -l $f [-o "$f"qt] [-d ligand_dict.py] done ########################## 注: -d:生成文件记录每个分子中的原子类型信息,用于下面的autogrid计算。 ii)准备受体对接文件(Receptor目录:*.gpf,*.map,*.fld) ########################## $pythonsh $adtpy/prepare_receptor4.py -r macro.mol2 [-o macro.pdbqt] -C $pythonsh $adtpy/prepare_gpf4.py -r macro.pdbqt -l lig.pdbqt $autogrid4 -p macro.gpf -l macro.glg ########################## 注: 编辑gpf文件,添加足够多的配体原子类型,然后一劳永逸地对每个原子类型进行格点能量计算。原子类型详见上一部分。 iii)准备晶体结构中配体对接文件(etc/目录) ########################## #!/bin/csh mkdir 2cdz cd 2cdz cp ../../Ligands/2cdz_lig.pdbqt . ln -s ../../Receptor/2cdz.pdbqt . ln -s ../../Receptor/2cdz*map* . pythonsh $adtpy/prepare_dpf4.py -l 2cdz_lig.pdbqt -r 2cdz.pdbqt [-o 2cdz_lig_2cdz.dpf] -p ga_num_evals=25000000 -p ga_run=2 unlimit stacksize autodock4 -p 2cdz_lig_2cdz.dpf -l lig_2cdz.dlg tail ind_x1hpv.dlg ########################## iv)准备配体对接文件并开始对接(Docking目录): ########################## #!/bin/bash cd Ligands ls *.pdbqt > ../Docking/ligand.list cd ../Docking for i in $(cat ligand.list) do f=${i%.pdbqt} mkdir $f cd $f cp ../../Ligands/$i . ln -s ../../Receptor/*map* . ln -s ../../Receptor/macro.pdbqt . pythonsh $adtpy/prepare_dpf4.py -l $i -r macro.pdbqt [-o $f_macro.dpf] -p ga_num_evals=25000000 -p ga_run=2 autodock4 -p $f_macro.dpf -l $f_macro.dlg cd .. done ########################## --------------------------------------- ※※※※※※AutoDock Tools简介※※※※※※ AutoDock Tools属于MGLTools软件,这是MGL小组开发的图形软件,包含3个模块:ADT,PMV和Vision。 MGLTools is a software developed at the Molecular Graphics Lab (MGL) of the Scripps Research Institute for visualization and analysis of molecular structures. Short description and demo of its three main applications is given below. Navigation portlet on the left has links to downloads, screenshots, documentation section of this website where you can find more information about MGLTools. --------------------------------------- 安装MGLTools:两种方法: 方法一: 1、下载MGLTools-1.4.5-Linux-x86-Install(32-bit) http://mgltools.scripps.edu/downloads/instructions/linux 2、$chmod +x MGLTools-1.4.5-Linux-x86-Install 3、su 切换为root 4、#./MGLTools-1.4.5-Linux-x86-Install 启动安装界面,默认路径为/usr/local/MGLTools-1.4.5 5、设定环境变量和系统路径: #vi /etc/bashrc export MGL_ROOT=/usr/local/MGLTools-1.4.5 PATH=$MGL_ROOT/share/bin:$MGL_ROOT/i86Linux2/bin:$PATH :wq 6、退出root用户,并source /etc/bashrc 方法二: 如果安装文件MGLTools-1.4.5-Linux-x86-Install不能运行,可以下载压缩文件 mgltools_i86Linux2_1.4.5.tar.gz(32-bit),解压后进行安装 $source install.sh 出现图形界面,选择non-commercial,自动选中agree,点击continue继续安装成功,设定变量和路径。 注:两种安装方法都会出现图形界面,所以如果远程字符界面安装,建议使用第一种方法先在本地安装,再将安装好的目录压缩上传至远程目录,解压后设定变量即可。而第二种方法中会有数个压缩文件与已解压文件重复,增大容量,不建议用于以上操作。 ---------------------------------------- 本文档PDF格式下载 来源: http://www.sciencenet.cn/blog/fwangj.htm [search]autodock[/search] [ Last edited by mingdong on 2008-12-11 at 15:29 ] |
» 收录本帖的淘帖专辑推荐
分子对接 |
» 猜你喜欢
🌟 比利时新鲁汶大学(UCLouvain)诚邀CSC博士加入Pascal Gehring教授团队
已经有0人回复
第一性原理计算方向2026级博士申请 PRB*1,四级484
已经有1人回复
物理学I论文润色/翻译怎么收费?
已经有243人回复
求助VISSIM破解版软件
已经有0人回复
求2026年在台湾举行的物理和材料领域国际学术会议信息
已经有0人回复
求国际会议网站
已经有1人回复
求取一些关于纳米材料和纳米技术相关的英文PPT。
已经有0人回复
【复旦大学】二维材料方向招收2026年博士研究生1名
已经有0人回复
北京纳米能源与系统研究所 王中林院士/曹南颖研究员课题组2026级硕/博/博后招生
已经有10人回复
荷兰Utrecht University超快太赫兹光谱王海教授课题招收2026 CSC博士生
已经有12人回复
» 本主题相关商家推荐: (我也要在这里推广)
2楼2008-09-12 06:47:39
简单回复
shangech3楼
2008-10-05 15:47
回复


















回复此楼
