24小时热门版块排行榜    

查看: 1328  |  回复: 0

MolAICal

新虫 (初入文坛)

[交流] 使用MolAICal的深度学习模型和分子对接程序进行药物的虚拟筛选

使用MolAICal的深度学习模型和分子对接程序进行药物的虚拟筛选

更多教程(含英文教程)请见如下:
MolAICal官方主页:https://molaical.github.io
MolAICal 文章介绍:https://doi.org/10.1093/bib/bbaa161
MolAICal中文博客:https://molaical.github.io/cntutorial.html
MolAICal blogspot:https://qblab.blogspot.com


1. 简介
一种新药的研发大概需要耗费26亿美元。即使有大量资金的投入,90%的新药仍会在临床试验和获批上市过程中夭折[1]。本教程介绍了MolAICal基于人工智能和分子对接进行药物虚拟筛选的流程,其中model.pdb是优化的蛋白质模型文件,你可以替换成自己的蛋白质模型。此方法将帮助药物学家、化学家及其它领域的科学家根据靶点的活性口袋合理设计药物。

2.工具

2.1. 所需软件下载地址
1)        MolAICal (win64 or linux64):  https://molaical.github.io
2)        UCSF Chimera:  https://www.cgl.ucsf.edu/chimera/
3)        MGLTools:  https://ccsb.scripps.edu/mgltools/downloads/
4)        Python:  https://www.python.org/
5)        Pymol:  https://www.lfd.uci.edu/~gohlke/pythonlibs

前四个软件的安装相对简单,可根据提示轻松完成安装。Pymol的安装需要numpy, pmw, pymol_launcher 和 pymol组件,上述四个组件的版本需要与你操作系统上选择的Python版本保持一致,这些组件可在下面的网站下载:  https://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy       https://www.lfd.uci.edu/~gohlke/pythonlibs/#pymol-open-source
下载后把对应版本的numpy, pmw, pymol_launcher 和 pymol组件放到同一个文件中,使用以下命令安装Pymol:
CODE:
#> pip install --no-index --find-links="%CD%" pymol_launcher

Pymol软件名称为“pymol.exe”将安装在Python目录下的“Scripts”文件夹中。你可以在桌面创建此软件的快捷方式。确保所有的软件正确安装。

2.2. 操作示例文件
所有用到的操作教程文件均可在下面的网站下载:
https://github.com/MolAICal/tutorials/tree/master/002-AIVS

3. 操作流程
这一步是在分子对接前的蛋白质结构处理。如果你熟悉Autodock vina,请自动忽略该步。你可以在https://youtu.be/-GVZP0X0Tg8 网站上观看或者在https://vina.scripps.edu/tutorial.html网站上下载该步的教程视频进行学习。为了使本教程更加完善,处理蛋白结构的步骤陈述如下:

3.1. 使用UCSF Chimera将蛋白质和配体结构分开
1)        首先,在UCSF Chimera中载入复合物结构。File-->Open-->model.pdb (如图1所示)
使用MolAICal的深度学习模型和分子对接程序进行药物的虚拟筛选
图1. 载入蛋白结构文件

2)        选择配体LIG并将其删除 (如图2所示)。使用图2中相同的方法将水HOH选中并删除。  
使用MolAICal的深度学习模型和分子对接程序进行药物的虚拟筛选-1
图2. 选中并删除配体

3)        保存没有配体的蛋白质结构并且命名为“protein.pdb” (如图3所示)。  
使用MolAICal的深度学习模型和分子对接程序进行药物的虚拟筛选-2
图3. 保存蛋白质结构

4)        关闭本次会话, 重新载入“model.pdb”, 选择配体,反选并删除反选的蛋白 (如图4所示)。
使用MolAICal的深度学习模型和分子对接程序进行药物的虚拟筛选-3
图4. 选中并删除受体蛋白

5)        将配体文件保存为“ligand.pdb” (如图5所示)。
使用MolAICal的深度学习模型和分子对接程序进行药物的虚拟筛选-4
图5. 保存配体文件

3.2. 计算盒子质心和长度
1.参照上述步骤选择配体或者重新载入“ligand.pdb” 并选择配体。然后选择距离工具: Tools-->Structure Analysis-->Distance (如图6所示):
使用MolAICal的深度学习模型和分子对接程序进行药物的虚拟筛选-5
图6. 选择距离工具

2. 根据配体计算蛋白质活性口袋的质心坐标 (如图7所示)。
使用MolAICal的深度学习模型和分子对接程序进行药物的虚拟筛选-6
图7. 获得质心坐标

创建 “conf.txt” 并将质心坐标写入该文件:
--------------------------------------------------------------------------------
center_x = -10.733
center_y = 12.416
center_z = 68.829
--------------------------------------------------------------------------------
注意: 配置文件的文件名 “conf.txt” 是固定的。 如果你使用其它字母创建文件名,MolAICal 将不能识别该文件名。

3. 设置对接盒子的体积
计算最终盒子尺寸。你可以将X, Y, Z长度分别设置为25, 30, 25。在MolAICal中使用下文提到的命令生成“box.bild” (注意: X, Y, Z 坐标的双引号是必须添加的,X, Y, Z坐标之间的间隔为一个空格。):
1)  执行以下命令,获得“box.bild” :
CODE:
#> molaical.exe -tool box -i  "-10.733 12.416 68.829" -l "25.0 30.0 25.0" -o "box.bild"

2)  File-->open,然后打开“box.bild”,检查生成的盒子大小是否合适 (如图8所示)。  
使用MolAICal的深度学习模型和分子对接程序进行药物的虚拟筛选-7
图8. 使用UCSF Chimera打开box.bild

如上图所示盒子大小25, 30, 25是合适的,因此确定最终质心参数为-10.733, 12.416, 68.829, 最终盒子沿X, Y, Z轴的长度为25.0, 30.0, 25.0。

注意: 如果你用VMD软件计算了几何中心,最终的中心点参数将是-10.86, 12.57, 68.82。这两种方法得到的结果都可以用于本教程,本教程暂使用UCSF Chimera算出来的质心坐标。     

3.3.虚拟筛选前将蛋白质结构转换为pdbqt 格式
1. 打开“AutoDockTools”, File-->Read Molecule-->protein.pdb, 加上极性氢 (如图9所示)。
使用MolAICal的深度学习模型和分子对接程序进行药物的虚拟筛选-8
图9. 加极性氢

2. 将蛋白保存为PDBQT格式。Grid-->Macromolecule-->Choose…,然后点击“protein”选择 “Select Molecule” ,将蛋白结构保存为“pro.pdbqt” (如图10所示).
使用MolAICal的深度学习模型和分子对接程序进行药物的虚拟筛选-9
图10. 用PDBQT格式保存蛋白

到处为止所有文件准备就绪。

3.4. 用深度学习模型和分子对接进行虚拟筛选

#> cd 002-AIVS

最后在后台运行以下命令:
Linux系统:
CODE:
#> molaical.exe -dock AI -s ZINCMol -n 6 -nf 3 -nc 3 >& vs.log &
-n: 代表对接产生的总分子数目
-nf: 单个文件夹中包含的分子数量
-nc: 执行命令使用的CPU数

Windows系统 (使用PowerShell):
CODE:
#> molaical.exe -dock AI -s ZINCMol -n 6 -nf 3 -nc 3
如果要在后台运行,请执行下面的命令:
#> powershell -windowstyle hidden -command “molaical.exe -dock AI -s ZINCMol -n 6 -nf 3 -nc 3”

如果你想依据已知的药物数据库进行经典的虚拟筛选,可以参考MolAICal教程中药物设计部分的第三部分(https://molaical.github.io/tutorial.html)。


4. 结果
你可使用Open Babel将分子的PDBQT格式转化为PDB格式,然后在使用UCSF Chimera打开查看结果。Pymol可以直接载入PDBQT格式的分子。本教程使用Pymol 软件 (https://www.lfd.uci.edu/~gohlke/pythonlibs) 展示结果 (如图11所示)。结果显示MolAICal通过深度学习模型和分子对接程序获得了与现有配体相似的类似物。  
使用MolAICal的深度学习模型和分子对接程序进行药物的虚拟筛选-10
图11. 绿色配体N3是原蛋白受体的抑制剂,黄色配体由深度学习模型和分子对接计算而得。


参考文献

1.        Fleming N. How artificial intelligence is changing drug discovery, Nature 2018;557:S55-S55.
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 MolAICal 的主题更新
普通表情 高级回复 (可上传附件)
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[考研] 梁成伟老师课题组欢迎你的加入 +8 一鸭鸭哟 2026-03-14 9/450 2026-03-16 17:35 by 沐霖12138
[考研] 070303 总分349求调剂 +3 LJY9966 2026-03-15 5/250 2026-03-16 14:24 by xwxstudy
[考研] 0703化学调剂 290分有科研经历,论文在投 +7 腻腻gk 2026-03-14 7/350 2026-03-16 10:12 by houyaoxu
[考研] 0856专硕279求调剂 +5 加油加油!? 2026-03-15 5/250 2026-03-15 11:58 by 2020015
[考研] 材料专硕326求调剂 +4 墨煜姒莘 2026-03-15 4/200 2026-03-15 11:02 by dyw
[考研] 085601材料工程315分求调剂 +3 yang_0104 2026-03-15 3/150 2026-03-15 10:58 by peike
[考研] 297一志愿上交085600求调剂 +5 指尖八千里 2026-03-14 5/250 2026-03-14 17:26 by a不易
[考研] 一志愿哈工大材料324分求调剂 +5 闫旭东 2026-03-14 5/250 2026-03-14 14:53 by 木瓜膏
[考研] 材料080500调剂求收留 +3 一颗meteor 2026-03-13 3/150 2026-03-14 10:54 by peike
[考研] 328,0703考生求调剂,一志愿为东北师范大学 +4 观素律 2026-03-09 5/250 2026-03-14 01:24 by JourneyLucky
[考研] 271求调剂 +10 生如夏花… 2026-03-11 10/500 2026-03-14 00:35 by 卖报员小雨
[考研] 279求调剂 +3 抓着星星的女孩 2026-03-10 3/150 2026-03-13 23:47 by userper
[考研] 285 求调剂 资源与环境 一志愿北京化工大学 +3 未名考生 2026-03-10 3/150 2026-03-13 23:04 by JourneyLucky
[考研] 0856材料与化工301求调剂 +5 奕束光 2026-03-13 5/250 2026-03-13 22:00 by 星空星月
[考研] 材料工程调剂 +4 咪咪空空 2026-03-11 4/200 2026-03-13 19:57 by JourneyLucky
[硕博家园] 085600 260分求调剂 +3 天空还下雨么 2026-03-13 5/250 2026-03-13 18:46 by 天空还下雨么
[考研] 302求调剂 +6 负心者当诛 2026-03-11 6/300 2026-03-13 16:11 by JourneyLucky
[考研] 求调剂 +3 程雨杭 2026-03-12 3/150 2026-03-13 15:06 by JourneyLucky
[考博] 福州大学杨黄浩课题组招收2026年专业学位博士研究生,2026.03.20截止 +3 Xiangyu_ou 2026-03-12 3/150 2026-03-13 09:36 by duanwu655
[考研] 研究生招生 +3 徐海涛11 2026-03-10 7/350 2026-03-12 14:26 by 徐海涛11
信息提示
请填处理意见