24小时热门版块排行榜    

查看: 1269  |  回复: 0

MolAICal

新虫 (初入文坛)

[交流] 使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计

使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计


更多教程(含英文教程)请见如下:
MolAICal官方主页:https://molaical.github.io
MolAICal 文章介绍:https://doi.org/10.1093/bib/bbaa161
MolAICal中文博客:https://molaical.github.io/cntutorial.html
MolAICal blogspot:https://qblab.blogspot.com


1. 简介
胰高血糖素受体(GCGR)是2型糖尿病的一个受体靶点。本教程使用人工智能的方法从头设计GCGR的药物分子,介绍了MolAICal 的标准操作流程。本教程能够帮助药理学家、化学家以及其他科学家根据蛋白的3D活性口袋设计合理药物分子。

2. 工具
2.1. 所需软件下载地址
1) MolAICal: https://molaical.github.io
2) UCSF Chimera: https://www.cgl.ucsf.edu/chimera/
2.2. 操作示例文件
所有用到的操作教程均可在下面的网站下载:
https://github.com/MolAICal/tutorials/tree/master/001-AIGrow

3. 操作流程
3.1. 受体的处理
1.        下载胰高血糖素受体(GCGR)的PDB文件,PDB ID: 5EE7:
https://www.rcsb.org/structure/5EE7
2.        启动 UCSF Chimera软件: File-->Open, 载入PDB 文件 5EE7.pdb(如图1所示)。
使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计
图1. 载入分子

3.        选择并删除被选分子。
选中无用配体: Select-->Residue-->OLA (如图2所示).
使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-1
图2. 选中某个分子

删除无用配体: Actions-->Atoms/Bonds-->delete (如图3所示)。
以上给出了一个简单示例, 可以通过同样的操作继续删除HOH、PE5和TLA等。
使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-2
图3. 删除选中的分子

4.        加氢。Tools-->Structure Editing-->AddH (如图4所示)。
使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-3
图4. 加氢
注意事项: 由于MolAICal使用AMBER力场处理受体,在删除氢原子之前用UCSF Chimera加上氢原子。如果受体中含有冗余的氢原子,请先删除再加上。具体操作首先,选中氢原子: Select-->Chemistry-->element-->H, 然后删除所选氢原子: Actions-->Atoms/Bonds-->delete (如图3所示)。因为GCGR晶体结构中不包含冗余氢原子,所以此处省略该步骤。

5.        保存坐标文件 GCGRH.pdb。保存GCGRH.pdb文件目的是可以方便后续的操作(如图5所示)。  
使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-4
图5. 保存PDB格式的复合物  

6.        选中并删除配体5MV(如图6和7所示)。将无配体结合的GCGR命名为GCGRNoLigand.pdb 文件并保存 (如图8所示)。
使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-5
图6. 选中5MV配体

使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-6
图7. 删除5MV配体

使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-7
图8. 保存PDB格式的受体坐标  

3.2. 处理配体
1.        关闭会话 (File-->Close Session),重新载入GCGRH.pdb文件, 选中配体5MV (如图9和10所示):
使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-8
图9. 关闭会话

使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-9
图10. 选中5MV

2.        Invert (selected models): 反选配体 5MV (如图11所示):  
使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-10
图11. 反选配体5MV

3.        删除反选 (如图12所示):
使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-11
图12. 删除反选  

4.        将配体保存为ligand.pdb。配体分子的片段可以作为药物生长的起始点(如图13所示)。  
使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-12
图13. 保存配体坐标

3.3. 计算生长盒子中心
计算生长盒子的几何中心。(注意: 如果没有配体,可以选择实验中已报道的关键残基作为起始的锚定点)。
1.        关闭会话 (File-->Close Session), 载入GCGRH.pdb, 然后使用图10的方法选择配体 (如图14所示):
使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-13
图14. 选择配体

2.        Tools-->Structure Analysis-->Distance (如图15所示):
使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-14
图15. 选择距离工具

3.        点击Axes/Planes/Centroids, 然后点击 “Define centroid” (如图16所示):
使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-15
图16. 定义质心

4.        选择弹出窗口中的 “OK” (如图17所示)。
使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-16
图17. 定义质心盒子

5.        选择已被定义的质心 (蓝色所示), 然后点击“Report distance” (如图18所示)
使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-17
图18. 点击Report distance

6.        此时可以看到质心为(x, y, z): -30.011, 1.665, -36.581 (如图19所示):
使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-18
图19. 展示盒子的质心坐标

7.        计算最终盒子的大小。你可以将X, Y, Z的长度调整为30, 30, 30。用以下MolAICal命令生成 “box.bild”。(注意: X, Y, Z坐标中的双引号是必不可少的,X, Y, Z坐标之间的间隔距离应该为一个空格。)
CODE:
1)        molaical.exe -tool box -i  "-30.011 1.665 -36.581" -l "30.0 30.0 30.0" -o "D:\workdir\MolAICal\tutorial\GCGR\box.bild"

2)        File-->open,然后打开“box.bild”(如图20所示), 然后检查产生的盒子是否合适 (如图21所示)。
使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-19
图20. 打开box.bild

使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-20
图21. 在GCGR口袋中显示盒子

从图21可以看出,盒子的参数是合适的, 因此最终盒子的质心参数为-30.011, 1.665, -36.581,盒子的长度X, Y, Z 为 30.0, 30.0, 30.0。

3.4. 制作初始生长片段
本教程介绍了两种方法,你可以选择其中任何一种进行药物从头设计。如果受体活性口袋中配体的晶体结构已知的话,我们推荐第一种方法。
方法 1. 从配体的晶体结构中选择片段
在本方法中, 初始片段是从GCGR活性口袋中配体的晶体结构中提取的。
1.        制作初始生长片段。打开上文保存的ligand.pdb文件。通过鼠标和键盘选择原子。
1)        Ctrl + 鼠标左键: 一次选择一个原子。
2)        Ctrl + Shift + 鼠标左键: 同时选择多个原子。
本教程中,我们通过Ctrl + 鼠标左键选择内层原子作为初始生长片段。(选择结果如图22所示)。
使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-21
图22. 选择初始生长部分

2.        反选(已选模型)如图23所示。
使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-22
图23. 选择Invert (selected models)

3.        然后删除反选部分:Actions-->Atoms/Bonds-->delete.
最终选择图24所示分子作为初始片段。
使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-23
图24. 初始生长片段

4.        为了使分子按照正确的方法生长,需要在初始生长片段上加氢,具体操作为:“Tools-->Structure Editing-->AddH” (如图25所示)。  
使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-24
图25. 初始生长片段加氢结果

5.        然后将片段保存为sybyl Mol2格式,命名为“startFrag.mol2” (如图26所示)。
使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-25
图26. 保存初始生长片段的坐标

方法2. 活性口袋中没有配体的晶体结构。
如果在受体活性口袋中没有配体的晶体结构, 你可根据文献报到或者自己的经验选择一个关键残基上的原子,操作同方法1。将该原子做成独立文件,通过序列格式SMILES给出初始片段。MolAICal将自动搜索SMILES格式片段在GCGR口袋中的最佳位置。
将“growMethod”设置为randomFrag。然后添加“startAtomPosition”和“startSmiFrag”参数。“startAtomPosition”包含一个你所选残基中的原子。“startSmiFrag”为你指定的SMILES格式的初始片段文件。参数示例如下:
----------------------------------------------------------------------------------------------------------------------
growMethod                       randomFrag
startFragFile                            D:/GCGR/genstartFrag.mol2
startAtomPosition                    D:/GCGR/resPosition.pdb
startSmiFrag                             C
----------------------------------------------------------------------------------------------------------------------

本教程选择方法1进行药物设计。   

3.5. 运行药物从头设计程序
有两种选择:方法1利用AI 模型及经典程序进行药物从头设计。方法2利用纯经典程序进行药物从头设计。为节省时间,你可以选择以下任何一种方法开始学习。

方法1. 利用AI模型及经典程序的药物从头设计方法
将“libStyle”设置为 AIFrag。实例如下:
----------------------------------------------------------------------------------------------------------------------
#定义可读文库路径:mol2, SMILES, AIFrag
libStyle                     AIFrag
----------------------------------------------------------------------------------------------------------------------
注意: 如果显示错误信息:如“Warning: Atom 9 C.3 overlaps with protein!”及“Warning: some atoms overlap with protein.”你可以用MD模拟工具或者UCSF Chimera最小化受体-配体复合物。只有win64 或者linux64版本的MolAICal可以执行该命令。
按照教程中的描述,将控制台目录转换为 “001-AIGrow”
#> cd 001-AIGrow

最后在后台运行以下命令
linux系统:
#> molaical.exe -denovo grow -i InputParFileAI.dat >& denovo.log &

windows系统 (使用PowerShell):
#> molaical.exe -denovo grow -i InputParFileAI.dat

如果想要在后台进行运算, 你可以运行以下命令:
#> powershell -windowstyle hidden -command “molaical.exe -denovo grow -i InputParFileAI.dat”

方法2. 使用经典程序进行药物从头设计
将“libStyle”设置为mol2。MolAICal将使用用户自定义的文库。实例如下:
----------------------------------------------------------------------------------------------------------------------
# 定义可读文库路径: mol2, SMILES, AIFrag
libStyle                     mol2
----------------------------------------------------------------------------------------------------------------------
Note: 如果显示错误信息:如“Warning: Atom 9 C.3 overlaps with protein!”及“Warning: some atoms overlap with protein.”你可以用MD模拟工具或者UCSF Chimera等软件最小化受体-配体复合物。任意版本的MolAICal可以执行该命令。

MolAICal 可以通过JAVA 并行流调用多个CPU内核,你需要根据电脑的配置文件设置“coreNum”参数。
按照教程中的描述,将控制台目录转换为 “001-AIGrow”。
#> cd 001-AIGrow

在后台运行以下命令
linux系统:
#> molaical.exe -denovo grow -i InputParFileCP.dat >& denovo.log &

windows系统 (使用PowerShell):
#> molaical.exe -denovo grow -i InputParFileCP.dat

如果想要在后台执行运算, 你可以运行以下命令:
#> powershell -windowstyle hidden -command “molaical.exe -denovo grow -i InputParFileCP.dat”

4.        结果
当程序运行结束后你可以找到“results”目录,在本教程中,循环周期设置为30,使用30个CPU核心运算1-2天完成整个计算。如果你想查看结果,打开001-AIGrow中的“results”目录,其中名为“AstatisticsFile.dat”的文件包含了药物设计的信息。该文件仅为示例文件并不包含所有结果。在文件“AstatisticsFile.dat”中将看到以下信息:
----------------------------------------------------------------------------------------------------------------------
ID  Name  Cluster  Affinity(kcal/mol) Formula  InChIKey  Synthetic_Accessibility
1  lig_1.mol2 [1]  -3.27  C9H13N6O14S2  BEQXRJFDXZCPLY-GRQBKTHUSA-O  77.41
2  lig_2.mol2 [1]  -7.67  C13H13N11O9S  IQOZHKOALGXOOC-WVXRZKCLSA-O  75.31
…………….
----------------------------------------------------------------------------------------------------------------------
“Affinity”表示结合能力打分。“Cluster”代表k-means 聚类结果。你可以选择有代表性的配体应用到研究中。Synthetic_Accessibility 分值从0到100,分值100表示该化合物是理论上最易合成的。例如,在UCSF Chimera中载入“GCGRNoLigand.pdb”, “ligand.mol2” 和 “lig_2.mol2”文件 (如图27)。其中红色的小分子是“lig_2.mol2”。结果表明MolAICal生成了与GCGR原始配体类似的小分子。
使用MolAICal的深度学习模型和经典算法程序进行GCGR的从头药物设计-26
图27. 药物设计的结果

注意: 你可能发现羟基上可能有奇怪的氢原子。这可能是深度学习模型产生的不规则分子导致的。这个氢原子并不参与结合能力打分。你可以用UCSF Chimera删除该氢原子,然后再加氢。为了进一步精确地评估这些配体与GCGR受体的结合能力, 推荐使用分子动力学模拟和MM/GBSA进行计算评估。
回复此楼

» 猜你喜欢

» 本主题相关商家推荐: (我也要在这里推广)

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 MolAICal 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见