使用MolAICal进行药物ADMET的预测和分子属性的计算
作者:Qifeng Bai(update 2022-5-11)
更多教程(含英文教程)请见如下:
MolAICal官方主页:https://molaical.github.io
MolAICal官方主页中国镜像:https://molaical.gitee.io
MolAICal 文章介绍:https://arxiv.org/abs/2006.09747 和 https://doi.org/10.1093/bib/bbaa161
MolAICal中文博客:https://molaical.github.io/cntutorial.html
MolAICal Twitter:https://twitter.com/MolAICal
MolAICal QQ学术讨论群: 1151656349
1. 简介
由于毒性和不可接受的疗效,导致大约有40%的候选药物研发失败。在这种情况下,药物ADMET(吸收,分布,代谢,排泄和毒性)的预测在候选药物研发中起到重要作用。在本教程中,介绍了使用MolAICal和FP-ADMET [1] 进行药物ADMET和分子属性的预测。有关更详细的MolAICal介绍,请阅读本文(https://doi.org/10.1093/bib/bbaa161)。
2. 方法和材料
2.1. 软件要求
1) MolAICal: https://molaical.github.io 或 https://molaical.gitee.io
注意 : 请确保MolAICal安装正确! 本教程需要使用目前开发版本的MolAICal(Development version),本功能会添加在MolAICal v2.x(含版本2.0) 。
2.2. 本教程所需文件
1) 所有在教程中的重要文件可以从该网址下载:
https://gitee.com/molaical/tutorials/tree/master/018-admet
Part I. 药物的ADMET计算
1. 安装FP-ADMET
目前只支持Linux版本的MolAICal实现Part I的教程。
1) 点击并打开FP-ADMET的下载网址: DownloadModel
然后在打开的网址上依次打开 “AImodels-->ADMET-->FPADMET-->linux64”,并下载文件“fpadmet.tar.gz”
2) 将“fpadmet.tar.gz”移到文件夹“MolAICal-xxx/mtools”中。其中“MolAICal-xxx”是MolAICal的解压安装目录。而“mtools”是“fpadmet.tar.gz”要移入的目录。
3) 解压文件CODE: #> tar -xzvf fpadmet.tar.gz
切换到目录fpadmet:CODE: #> cd fpadmet
4) 安装fpadmetCODE: #> chmod +x install.sh
#> ./install.sh
现在已成功安装fpadmet。
2. 计算药物的ADMET步骤
2.1. ADMET计算所需文件的格式
用户需要输入正确的文件格式,如图1所示:每一行包含一个分子的SMILES序列和分子名称,其中第一列是分子的SMILES序列,第二列是分子名称;且第一列与第二列之间至少含有1个空格。
图1. 输入文件的格式
2.2. 计算所有SMILES格式分子的ADMET条目
切换到目录018-admet, 并运行如下命令:CODE: #> molaical.exe -model fpadmet -s all -i mols.smi -o results.dat
结果的解释:命令运行完毕后将输出一个结果文件“results.dat”。打开文件“results.dat”, 可以发现里面包含了所有分子的所有ADMET条目的计算结果。例如,预测Blood–brain-barrier penetration (条目2) 和pKa dissociation constant (条目50) 的结果如下:CODE: 2: Blood–brain-barrier penetration
Predicted Confidence Credibility
lig1 Yes 0.93 0.32
………………………………………….
50: pKa dissociation constant
Predicted quantile_0.025 quantile_0.975
lig1 5.19 -1.60 13.06
“lig1”是药物或配体的名称。化合物“lig1”的标签“Yes”表明该化合物预测适用于血脑屏障穿透。置信值为0.93表示分类器非常确定,并且预测可能是单个标签。可信度相对较低的值(0.32)表明:像“lig1”这样的化合物在训练集中没有足够的代表性,用户应谨慎处理预测。对于第50项的回归示例,计算了95%的预测区间(pKa在0.025和97.5%的预测),并给出了单个观察的预测范围。正如FP-ADMET的原始论文所说:狭窄的预测区间表明与预测相关的不确定性较低[1]。有关预测结果的更详细解释,请查看与本教程文档放一起的文件夹“doc”中名为“ADMETModels doc.pdf”、“FP-ADMET.pdf”和“FP-ADMET-SI.pdf”的文件。
2.3. 计算所有SMILES格式分子的单个ADMET条目
切换到018-admet,并使用如下命令:CODE: #> molaical.exe -model fpadmet -s single -i mols.smi -n 1
结果的解释: 由于选择了任务项1,它将生成一个名为“1.dat”的文件。如果选择任务项2,它将生成一个名为“2.dat”的文件。如果选择任务项3,它将生成一个名为“3.dat”的文件……因此生成的结果文件的前缀名称与所选任务项相同。打开文件“1.dat”,“1.dat”的内容如下:CODE: Predicted Confidence Credibility
lig1 Negative 0.77 0.31
lig2 Negative 0.90 0.59
lig5 Negative 0.80 0.35
lig6 Negative 0.91 0.64
lig10 Negative 0.96 0.86
它仅显示了ADMET中所有分子的“1: Anticommensal Effect on Human Gut Microbiota”项的计算结果。要了解ADMET的所有项目,请查看MolAICal手册,或与本教程文件放在一起的文件夹“doc”中名为“ADMETModels doc.pdf”、“FP-ADMET.pdf”和“FP-ADMET-SI.pdf”的文件。
Part II. 使用MolAICal计算ADME和分子属性
本部分教程适用Linux或Windows版的MolAICal。
在Part II教程中,将展示MolAICal计算分子ADME和分子属性的步骤,具体如下:
1) 如果“-s”是0, 将会输出药物分子的所有属性信息CODE: #> molaical.exe -model admepro -s 0 -i "O=C(C)Oc1ccccc1C(=O)O"
2) 如果“-s”是1, 将会输出一个药物分子简短的ADME信息CODE: #> molaical.exe -model admepro -s 1 -i "O=C(C)Oc1ccccc1C(=O)O"
例如,输出结果如下:CODE:
# 1. Pharmacokinetics:
GI absorption: High
BBB permeant: Yes
# 2. Lipinski Rule of 5 Violations:
No violations found
# 3. Medicinal Chemistry:
PAINS filter: False
Brenk filter: True
3) 如果“-s”是2, 将会输出分子的一些基础信息,如分子量、氢键供体数等。CODE: #> molaical.exe -model admepro -s 2 -i "O=C(C)Oc1ccccc1C(=O)O"
更多属性预测的条目信息,请参考MolAICal手册。
Reference
1. Venkatraman V. FP-ADMET: a compendium of fingerprint-based ADMET prediction models. J Cheminform. 2021;13(1):75.