24小时热门版块排行榜    

查看: 20  |  回复: 0

MolAICal

新虫 (初入文坛)

[交流] 使用MolAICal计算药物化学过滤器MCFs及MCE-18描述符

MolAICal官方地址: https://molaical.github.io  或  https://molaical.gitlab.io

1. 引言
药物化学过滤器(MCFs)的作用是剔除含有所谓 “结构警示” 的化合物。含有此类结构单元的分子要么具有不稳定或反应性基团,要么会发生生物转化,进而产生有毒代谢物或中间体。PAINS(泛测定干扰化合物)过滤器由一系列子结构过滤器组成,旨在减少筛选库中的假阳性结果、测定伪影以及非特异性生物活性分子。其设计依据是:结构中的某些片段可能会引发不良性质 —— 如反应性、螯合作用、胶体聚集形成以及染料相关效应等,这些都会干扰测定结果。由于 MCFs 和 PAINS 均涉及反应性,因此在 MolAICal 中,MCFs 的功能涵盖了 MCFs 和 PAINS 所涉及的结构。

“MCE-18”全称为 “药物化学演进,2018”,是一种原创分子描述符,用于有效评估具有药理学相关性分子的新颖性和先导化合物潜力。MCE-18 计算公式:
使用MolAICal计算药物化学过滤器MCFs及MCE-18描述符

参数说明
        AR:芳香环或杂芳香环的存在情况(0 = 不存在,1 = 存在)。
        NAR:脂环或杂脂环的存在情况(0 = 不存在,1 = 存在)。
        CHIRAL:手性中心的存在情况(0 = 不存在,1 = 存在)。
        SPIRO:螺原子的存在情况(0 = 不存在,1 = 存在)。
        sp³:sp³ 杂化碳原子的比例(范围为 0 至 1)。
        Cyc:sp³ 杂化的环碳原子比例(范围为 0 至 1)。
        Acyc:sp³ 杂化的非环碳原子比例(范围为 0 至 1)。
        NCSPTR:复合项,计算公式为(sp³ + Cyc - Acyc)。
        Q¹:归一化二次指数,用于表征结构骨架的支化程度。
如需了解更详细的 MolAICal 相关信息,请访问:https://molaical.github.io


2. 材料
2.1. 软件要求
        MolAICal:https://molaical.github.iohttps://molaical.gitlab.io
注意:确保 MolAICal 安装正确!
2.2. 示例文件
        所有必要的教程文件可从以下网址下载:
https://gitee.com/molaical/tutorials/tree/master/024-mcf_mce18



第一部分:使用 MolAICal 计算化学过滤器(MCFs)
CODE:
1.  为单个 SMILES 字符串计算 MCFs
#> molaical.exe -tool mcf -s "CC(=O)OC1=CC=CC=C1C(=O)O"

2.  为单个 SMILES 字符串计算 MCFs(不输出属性)
#> molaical.exe -tool mcf -s "CC(=O)OC1=CC=CC=C1C(=O)O" -p false

3.  计算 MCFs 并指定输出文件及格式(如 “text”“json” 或 “csv”)
#> molaical.exe -tool mcf -s "CC(=O)OC1=CC=CC=C1C(=O)O" -o result.csv -f csv

4.  计算 MCFs 并指定输出文件(不输出属性)
#> molaical.exe -tool mcf -s "CC(=O)OC1=CC=CC=C1C(=O)O" -o result.csv -f csv -p false

默认情况下,还会输出一些属性用于分子的进一步评估:
        SMILES:输入分子的 SMILES 序列。
        Valid:判断分子是否有效,值为 True(有效)或 False(无效)。
        Passes filters:判断分子是否通过 MCFs 评估,值为 True(通过)或 False(未通过)。若值为 True,表明该分子通过了 MCFs 和 PAINS 过滤器。
        LogP:辛醇 - 水分配系数,指物质在辛醇相中的浓度与在水相中的浓度之比。
        SA Score:即合成可及性分数,用于粗略评估特定分子的合成难度(评分 10 表示难,1 表示易)。该分数由分子片段的综合贡献得出。
        NP Score:即类天然产物分数,是一种贝叶斯指标,用于评估分子与天然产物所涵盖的结构空间的相似程度。
        QED:即药物相似性定量估计,是一个 [0,1] 区间内的值,用于评估分子成为可行药物候选物的可能性。与 SA 分数类似,QED 中的描述符阈值在过去十年中有所变化,当前阈值可能未涵盖最新药物。
        Molecular weight(MW):化合物中原子量的总和。

从上述网址下载 “024-mcf_mce18/molecules.smi”;“molecules.smi” 可包含多个 SMILES 字符串,因此 MolAICal 可一次性为一个或多个分子计算 MCFs。请尝试以下示例:

        从文件中计算 MCFs(文件可包含多行 SMILES,每行代表一个分子的 SMILES)
CODE:
#> molaical.exe -tool mcf -i molecules.smi -o result.csv -f csv

从文件中计算 MCFs(不输出属性,文件可包含多行 SMILES,每行代表一个分子的 SMILES)
CODE:
#> molaical.exe -tool mcf -i molecules.smi -o result.csv -f csv -p false

注意:用户可选择上述任一方式计算 MCFs。如需更详细的帮助,请参考 MolAICal 手册。


第二部分:使用 MolAICal 计算 MCE-18
CODE:
1.  为单个 SMILES 计算 MCE-18
#> molaical.exe -tool mce18 -s "CC(=O)OC1=CC=CC=C1C(=O)O"

2.  仅输出 SMILES 和 MCE-18 值
#> molaical.exe -tool mce18 -s "CC(=O)OC1=CC=CC=C1C(=O)O" -sm true

3.  输入 SMILES 并输出 CSV 格式文件
#> molaical.exe -tool mce18 -s "CC(=O)OC1=CC=CC=C1C(=O)O" -o output.csv

4.  输入 SMILES 并输出 CSV 格式文件(不输出详细内容)
#> molaical.exe -tool mce18 -s "CC(=O)OC1=CC=CC=C1C(=O)O" -o output.csv -q true

5.  输入 SMILES 并输出 CSV 格式文件(仅包含 SMILES 和 MCE-18 值)
#> molaical.exe -tool mce18 -s "CC(=O)OC1=CC=CC=C1C(=O)O" -o output.csv -sm true

6.  输入包含 SMILES 字符串的文件(每行一个)并输出 CSV 格式文件
#> molaical.exe -tool mce18 -i molecules.smi -o results.csv

7.  输入包含 SMILES 字符串的文件(每行一个)并输出 CSV 格式文件(仅包含 SMILES 和 MCE-18 值)
#> molaical.exe -tool mce18 -i molecules.smi -o results.csv -sm true

对MCE-18的 值进行分析:
从实际应用场景来看,45-78 是一个相对理想的范围
对供应商化合物库(如 ChemDiv、Enamine)的分析显示:
MCE-18 <45:分子结构简单、新颖性低,多为 “旧骨架”,吸引力有限;
MCE-18: 45-78:新颖性足够,符合当前药物化学趋势(45-63),与制药公司近期专利化合物的结构相似性高(63−78);
MCE-18 > 78:需要手动评估靶点适应性和药物相似性,因为过度复杂可能导致开发困难。


注意:用户可选择上述任一方式计算 MCE-18。如需更详细的帮助,请参考 MolAICal 手册。
回复此楼

» 猜你喜欢

» 本主题相关商家推荐: (我也要在这里推广)

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 MolAICal 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见