24小时热门版块排行榜    

查看: 263  |  回复: 0

MolAICal

新虫 (初入文坛)

[交流] 使用MolAICal计算药物化学过滤器MCFs及MCE-18描述符

MolAICal官方地址: https://molaical.github.io  或  https://molaical.gitlab.io

1. 引言
药物化学过滤器(MCFs)的作用是剔除含有所谓 “结构警示” 的化合物。含有此类结构单元的分子要么具有不稳定或反应性基团,要么会发生生物转化,进而产生有毒代谢物或中间体。PAINS(泛测定干扰化合物)过滤器由一系列子结构过滤器组成,旨在减少筛选库中的假阳性结果、测定伪影以及非特异性生物活性分子。其设计依据是:结构中的某些片段可能会引发不良性质 —— 如反应性、螯合作用、胶体聚集形成以及染料相关效应等,这些都会干扰测定结果。由于 MCFs 和 PAINS 均涉及反应性,因此在 MolAICal 中,MCFs 的功能涵盖了 MCFs 和 PAINS 所涉及的结构。

“MCE-18”全称为 “药物化学演进,2018”,是一种原创分子描述符,用于有效评估具有药理学相关性分子的新颖性和先导化合物潜力。MCE-18 计算公式:
使用MolAICal计算药物化学过滤器MCFs及MCE-18描述符

参数说明
        AR:芳香环或杂芳香环的存在情况(0 = 不存在,1 = 存在)。
        NAR:脂环或杂脂环的存在情况(0 = 不存在,1 = 存在)。
        CHIRAL:手性中心的存在情况(0 = 不存在,1 = 存在)。
        SPIRO:螺原子的存在情况(0 = 不存在,1 = 存在)。
        sp³:sp³ 杂化碳原子的比例(范围为 0 至 1)。
        Cyc:sp³ 杂化的环碳原子比例(范围为 0 至 1)。
        Acyc:sp³ 杂化的非环碳原子比例(范围为 0 至 1)。
        NCSPTR:复合项,计算公式为(sp³ + Cyc - Acyc)。
        Q¹:归一化二次指数,用于表征结构骨架的支化程度。
如需了解更详细的 MolAICal 相关信息,请访问:https://molaical.github.io


2. 材料
2.1. 软件要求
        MolAICal:https://molaical.github.iohttps://molaical.gitlab.io
注意:确保 MolAICal 安装正确!
2.2. 示例文件
        所有必要的教程文件可从以下网址下载:
https://gitee.com/molaical/tutorials/tree/master/024-mcf_mce18



第一部分:使用 MolAICal 计算化学过滤器(MCFs)
CODE:
1.  为单个 SMILES 字符串计算 MCFs
#> molaical.exe -tool mcf -s "CC(=O)OC1=CC=CC=C1C(=O)O"

2.  为单个 SMILES 字符串计算 MCFs(不输出属性)
#> molaical.exe -tool mcf -s "CC(=O)OC1=CC=CC=C1C(=O)O" -p false

3.  计算 MCFs 并指定输出文件及格式(如 “text”“json” 或 “csv”)
#> molaical.exe -tool mcf -s "CC(=O)OC1=CC=CC=C1C(=O)O" -o result.csv -f csv

4.  计算 MCFs 并指定输出文件(不输出属性)
#> molaical.exe -tool mcf -s "CC(=O)OC1=CC=CC=C1C(=O)O" -o result.csv -f csv -p false

默认情况下,还会输出一些属性用于分子的进一步评估:
        SMILES:输入分子的 SMILES 序列。
        Valid:判断分子是否有效,值为 True(有效)或 False(无效)。
        Passes filters:判断分子是否通过 MCFs 评估,值为 True(通过)或 False(未通过)。若值为 True,表明该分子通过了 MCFs 和 PAINS 过滤器。
        LogP:辛醇 - 水分配系数,指物质在辛醇相中的浓度与在水相中的浓度之比。
        SA Score:即合成可及性分数,用于粗略评估特定分子的合成难度(评分 10 表示难,1 表示易)。该分数由分子片段的综合贡献得出。
        NP Score:即类天然产物分数,是一种贝叶斯指标,用于评估分子与天然产物所涵盖的结构空间的相似程度。
        QED:即药物相似性定量估计,是一个 [0,1] 区间内的值,用于评估分子成为可行药物候选物的可能性。与 SA 分数类似,QED 中的描述符阈值在过去十年中有所变化,当前阈值可能未涵盖最新药物。
        Molecular weight(MW):化合物中原子量的总和。

从上述网址下载 “024-mcf_mce18/molecules.smi”;“molecules.smi” 可包含多个 SMILES 字符串,因此 MolAICal 可一次性为一个或多个分子计算 MCFs。请尝试以下示例:

        从文件中计算 MCFs(文件可包含多行 SMILES,每行代表一个分子的 SMILES)
CODE:
#> molaical.exe -tool mcf -i molecules.smi -o result.csv -f csv

从文件中计算 MCFs(不输出属性,文件可包含多行 SMILES,每行代表一个分子的 SMILES)
CODE:
#> molaical.exe -tool mcf -i molecules.smi -o result.csv -f csv -p false

注意:用户可选择上述任一方式计算 MCFs。如需更详细的帮助,请参考 MolAICal 手册。


第二部分:使用 MolAICal 计算 MCE-18
CODE:
1.  为单个 SMILES 计算 MCE-18
#> molaical.exe -tool mce18 -s "CC(=O)OC1=CC=CC=C1C(=O)O"

2.  仅输出 SMILES 和 MCE-18 值
#> molaical.exe -tool mce18 -s "CC(=O)OC1=CC=CC=C1C(=O)O" -sm true

3.  输入 SMILES 并输出 CSV 格式文件
#> molaical.exe -tool mce18 -s "CC(=O)OC1=CC=CC=C1C(=O)O" -o output.csv

4.  输入 SMILES 并输出 CSV 格式文件(不输出详细内容)
#> molaical.exe -tool mce18 -s "CC(=O)OC1=CC=CC=C1C(=O)O" -o output.csv -q true

5.  输入 SMILES 并输出 CSV 格式文件(仅包含 SMILES 和 MCE-18 值)
#> molaical.exe -tool mce18 -s "CC(=O)OC1=CC=CC=C1C(=O)O" -o output.csv -sm true

6.  输入包含 SMILES 字符串的文件(每行一个)并输出 CSV 格式文件
#> molaical.exe -tool mce18 -i molecules.smi -o results.csv

7.  输入包含 SMILES 字符串的文件(每行一个)并输出 CSV 格式文件(仅包含 SMILES 和 MCE-18 值)
#> molaical.exe -tool mce18 -i molecules.smi -o results.csv -sm true

对MCE-18的 值进行分析:
从实际应用场景来看,45-78 是一个相对理想的范围
对供应商化合物库(如 ChemDiv、Enamine)的分析显示:
MCE-18 <45:分子结构简单、新颖性低,多为 “旧骨架”,吸引力有限;
MCE-18: 45-78:新颖性足够,符合当前药物化学趋势(45-63),与制药公司近期专利化合物的结构相似性高(63−78);
MCE-18 > 78:需要手动评估靶点适应性和药物相似性,因为过度复杂可能导致开发困难。


注意:用户可选择上述任一方式计算 MCE-18。如需更详细的帮助,请参考 MolAICal 手册。
回复此楼

» 猜你喜欢

» 本主题相关商家推荐: (我也要在这里推广)

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 MolAICal 的主题更新
普通表情 高级回复 (可上传附件)
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[考研] 课题组接收材料类调剂研究生 +5 gaoxiaoniuma 2026-02-28 7/350 2026-03-03 07:35 by 关东煮爱喝汤
[考研] 282求调剂 +4 2103240126 2026-03-02 7/350 2026-03-02 23:02 by 2103240126
[考研] 11408,学硕276求调剂 +3 崔wj 2026-03-02 5/250 2026-03-02 22:14 by 255671
[考研] 285求调剂 +9 满头大汗的学生 2026-02-28 9/450 2026-03-02 20:29 by hypershenger
[考研] 306分材料调剂 +5 chuanzhu川烛 2026-03-01 6/300 2026-03-02 19:51 by 张晓芳0105
[考研] 0854总分272 +3 打小就是老实人 2026-03-02 4/200 2026-03-02 19:49 by 求调剂zz
[考研] 275求调剂 +7 明远求学 2026-03-01 7/350 2026-03-02 19:22 by zhukairuo
[考研] 材料调剂 +3 恒顺自然 2026-03-02 3/150 2026-03-02 18:49 by L135790
[考研] 清华大学 材料与化工 353分求调剂 +4 awaystay 2026-03-02 5/250 2026-03-02 17:33 by yeahyou
[考研] 化工专硕348,一志愿985求调剂 +6 弗格个 2026-02-28 9/450 2026-03-02 14:09 by liyongv
[基金申请] 面上模板改不了页边距吧? +6 ieewxg 2026-02-25 7/350 2026-03-02 12:44 by stidwellNK
[考研] 材料类求调剂 +11 wana_kiko 2026-02-28 14/700 2026-03-02 08:46 by 聪明的大松鼠
[考研] 279求调剂 +3 dua1 2026-03-01 4/200 2026-03-02 00:23 by 大脸蛋子
[考研] 0856材料求调剂 +4 麻辣鱿鱼 2026-02-28 4/200 2026-03-01 16:51 by caszguilin
[考研] 313求调剂 +3 水流年lc 2026-02-28 3/150 2026-03-01 16:01 by 新能源达人
[考研] 311求调剂 +6 亭亭亭01 2026-03-01 6/300 2026-03-01 15:41 by 324616
[考研] 317一志愿华南理工电气工程求调剂 +6 Soliloquy_Q 2026-02-28 11/550 2026-03-01 11:14 by 歌liekkas
[考研] 311求调剂 +9 南迦720 2026-02-28 10/500 2026-03-01 10:55 by sunny81
[论文投稿] 求助coordination chemistry reviews 的写作模板 10+3 ljplijiapeng 2026-02-27 4/200 2026-03-01 09:07 by babero
[硕博家园] 【博士招生】太原理工大学2026化工博士 +4 N1ce_try 2026-02-24 8/400 2026-02-26 08:40 by N1ce_try
信息提示
请填处理意见