24小时热门版块排行榜    

查看: 573  |  回复: 9
当前主题已经存档。

eiko829

[交流] 【求助】请问小分子片断拼接成新的分子应该用什么格式?

想把几个小分子片断连接成一个新的分子,看了Sheridan的一篇文献,可还是不知道他具体用的什么方法,我试了下用smiles,出错概率太大了。小分子具体是用的什么格式?怎么对接的? 挺急得,有没有高手能帮忙解答一下,万分感谢!!
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yalefield

金虫 (文坛精英)

老汉一枚

★ ★ ★ ★
lei0736(金币+4,VIP+0):谢谢
这个的确是比较有趣的问题.
常用的分子结构表达基本分为连接表和线性码两类(还有用矩阵的)。
前者的代表是MOL格式文件
后者则以SMILES比较典型

直接对分子结构进行拼、拆操作,需要一点图论知识。
线性码,其实也是先转化为连接表。

那么,你面临的问题是成品软件(商业化的或者免费的),都只能读、写整个的分子,而不能读、写分子碎片(这个有很多说法,如Substructure, Fragment)。

要完成这个任务,最好是自己编个小程序。
2楼2008-06-06 17:13:46
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

whitewatercn

银虫 (小有名气)

★ ★ ★
lei0736(金币+3,VIP+0):谢谢
没看太懂楼主的陈述,R基团+母核? 分子对接中的拼接?
拼接涉及到图论算法,把两个分子的文件直接并成一个文件可行吗?
初步想了一下,smils 似乎在理论上有可能把两个片断连成一个片断,但是要把第一个片断的连接点原子放在最后,把第二个片断的连接点原子放在最前面,  
比如
CCO  乙醇
C(=O)c1ccccc1 苯甲酮
拼在一起成了CCOC(=O)c1ccccc1  苯甲酸乙酯


如果楼主懂点图论,connect table 啥的,会写点程序,那问题就简单了,管它什么文件格式.

[ Last edited by whitewatercn on 2008-6-6 at 17:29 ]
3楼2008-06-06 17:28:01
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yalefield

金虫 (文坛精英)

老汉一枚

★ ★
lei0736(金币+2,VIP+0):谢谢
如果仅仅是通过C-C单键拼接,问题也算简单。
但是,如果涉及环,或者更复杂的情况,那可是比较麻烦的。

Daylight公司有全套的处理SMILES的软件,不过价格是相当的高啦。
4楼2008-06-06 18:45:02
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

acdmail1

金虫 (小有名气)

★ ★ ★
lei0736(金币+3,VIP+0):谢谢
其实很多软件都能完成楼主的需要:
比如http://www.molsoft.com/chemistry.html
ICM-Chemistry provides a rich cheminformatics environment allowing you to build, view and manipulate chemical structures. This product seamlessly interacts with the ICM-Pro graphical user interface and command line allowing you to link biological structures with chemistry functions. These tools are ideal for structure-based or ligand-based virtual screening experiments and lead optimization projects. A useful companion to ICM-Chemistry is MolCart and MolCart Compounds.
5楼2008-06-07 03:37:20
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yalefield

金虫 (文坛精英)

老汉一枚

★ ★ ★ ★ ★
lei0736(金币+5,VIP+0):谢谢
其实很多人对这个问题有个误会。

以组合分子库(Combinatorial Library)为例。
很多软件都有这个功能,除5楼说的MolSoft,还有Accelrys Accord、CDK、JChem等开发包,Sybyl、MOE等当然也可以。其功能是对骨架上的一些标定的点(也就是结构通式上的R1, R2......),用若干小分子片段来代替,从而组合性地衍生出很多结构。

不过,在使用时,需要在骨架和小分子片段上各自定义Attachment,
骨架上,就是化学上常用的R符号;
小分子片段,则需要特别需要在那个与骨架相结合的原子上做个标记
问题就出在这里。

(1)怎么在小分子的某个原子上作标记?
前面说过的那些软件都可以,实际上,就是在连接表的原子记录上变一个数字而已
你也可以自己用记事本(Notepad)之类的文本编辑,直接打开MOL文件修改。

(2)做了标记,其他的软件是否能读?
做了标记的分子,虽然ChemDraw之类的能读出结构、显示,
但是,却不识别那标记的意思。只有专门设计的软件才行。

(3)容易出现的问题
假设苯是骨架,现在想添一个乙基,做成乙苯。
那么,苯上的一个氢就要作为R(而不是苯上的C!
而乙基上的Attachment,也要考虑是C还是H
这涉及不同的“协议”。

A) 如果约定,用C做Attachment,那就先删掉它上面的一个H,再与苯上那个与R相连的C之间形成单键,而苯上的那个R也删去。
B) 如果约定,用H做Attachment,那么就是删去这个H,而让与该H相连的C与苯上那个与R相连的C之间形成单键,而苯上的那个R也删去。

不管怎样,都要小心。很容易“多”或者“少”一个原子。

此外,如果在上述操作的过程中需要存贮,那么你就可能会遇到“格式错误”。
用文本编辑不会有这个问题,可是ChemDraw却不认识这种“错误”的文件。

[ Last edited by yalefield on 2008-6-7 at 04:45 ]
6楼2008-06-07 04:43:52
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

eiko829

很感谢大家的回答
yalefield说的大概就是我的意思,也是我遇到的问题,我已经把一些大分子拆分成分子片断了,从mol2的文件中,可以知道断点在哪里,而这些断点也就是要再次拼接成新分子的连接点。可具体怎么拼接就出了问题了,我也用chemdraw从新画了分子,对他们的连接点用R进行了标记,之后转成smiles的格式,对两个分子的拼接点R进行删除,之后连接就出现了新的分子,可这么做必然会存在问题,尤其是三四个分子片断进行连接的时候。我刚找到一篇关于这种方法的中文文献,可发现它说得很模糊,我觉得实现上存在很大问题。 所以现在不知道怎么继续了,呵呵
7楼2008-06-08 00:32:55
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

eiko829

我其实就是想自己写个程序完成这一想法,可因为以前不是学生物或者化学的,不知道碰上的问题怎么解决了 上面提到的线性码转换成连接表我也想到了,具体能说一下怎么弄么?有啥可参考的文献么?还有图论的知识能大概说一下么? 谢谢各位!
8楼2008-06-08 00:37:38
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yalefield

金虫 (文坛精英)

老汉一枚

★ ★ ★ ★
lei0736(金币+4,VIP+0):谢谢
这个事情还是用链接表比较直观。

其基本操作其实很简单。
你的数据结构应该对应“链接表”,围绕它写出基本的操作,如增加一个原子,删除一个原子,在两个原子间增加一个键或删除一个键等等。

注意:删除一个原子,先要删除与该原子相连接的所有键。因此,你要仔细设计对应的函数。

在这个基础上,再写如何“合并”两个链接表。当然,每个链接表内部,都要先按照约定(Protocol)标记好。

国内做这方面的,俺知道有北京的周家驹、上海的姚建华、南开的林少凡。他们是自己(当然是学生们)编程序处理结构匹配、子结构搜索等问题。
其他人,也许做一点。更多的都是在用现成的软件。
9楼2008-06-08 04:37:28
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

whitewatercn

银虫 (小有名气)

★ ★ ★ ★
lei0736(金币+4,VIP+0):谢谢
楼主如果用mol2格式的话,只要把mol2格式搞明白,就知道所谓图论是怎么回事了
就是一个表示原子的数组,@ATOM

和一个表示键的数组,@BOND , 第二列和第三列是对应的原子编号

可以用perl之类的脚本语言直接对mol2文件进行一系列操作,把两个或多个mol2文件并成一个文件,

1.把@ATOM中的内容并起来,重新编号,把R1 R2 之类的连接原子删除
2.把@BOND中的内容合并起来,重新编号,把与R1 R2等原子相连的那些键删除,再添加上连接键.因为原子的编号变了,所有BOND的第二列和第三列的数字也要作相应改变
10楼2008-06-10 08:55:48
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 eiko829 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见