24小时热门版块排行榜    

CyRhmU.jpeg
查看: 737  |  回复: 7
当前主题已经存档。

zhangya

金虫 (正式写手)

[交流] 【求助】请问如何从一个大的sdf文件中提取出某一分子量的化合物

sdf是标准的坐标文件,可以用ChemFileBrowser查看分子量,但是无法批量提取出如202这一特定的分子量的分子,请问是否有办法快速、批量提取出202这一分子量的化合物坐标,形成一个新的sdf文件?谢谢。sdf的文件格式如下:
1
  -OEChem-01210914283D

31 30  0     1  0  0  0  0  0999 V2000
   -1.4148   -2.6170    3.2592 O   0  0  0  0  0  0  0  0  0  0  0  0
   -3.5096   -0.9050    6.4323 O   0  5  0  0  0  0  0  0  0  0  0  0
   -1.3595   -1.4625    5.9048 O   0  0  0  0  0  0  0  0  0  0  0  0
   -2.9982   -3.1644    1.6687 O   0  0  0  0  0  0  0  0  0  0  0  0
    0.3041   -0.3323    2.0893 N   0  3  0  0  0  0  0  0  0  0  0  0
   -0.5225   -0.3990    3.3654 C   0  0  0  0  0  0  0  0  0  0  0  0
   -1.7810   -1.2404    3.1607 C   0  0  2  0  0  0  0  0  0  0  0  0
    1.5567    0.4953    2.3388 C   0  0  0  0  0  0  0  0  0  0  0  0
    0.7016   -1.7398    1.6684 C   0  0  0  0  0  0  0  0  0  0  0  0
   -0.5191    0.3141    0.9846 C   0  0  0  0  0  0  0  0  0  0  0  0
   -2.8962   -0.9284    4.1603 C   0  0  0  0  0  0  0  0  0  0  0  0
   -2.5450   -1.1213    5.6425 C   0  0  0  0  0  0  0  0  0  0  0  0
   -2.1093   -3.4705    2.4518 C   0  0  0  0  0  0  0  0  0  0  0  0
   -1.6205   -4.8718    2.6605 C   0  0  0  0  0  0  0  0  0  0  0  0
    0.1416   -0.8148    4.1302 H   0  0  0  0  0  0  0  0  0  0  0  0
   -0.7737    0.6346    3.6314 H   0  0  0  0  0  0  0  0  0  0  0  0
   -2.2263   -1.0347    2.1859 H   0  0  0  0  0  0  0  0  0  0  0  0
    1.2510    1.5007    2.6431 H   0  0  0  0  0  0  0  0  0  0  0  0
    2.1373    0.0137    3.1312 H   0  0  0  0  0  0  0  0  0  0  0  0
    2.1397    0.5387    1.4140 H   0  0  0  0  0  0  0  0  0  0  0  0
   -0.1444   -2.2475    1.2043 H   0  0  0  0  0  0  0  0  0  0  0  0
    1.4899   -1.6507    0.9130 H   0  0  0  0  0  0  0  0  0  0  0  0
    1.0923   -2.2785    2.5364 H   0  0  0  0  0  0  0  0  0  0  0  0
   -1.2564   -0.3867    0.5875 H   0  0  0  0  0  0  0  0  0  0  0  0
   -0.9940    1.2176    1.3782 H   0  0  0  0  0  0  0  0  0  0  0  0
    0.1634    0.5820    0.1710 H   0  0  0  0  0  0  0  0  0  0  0  0
   -3.2251    0.1097    4.0284 H   0  0  0  0  0  0  0  0  0  0  0  0
   -3.7582   -1.5765    3.9571 H   0  0  0  0  0  0  0  0  0  0  0  0
   -0.5610   -4.9370    2.4004 H   0  0  0  0  0  0  0  0  0  0  0  0
   -2.1810   -5.5518    2.0126 H   0  0  0  0  0  0  0  0  0  0  0  0
   -1.7813   -5.1691    3.6998 H   0  0  0  0  0  0  0  0  0  0  0  0
  1  7  1  0  0  0  0
  1 13  1  0  0  0  0
  2 12  1  0  0  0  0
  3 12  2  0  0  0  0
  4 13  2  0  0  0  0
  5  6  1  0  0  0  0
  5  8  1  0  0  0  0
  5  9  1  0  0  0  0
  5 10  1  0  0  0  0
  6  7  1  0  0  0  0
  6 15  1  0  0  0  0
  6 16  1  0  0  0  0
  7 11  1  0  0  0  0
  7 17  1  0  0  0  0
  8 18  1  0  0  0  0
  8 19  1  0  0  0  0
  8 20  1  0  0  0  0
  9 21  1  0  0  0  0
  9 22  1  0  0  0  0
  9 23  1  0  0  0  0
10 24  1  0  0  0  0
10 25  1  0  0  0  0
10 26  1  0  0  0  0
11 12  1  0  0  0  0
11 27  1  0  0  0  0
11 28  1  0  0  0  0
13 14  1  0  0  0  0
14 29  1  0  0  0  0
14 30  1  0  0  0  0
14 31  1  0  0  0  0
M  CHG  2   2  -1   5   1
M  END
>
1

>
0.6

>
-0.43
-0.57
-0.9
-0.9
-1.01
0.28
0.5
-0.11
0.5
0.5
0.5
0.06
0.66
0.91
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

>
6

>
14

>
0

>
1

>
0

>
0

>
0

>
1

>
1

>
0000000100000002

>
37.8008

>
4.31
3.06
1.22
-0.34
-0.54
-0.52
1.14
0.75
0.94
0.76
0.36
5.32
-10.36

>
164

$$$$
2
  -OEChem-01210914283D

32 31  0     1  0  0  0  0  0999 V2000
    2.8035   -1.8985    0.4138 O   0  0  0  0  0  0  0  0  0  0  0  0
    0.2190    0.7647    2.2550 O   0  0  0  0  0  0  0  0  0  0  0  0
    2.3706    0.0407    2.3730 O   0  0  0  0  0  0  0  0  0  0  0  0
    3.6525   -0.7893   -1.4262 O   0  0  0  0  0  0  0  0  0  0  0  0
    0.7455   -3.9237    0.6386 N   0  3  0  0  0  0  0  0  0  0  0  0
    0.5176   -2.4817    0.9138 C   0  0  0  0  0  0  0  0  0  0  0  0
    1.4480   -1.6394    0.0460 C   0  0  1  0  0  0  0  0  0  0  0  0
    2.2045   -4.3068    0.9199 C   0  0  0  0  0  0  0  0  0  0  0  0
   -0.1568   -4.7948    1.5226 C   0  0  0  0  0  0  0  0  0  0  0  0
    0.4391   -4.2524   -0.8285 C   0  0  0  0  0  0  0  0  0  0  0  0
    1.1847   -0.1515    0.2751 C   0  0  0  0  0  0  0  0  0  0  0  0
    1.3421    0.2123    1.7318 C   0  0  0  0  0  0  0  0  0  0  0  0
    3.7458   -1.1903   -0.2740 C   0  0  0  0  0  0  0  0  0  0  0  0
    4.9428   -0.9643    0.5990 C   0  0  0  0  0  0  0  0  0  0  0  0
   -0.5353   -2.2567    0.7059 H   0  0  0  0  0  0  0  0  0  0  0  0
    0.7068   -2.3331    1.9834 H   0  0  0  0  0  0  0  0  0  0  0  0
    1.3084   -1.8371   -1.0210 H   0  0  0  0  0  0  0  0  0  0  0  0
    2.8373   -4.0778    0.0593 H   0  0  0  0  0  0  0  0  0  0  0  0
    2.5291   -3.8407    1.8549 H   0  0  0  0  0  0  0  0  0  0  0  0
    2.2387   -5.3952    1.0461 H   0  0  0  0  0  0  0  0  0  0  0  0
   -1.1966   -4.5246    1.3163 H   0  0  0  0  0  0  0  0  0  0  0  0
    0.0197   -5.8472    1.2816 H   0  0  0  0  0  0  0  0  0  0  0  0
    0.0937   -4.5921    2.5680 H   0  0  0  0  0  0  0  0  0  0  0  0
   -0.5505   -3.8552   -1.0722 H   0  0  0  0  0  0  0  0  0  0  0  0
    1.2085   -3.8324   -1.4800 H   0  0  0  0  0  0  0  0  0  0  0  0
    0.4442   -5.3417   -0.9388 H   0  0  0  0  0  0  0  0  0  0  0  0
    0.1599    0.0831   -0.0392 H   0  0  0  0  0  0  0  0  0  0  0  0
    1.8384    0.5129   -0.2976 H   0  0  0  0  0  0  0  0  0  0  0  0
    5.1001   -1.8209    1.2606 H   0  0  0  0  0  0  0  0  0  0  0  0
    4.8075   -0.0541    1.1863 H   0  0  0  0  0  0  0  0  0  0  0  0
    5.8316   -0.8656   -0.0307 H   0  0  0  0  0  0  0  0  0  0  0  0
    0.3336    1.0011    3.2001 H   0  0  0  0  0  0  0  0  0  0  0  0
  1  7  1  0  0  0  0
  1 13  1  0  0  0  0
  2 12  1  0  0  0  0
  2 32  1  0  0  0  0
  3 12  2  0  0  0  0
  4 13  2  0  0  0  0
  5  6  1  0  0  0  0
  5  8  1  0  0  0  0
  5  9  1  0  0  0  0
  5 10  1  0  0  0  0
  6  7  1  0  0  0  0
  6 15  1  0  0  0  0
  6 16  1  0  0  0  0
  7 11  1  0  0  0  0
  7 17  1  0  0  0  0
  8 18  1  0  0  0  0
  8 19  1  0  0  0  0
  8 20  1  0  0  0  0
  9 21  1  0  0  0  0
  9 22  1  0  0  0  0
  9 23  1  0  0  0  0
10 24  1  0  0  0  0
10 25  1  0  0  0  0
10 26  1  0  0  0  0
11 12  1  0  0  0  0
11 27  1  0  0  0  0
11 28  1  0  0  0  0
13 14  1  0  0  0  0
14 29  1  0  0  0  0
14 30  1  0  0  0  0
14 31  1  0  0  0  0
M  CHG  1   5   1
M  END
>
2

>
0.6

>
-0.43
-0.65
-0.57
-0.57
-1.01
0.28
0.5
0.06
0.5
0.5
0.5
0.06
0.66
0.66
0.5
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

>
6

>
14

>
0

>
1

>
0

>
0

>
0

>
1

>
1

>
0000000200000002

>
44.1093

>
4.35
2.66
1.24
1.01
0.25
-0.75
1.2
-0.73
-1.21
-1.13
-0.49
9.04
-1.08

>
163

$$$$

[ Last edited by lei0736 on 2009-11-24 at 21:37 ]
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wojiushifeng

银虫 (小有名气)

★ ★
lei0736(金币+2,VIP+0):谢谢 5-10 21:23
pipeline pilot软件平台可以完成这项工作
2楼2009-05-09 22:36:23
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yalefield

金虫 (文坛精英)

老汉一枚

★ ★ ★
lei0736(金币+3,VIP+0):谢谢 5-10 21:23
NCI有个Subset,用Perl写的
Accelrys Discovery Studio Visualizer也可以
Accord for Excel等也可以
3楼2009-05-10 01:54:00
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

superdirac

木虫 (正式写手)

★ ★
lei0736(金币+2,VIP+0):谢谢 5-10 21:23
linux的  shall 里的命令   awk ,grep , sed
  很适合来处理字符串, 当然用perl也很好!
我认为,酒一口一口喝,路一步一步走~步子迈大了,喀~容易扯着蛋
4楼2009-05-10 09:09:47
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yalefield

金虫 (文坛精英)

老汉一枚

SDF_toolkit

★ ★
lei0736(金币+2,VIP+0):谢谢 5-10 21:23
5楼2009-05-10 13:33:04
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

tjegg

铁杆木虫 (著名写手)

★ ★
lei0736(金币+2,VIP+0):谢谢 5-11 17:37
ChemFinder读取,Search------enter query----------Molweight中输入202, 回车即可。
除了你的亲人,没有人应该对你好,对你好的人,一定要珍惜。
6楼2009-05-11 00:46:31
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yalefield

金虫 (文坛精英)

老汉一枚

★ ★
lei0736(金币+2,VIP+0):谢谢 5-11 17:37
引用回帖:
Originally posted by tjegg at 2009-5-11 00:46:
ChemFinder读取,Search------enter query----------Molweight中输入202, 回车即可。

Bravo
7楼2009-05-11 07:09:51
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

tjegg

铁杆木虫 (著名写手)

谢谢楼上的。
除了你的亲人,没有人应该对你好,对你好的人,一定要珍惜。
8楼2009-05-11 07:17:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 zhangya 的主题更新
普通表情 高级回复(可上传附件)
信息提示
请填处理意见