24小时热门版块排行榜    

查看: 3614  |  回复: 17
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

sijifengsd

银虫 (小有名气)

[交流] 【经验】用Modeller补全残基学习心得已有8人参与

最近专注于分子动力学的模拟研究。发现好多的蛋白质晶体结构或多或少的有一部分残基丢失了,要做动力学模拟,就需要把丢失的残基给补上。看文献发现比较公认的、又是免费的软件当属Modeller了。所以本人花了两个周的时间研究了这个软件的使用方法。现把个人的心得体会奉献出来,希望给需要的同学们提供点帮助:
首先大家可以到这个网站 申请个序列号,下载个免费的软件:
http://salilab.org/modeller/registration.html
安装成功就可用了。
这个软件要用到一些脚本文件,补全残基可以带着配体,水,也可以不带。
一 没有配体、水分子:
第一步 处理大分子pdb 文件,删除杂原子 和水分子等。
第二步 建立一个get_ali.py 脚本文件

# get sequece of the 2FMX PDB file, and write to an alignment file.

log.verbose()
env = environ()

env.io.atom_files_directories = ['.', '../atom_file']

code = '2FMX'
m = model(env, file=code)
aln = alignment(env)

aln.append_model(m, align_codes=code)
aln.write(code+'.seq')

第三步 :运行 modpv7 get_ali.py 产生一个sequence 文件:2FMX.seq

>P1;2FMX
structureX:2FMX:  13 :A:+556 :B:MOL_ID  1; MOLECULE  GTP-BINDING PROTEIN SAR1B; CHAIN  A, B; FRAGMENT  RESIDUES 10-198; SYNONYM  SAR1, GTBPB; ENGINEERED  YES:MOL_ID  1; ORGANISM_SCIENTIFIC  CRICETULUS GRISEUS; ORGANISM_COMMON  CHINESE HAMSTER; ORGANISM_TAXID  10029; EXPRESSION_SYSTEM  ESCHERICHIA COLI; EXPRESSION_SYSTEM_TAXID  562; EXPRESSION_SYSTEM_VECTOR_TYPE  PLASMID; EXPRESSION_SYSTEM_PLASMID  PET11D: 1.82:-1.00
SSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPTSEELTIAGMTFTTFDLGRVWKNYLPAI
NGIVFLVDCADHERLLESKEELDSLMTDETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSVSLKEL
NARPLEVFMCSVLKRQGYGEGFRWMAQYID
第四步:用产生的序列文件产生一个alignment.ali脚本文件:把上面的序列复制到脚本中

>P1;2FMX
structureX:2FMX.pdb:   13 :A:4872 :A:undefined:undefined:-1.00:-1.00
SSVL---QFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPTSEELTIAGMTFTTFDLGRVWKNYLPAI
NGIVFLVDCADHERLLESKEELDSLMTDETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSVSLKEL
NARPLEVFMCSVLKRQGYGEGFRWMAQYID---

>P1;2FMX_fill
sequence:2FMX_fill:     :A  :     :A ::: 0.00: 0.00
SSVLHJKQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPTSEELTIAGMTFTTFDLGRVWKNYLPAI
NGIVFLVDCADHERLLESKEELDSLMTDETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSVSLKEL
NARPLEVFMCSVLKRQGYGEGFRWMAQYIDLPO
注意:上面的一个序列是pdb源文件的残基,而下面是加上缺失残基的全序列。13 :A:4872 A:表示在源文件中开始和结束的残基序号。
第五步 建立一个select.py文件 ,在这个文件中我们只优化补全的那部分残基。

from modeller import *
from modeller.automodel import * # Load the automodel class

log.verbose()
env = environ()

# directories for input atom files
env.io.atom_files_directories = ['.', '../atom_file']
class MyModel(loopmodel):
    def select_atoms(self):
        return selection(self.residue_range('1:A', '9:A'),
                         self.residue_range('68:A', '73:A'),
               
a = MyModel(env,
            alnfile = 'alignment.ali',
            knowns = '2FMX',
            sequence = '2FMX_fill')

a.starting_model = 1
a.ending_model = 2

a.make()

注释: 上面的'1:A', '9:A','68:A', '73:A' 是加入的那部分残基在从1开始中的序列编号;下面的红字表示可以改动的地方。class MyModel(automodel) 中的automodel也可以换成loopmodel,这样对已loop区的优化更好。
第六步 运行 mod9v7 select.py 结果提取pdb文件即可。
二 包含配体和水分子
第一步 大分子就不要处理了。
第二步 建立一个get_ali.py 脚本文件

# get sequece of the 2FMX PDB file, and write to an alignment file.

log.verbose()
env = environ()

env.io.atom_files_directories = ['.', '../atom_file']

code = '2FMX'
m = model(env, file=code)
aln = alignment(env)

aln.append_model(m, align_codes=code)
aln.write(code+'.seq')

第三步 :运行 modpv7 get_ali.py 产生一个sequence 文件:2FMX.seq

>P1;2FMX
structureX:2FMX:  13 :A:+556 :B:MOL_ID  1; MOLECULE  GTP-BINDING PROTEIN SAR1B; CHAIN  A, B; FRAGMENT  RESIDUES 10-198; SYNONYM  SAR1, GTBPB; ENGINEERED  YES:MOL_ID  1; ORGANISM_SCIENTIFIC  CRICETULUS GRISEUS; ORGANISM_COMMON  CHINESE HAMSTER; ORGANISM_TAXID  10029; EXPRESSION_SYSTEM  ESCHERICHIA COLI; EXPRESSION_SYSTEM_TAXID  562; EXPRESSION_SYSTEM_VECTOR_TYPE  PLASMID; EXPRESSION_SYSTEM_PLASMID  PET11D: 1.82:-1.00
SSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPTSEELTIAGMTFTTFDLGRVWKNYLPAI
NGIVFLVDCADHERLLESKEELDSLMTDETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSVSLKEL
NARPLEVFMCSVLKRQGYGEGFRWMAQYID
第四步:用产生的序列文件产生一个alignment.ali脚本文件:把上面的序列复制到脚本中

>P1;2FMX
structureX:2FMX.pdb:   13 :A:4890 :A:undefined:undefined:-1.00:-1.00
SSVL---QFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPTSEELTIAGMTFTTFDLGRVWKNYLPAI
NGIVFLVDCADHERLLESKEELDSLMTDETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSVSLKEL
NARPLEVFMCSVLKRQGYGEGFRWMAQYID---.wwwwwwwwwwww

>P1;2FMX_fill
sequence:2FMX_fill:     :A  :     :A ::: 0.00: 0.00
SSVLHJKQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPTSEELTIAGMTFTTFDLGRVWKNYLPAI
NGIVFLVDCADHERLLESKEELDSLMTDETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSVSLKEL
NARPLEVFMCSVLKRQGYGEGFRWMAQYIDLPO. wwwwwwwwwwww
注意:到这一步和上面有区别了,因为有配体和水分子就要在序列的后面加上”.(表示配体,有几个配体杂原子加几个点)” 和”w(表示水分子,有几个加几个w)”。如果水分子和配体时单独成链的要加/例如:/. Wwwwwwwwwwww,或者 . /wwwwwwwwwwww
第五步 建立一个select.py文件 ,在这个文件中我们只优化补全的那部分残基。

from modeller import *
from modeller.automodel import * # Load the automodel class

log.verbose()
env = environ()
env.io.water = True
env.io.hetatm = True

# directories for input atom files
env.io.atom_files_directories = ['.', '../atom_file']
class MyModel(loopmodel):
    def select_atoms(self):
        return selection(self.residue_range('1:A', '9:A'),
                         self.residue_range('68:A', '73:A'),
               
a = MyModel(env,
            alnfile = 'alignment.ali',
            knowns = '2FMX',
            sequence = '2FMX_fill')

a.starting_model = 1
a.ending_model = 2

a.make()

注释:这里加入了env.io.water = True  env.io.hetatm = True还识别水分子和配体。
第六步 运行 mod9v7 select.py 结果提取pdb文件即可
三 复杂点的 比如两条链的

第一步 下载pdb
第二步 建立一个get_ali.py 脚本文件

# get sequece of the 2FMX PDB file, and write to an alignment file.

log.verbose()
env = environ()
env.io.water = True
env.io.hetatm = True

env.io.atom_files_directories = ['.', '../atom_file']

code = '2FMX'
m = model(env, file=code)
aln = alignment(env)

aln.append_model(m, align_codes=code)
aln.write(code+'.seq')
注:这里直接用env.io.water = True  nv.io.hetatm = True 会直接把配体、水给你表示出来

第三步 :运行 modpv7 get_ali.py 产生一个sequence 文件:2FMX.seq
>P1;2FMX
structureX:2FMX:  13 :A:+556 :B:MOL_ID  1; MOLECULE  GTP-BINDING PROTEIN SAR1B; CHAIN  A, B; FRAGMENT  RESIDUES 10-198; SYNONYM  SAR1, GTBPB; ENGINEERED  YES:MOL_ID  1; ORGANISM_SCIENTIFIC  CRICETULUS GRISEUS; ORGANISM_COMMON  CHINESE HAMSTER; ORGANISM_TAXID  10029; EXPRESSION_SYSTEM  ESCHERICHIA COLI; EXPRESSION_SYSTEM_TAXID  562; EXPRESSION_SYSTEM_VECTOR_TYPE  PLASMID; EXPRESSION_SYSTEM_PLASMID  PET11D: 1.82:-1.00
SSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPTSEELTIAGMTFTTFDLGRVWKNYLPAI
NGIVFLVDCADHERLLESKEELDSLMTDETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSVSLKEL
NARPLEVFMCSVLKRQGYGEGFRWMAQYID/SSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDPTLHPTSEE
LTIAGMTFTTFDLGVWKNYLPAINGIVFLVDCADHERLLESKEELDSLMTDETIANVPILILGNKIDRPEAISEE
RLREMFGLYGQTTGKGSVSLKELNARPLEVFMCSVLKRQGYGEGFRWMAQYID/.x/.$x/wwwwwwwwwwwwww
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
wwwwwwwww/wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww*

第四步:用产生的序列文件产生一个alignment.ali脚本文件:把上面的序列复制到脚本中

>P1;2FMX
structureX:2FMX.pdb:   13 :A:4872 :B:undefined:undefined:-1.00:-1.00
---------SSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPTSEELTIAGMTFTTFDLG------RVWKNYLPAI
NGIVFLVDCADHERLLESKEELDSLMTDETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSVSLKEL
NARPLEVFMCSVLKRQGYGEGFRWMAQYID/---------SSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKD-------PTLHPTSEE
LTIAGMTFTTFDLG-------VWKNYLPAINGIVFLVDCADHERLLESKEELDSLMTDETIANVPILILGNKIDRPEAISEE
RLREMFGLYGQTTGKGSVSLKELNARPLEVFMCSVLKRQGYGEGFRWMAQYID/.x/.$x/wwwwwwwwwwwwww
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
wwwwwwwww/wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww*

>P1;2FMX_fill
sequence:2FMX_fill:     :A  :     :B ::: 0.00: 0.00
HHHHHHSGFSSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPTSEELTIAGMTFTTFDLGGHIQARRVWKNYLPAI
NGIVFLVDCADHERLLESKEELDSLMTDETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSVSLKEL
NARPLEVFMCSVLKRQGYGEGFRWMAQYID/HHHHHHSGFSSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPTSEE
LTIAGMTFTTFDLGGHIQARRVWKNYLPAINGIVFLVDCADHERLLESKEELDSLMTDETIANVPILILGNKIDRPEAISEE
RLREMFGLYGQTTGKGSVSLKELNARPLEVFMCSVLKRQGYGEGFRWMAQYID/.x/.$x/wwwwwwwwwwwwww
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
wwwwwwwww/wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww*
第五步 建立一个select.py文件 ,在这个文件中我们只优化补全的那部分残基。

from modeller import *
from modeller.automodel import * # Load the automodel class

log.verbose()
env = environ()

# directories for input atom files
env.io.atom_files_directories = ['.', '../atom_file']
env.io.water = True
env.io.hetatm = True


class MyModel(loopmodel):
    def select_atoms(self):
        return selection(self.residue_range('1:A', '9:A'),
                         self.residue_range('68:A', '73:A'),
                         self.residue_range('196:B', '204:B'),
                         self.residue_range('240:B', '246:B'),
                         self.residue_range('270:B', '276:B'))
                        
                                      
a = MyModel(env,
            alnfile = 'ali-ligand.ali',
            knowns = '2FMX',
            sequence = '2FMX_fill')

a.starting_model = 1
a.ending_model = 2

a.make()
注释:这里因为有两条链所以编号时B链的是在A链的基础上编的
第六步 运行 mod9v7 select.py 结果提取pdb文件即可上面说的只是一些基本的东西,要想深入的学好Modeller 还要花点时间看看在线的tutorial
http://salilab.org/modeller/tutorial/

[ Last edited by lei0736 on 2009-11-24 at 22:03 ]
回复此楼
似水年华
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

奋斗1s

金虫 (正式写手)


小木虫(金币+0.5):给个红包,谢谢回帖交流
引用回帖:
Originally posted by xiaoling0523 at 2009-10-12 15:02:40:
非常感谢您的资料,正在学习,太有帮助了

你好,我现在刚接触modeller,想问你几个问题,①我装的modeller9v8,和python26,两个东西要装到一个文件夹里吗?安装有什么要求吗?②我建模的时候模板蛋白质应该放在哪个文件夹里,应该准备什么文件?我看了modeller手册,可是一点也没有搞懂。。现在老板让我做这方面,可是师兄师姐都没有做过,老板也不太懂,我只能自己给你们学,渴望你能给予指点,谢谢啦
11楼2011-04-05 10:38:08
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 18 个回答

xiaoling0523

木虫 (小有名气)


小木虫(金币+0.5):给个红包,谢谢回帖交流
非常感谢您的资料,正在学习,太有帮助了
2楼2009-10-12 15:02:40
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sijifengsd

银虫 (小有名气)

呵呵

希望如此,共同交流
似水年华
3楼2009-10-12 16:03:56
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mophyworld

金虫 (正式写手)


小木虫(金币+0.5):给个红包,谢谢回帖交流
看上去很专业啊。先收藏了
Ineedsomeinspirationandsomeconfidence
4楼2009-10-14 15:55:45
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[考博] 2025考博 +5 自强不息a?a 2024-06-15 7/350 2024-06-16 10:07 by wang333666
[基金申请] 博士后创新人才支持计划公示 +9 aishida144 2024-06-14 15/750 2024-06-16 09:52 by msjy
[有机交流] 车间生产,真空度很高,温度很高,但减压蒸馏速度很慢。 10+12 召唤鬼泣lL 2024-06-13 36/1800 2024-06-16 09:20 by ddc805
[找工作] 应届大龄土博教职选择,石河子大学和广西大学 10+4 茅山老道士 2024-06-10 33/1650 2024-06-16 08:36 by shl2112501
[找工作] 江西双非一本和四川双一流高校如何选择? 5+7 寒山敲钟 2024-06-12 23/1150 2024-06-16 06:52 by puterde
[基金申请] 面青地会评时间 +5 tanjydd 2024-06-15 5/250 2024-06-15 23:08 by andywei1028
[教师之家] 关于2023的收入 +33 小龙虾2008 2024-06-10 34/1700 2024-06-15 23:01 by zeolitess
[教师之家] 请问事业编制和年薪制冲突吗? +6 ZHONGWU_U 2024-06-14 6/300 2024-06-15 20:16 by Ermito
[论文投稿] 投稿时忘记修改一作 +7 gll123456 2024-06-13 11/550 2024-06-15 11:49 by gll123456
[论文投稿] 求机械类四区sci推荐 5+3 迷茫小旷 2024-06-14 4/200 2024-06-15 11:25 by bobvan
[基金申请] 有没有机械的前辈分享一下评上海优都是什么成果啊 +7 wulala800 2024-06-10 7/350 2024-06-15 09:33 by 晓目崇
[论文投稿] 投了一篇4区的SCI,审稿人一个拒稿,一个小修,编辑给了大修。 +9 安稳22123 2024-06-13 10/500 2024-06-14 23:45 by jurkat.1640
[基金申请] 面上基金有一个(两个)C是不是就没戏了.... 5+3 zzzm116 2024-06-13 17/850 2024-06-14 22:26 by lzt8076
[基金申请] 工材E口JQ有消息了吗 +4 babyduck 2024-06-11 4/200 2024-06-14 17:23 by firepick
[考博] 申博找导师 +4 疏影横斜水清浅3 2024-06-13 6/300 2024-06-14 14:31 by zxl_1105
[论文投稿] 最近写了一篇控制优化领域的文章,可以投哪里啊?有没有水一些的期刊推荐 +7 香瓜木香 2024-06-12 13/650 2024-06-14 07:05 by 香瓜木香
[考博] 博导选择 +3 bing85977 2024-06-12 3/150 2024-06-13 15:34 by 我是邱尧
[基金申请] 博后特助这周出结果吗?往年都是啥时候啊? +13 jsqy 2024-06-12 17/850 2024-06-12 19:55 by Lynn212
[硕博家园] 求助 +6 LYWwrz 2024-06-09 9/450 2024-06-11 13:12 by powerhours
[教师之家] 公办双非,学生论文升学就业都不行。一本大学的论文升学就业没问题吧? +5 河西夜郎 2024-06-09 5/250 2024-06-10 17:59 by yyallen2003
信息提示
请填处理意见