版块导航: 正在加载中...

登录注册

应《网络安全法》要求，自2017年10月1日起，未进行实名认证将不得使用互联网跟帖服务。为保障您的帐号能够正常使用，请尽快对帐号进行手机号验证，感谢您的理解与支持！

24小时热门版块排行榜

返回列表

当前只显示满足指定条件的回帖，点击这里查看本话题的所有回帖

sijifengsd

银虫 (小有名气)

应助: 0 (幼儿园)
金币: 273.7
散金: 50
红花: 2
帖子: 94
在线: 12.1小时
虫号: 794988
注册: 2009-06-15
性别: GG
专业: 物理化学

[交流] 【经验】用Modeller补全残基学习心得已有8人参与

最近专注于分子动力学的模拟研究。发现好多的蛋白质晶体结构或多或少的有一部分残基丢失了，要做动力学模拟，就需要把丢失的残基给补上。看文献发现比较公认的、又是免费的软件当属Modeller了。所以本人花了两个周的时间研究了这个软件的使用方法。现把个人的心得体会奉献出来，希望给需要的同学们提供点帮助：
首先大家可以到这个网站申请个序列号，下载个免费的软件:
http://salilab.org/modeller/registration.html
安装成功就可用了。
这个软件要用到一些脚本文件，补全残基可以带着配体，水，也可以不带。
一没有配体、水分子：
第一步处理大分子pdb 文件，删除杂原子和水分子等。
第二步建立一个get_ali.py 脚本文件

# get sequece of the 2FMX PDB file, and write to an alignment file.

log.verbose()
env = environ()

env.io.atom_files_directories = ['.', '../atom_file']

code = '2FMX'
m = model(env, file=code)
aln = alignment(env)

aln.append_model(m, align_codes=code)
aln.write(code+'.seq')

第三步：运行 modpv7 get_ali.py 产生一个sequence 文件：2FMX.seq

>P1;2FMX
structureX:2FMX:  13 :A:+556 :B:MOL_ID  1; MOLECULE  GTP-BINDING PROTEIN SAR1B; CHAIN  A, B; FRAGMENT  RESIDUES 10-198; SYNONYM  SAR1, GTBPB; ENGINEERED  YES:MOL_ID  1; ORGANISM_SCIENTIFIC  CRICETULUS GRISEUS; ORGANISM_COMMON  CHINESE HAMSTER; ORGANISM_TAXID  10029; EXPRESSION_SYSTEM  ESCHERICHIA COLI; EXPRESSION_SYSTEM_TAXID  562; EXPRESSION_SYSTEM_VECTOR_TYPE  PLASMID; EXPRESSION_SYSTEM_PLASMID  PET11D: 1.82:-1.00
SSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPTSEELTIAGMTFTTFDLGRVWKNYLPAI
NGIVFLVDCADHERLLESKEELDSLMTDETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSVSLKEL
NARPLEVFMCSVLKRQGYGEGFRWMAQYID
第四步：用产生的序列文件产生一个alignment.ali脚本文件：把上面的序列复制到脚本中

>P1;2FMX
structureX:2FMX.pdb: 13 :A:4872 :A:undefined:undefined:-1.00:-1.00
SSVL---QFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPTSEELTIAGMTFTTFDLGRVWKNYLPAI
NGIVFLVDCADHERLLESKEELDSLMTDETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSVSLKEL
NARPLEVFMCSVLKRQGYGEGFRWMAQYID---

>P1;2FMX_fill
sequence:2FMX_fill:    :A  :    :A ::: 0.00: 0.00
SSVLHJKQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPTSEELTIAGMTFTTFDLGRVWKNYLPAI
NGIVFLVDCADHERLLESKEELDSLMTDETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSVSLKEL
NARPLEVFMCSVLKRQGYGEGFRWMAQYIDLPO
注意：上面的一个序列是pdb源文件的残基，而下面是加上缺失残基的全序列。13 :A:4872 A:表示在源文件中开始和结束的残基序号。
第五步建立一个select.py文件，在这个文件中我们只优化补全的那部分残基。

from modeller import *
from modeller.automodel import * # Load the automodel class

log.verbose()
env = environ()

# directories for input atom files
env.io.atom_files_directories = ['.', '../atom_file']
class MyModel(loopmodel):
def select_atoms(self):
      return selection(self.residue_range('1:A', '9:A'),
                     self.residue_range('68:A', '73:A'),

a = MyModel(env,
         alnfile = 'alignment.ali',
         knowns = '2FMX',
         sequence = '2FMX_fill')

a.starting_model = 1
a.ending_model = 2

a.make()

注释: 上面的'1:A', '9:A'，'68:A', '73:A' 是加入的那部分残基在从1开始中的序列编号；下面的红字表示可以改动的地方。class MyModel(automodel) 中的automodel也可以换成loopmodel,这样对已loop区的优化更好。
第六步运行 mod9v7 select.py 结果提取pdb文件即可。
二包含配体和水分子
第一步大分子就不要处理了。
第二步建立一个get_ali.py 脚本文件

# get sequece of the 2FMX PDB file, and write to an alignment file.

log.verbose()
env = environ()

env.io.atom_files_directories = ['.', '../atom_file']

code = '2FMX'
m = model(env, file=code)
aln = alignment(env)

aln.append_model(m, align_codes=code)
aln.write(code+'.seq')

第三步：运行 modpv7 get_ali.py 产生一个sequence 文件：2FMX.seq

>P1;2FMX
structureX:2FMX:  13 :A:+556 :B:MOL_ID  1; MOLECULE  GTP-BINDING PROTEIN SAR1B; CHAIN  A, B; FRAGMENT  RESIDUES 10-198; SYNONYM  SAR1, GTBPB; ENGINEERED  YES:MOL_ID  1; ORGANISM_SCIENTIFIC  CRICETULUS GRISEUS; ORGANISM_COMMON  CHINESE HAMSTER; ORGANISM_TAXID  10029; EXPRESSION_SYSTEM  ESCHERICHIA COLI; EXPRESSION_SYSTEM_TAXID  562; EXPRESSION_SYSTEM_VECTOR_TYPE  PLASMID; EXPRESSION_SYSTEM_PLASMID  PET11D: 1.82:-1.00
SSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPTSEELTIAGMTFTTFDLGRVWKNYLPAI
NGIVFLVDCADHERLLESKEELDSLMTDETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSVSLKEL
NARPLEVFMCSVLKRQGYGEGFRWMAQYID
第四步：用产生的序列文件产生一个alignment.ali脚本文件：把上面的序列复制到脚本中

>P1;2FMX
structureX:2FMX.pdb: 13 :A:4890 :A:undefined:undefined:-1.00:-1.00
SSVL---QFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPTSEELTIAGMTFTTFDLGRVWKNYLPAI
NGIVFLVDCADHERLLESKEELDSLMTDETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSVSLKEL
NARPLEVFMCSVLKRQGYGEGFRWMAQYID---.wwwwwwwwwwww

>P1;2FMX_fill
sequence:2FMX_fill:    :A  :    :A ::: 0.00: 0.00
SSVLHJKQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPTSEELTIAGMTFTTFDLGRVWKNYLPAI
NGIVFLVDCADHERLLESKEELDSLMTDETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSVSLKEL
NARPLEVFMCSVLKRQGYGEGFRWMAQYIDLPO. wwwwwwwwwwww
注意：到这一步和上面有区别了，因为有配体和水分子就要在序列的后面加上”.(表示配体，有几个配体杂原子加几个点)” 和”w(表示水分子，有几个加几个w)”。如果水分子和配体时单独成链的要加/例如：/. Wwwwwwwwwwww,或者 . /wwwwwwwwwwww
第五步建立一个select.py文件，在这个文件中我们只优化补全的那部分残基。

from modeller import *
from modeller.automodel import * # Load the automodel class

log.verbose()
env = environ()
env.io.water = True
env.io.hetatm = True

# directories for input atom files
env.io.atom_files_directories = ['.', '../atom_file']
class MyModel(loopmodel):
def select_atoms(self):
      return selection(self.residue_range('1:A', '9:A'),
                     self.residue_range('68:A', '73:A'),

a = MyModel(env,
         alnfile = 'alignment.ali',
         knowns = '2FMX',
         sequence = '2FMX_fill')

a.starting_model = 1
a.ending_model = 2

a.make()

注释:这里加入了env.io.water = True  env.io.hetatm = True还识别水分子和配体。
第六步运行 mod9v7 select.py 结果提取pdb文件即可
三复杂点的比如两条链的

第一步下载pdb
第二步建立一个get_ali.py 脚本文件

# get sequece of the 2FMX PDB file, and write to an alignment file.

log.verbose()
env = environ()
env.io.water = True
env.io.hetatm = True

env.io.atom_files_directories = ['.', '../atom_file']

code = '2FMX'
m = model(env, file=code)
aln = alignment(env)

aln.append_model(m, align_codes=code)
aln.write(code+'.seq')
注：这里直接用env.io.water = True  nv.io.hetatm = True 会直接把配体、水给你表示出来

第三步：运行 modpv7 get_ali.py 产生一个sequence 文件：2FMX.seq
>P1;2FMX
structureX:2FMX:  13 :A:+556 :B:MOL_ID  1; MOLECULE  GTP-BINDING PROTEIN SAR1B; CHAIN  A, B; FRAGMENT  RESIDUES 10-198; SYNONYM  SAR1, GTBPB; ENGINEERED  YES:MOL_ID  1; ORGANISM_SCIENTIFIC  CRICETULUS GRISEUS; ORGANISM_COMMON  CHINESE HAMSTER; ORGANISM_TAXID  10029; EXPRESSION_SYSTEM  ESCHERICHIA COLI; EXPRESSION_SYSTEM_TAXID  562; EXPRESSION_SYSTEM_VECTOR_TYPE  PLASMID; EXPRESSION_SYSTEM_PLASMID  PET11D: 1.82:-1.00
SSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPTSEELTIAGMTFTTFDLGRVWKNYLPAI
NGIVFLVDCADHERLLESKEELDSLMTDETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSVSLKEL
NARPLEVFMCSVLKRQGYGEGFRWMAQYID/SSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDPTLHPTSEE
LTIAGMTFTTFDLGVWKNYLPAINGIVFLVDCADHERLLESKEELDSLMTDETIANVPILILGNKIDRPEAISEE
RLREMFGLYGQTTGKGSVSLKELNARPLEVFMCSVLKRQGYGEGFRWMAQYID/.x/.$x/wwwwwwwwwwwwww
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
wwwwwwwww/wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww*

第四步：用产生的序列文件产生一个alignment.ali脚本文件：把上面的序列复制到脚本中

>P1;2FMX
structureX:2FMX.pdb: 13 :A:4872 :B:undefined:undefined:-1.00:-1.00
---------SSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPTSEELTIAGMTFTTFDLG------RVWKNYLPAI
NGIVFLVDCADHERLLESKEELDSLMTDETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSVSLKEL
NARPLEVFMCSVLKRQGYGEGFRWMAQYID/---------SSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKD-------PTLHPTSEE
LTIAGMTFTTFDLG-------VWKNYLPAINGIVFLVDCADHERLLESKEELDSLMTDETIANVPILILGNKIDRPEAISEE
RLREMFGLYGQTTGKGSVSLKELNARPLEVFMCSVLKRQGYGEGFRWMAQYID/.x/.$x/wwwwwwwwwwwwww
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
wwwwwwwww/wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww*

>P1;2FMX_fill
sequence:2FMX_fill:    :A  :    :B ::: 0.00: 0.00
HHHHHHSGFSSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPTSEELTIAGMTFTTFDLGGHIQARRVWKNYLPAI
NGIVFLVDCADHERLLESKEELDSLMTDETIANVPILILGNKIDRPEAISEERLREMFGLYGQTTGKGSVSLKEL
NARPLEVFMCSVLKRQGYGEGFRWMAQYID/HHHHHHSGFSSVLQFLGLYKKTGKLVFLGLDNAGKTTLLHMLKDDRLGQHVPTLHPTSEE
LTIAGMTFTTFDLGGHIQARRVWKNYLPAINGIVFLVDCADHERLLESKEELDSLMTDETIANVPILILGNKIDRPEAISEE
RLREMFGLYGQTTGKGSVSLKELNARPLEVFMCSVLKRQGYGEGFRWMAQYID/.x/.$x/wwwwwwwwwwwwww
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
wwwwwwwww/wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww*
第五步建立一个select.py文件，在这个文件中我们只优化补全的那部分残基。

from modeller import *
from modeller.automodel import * # Load the automodel class

log.verbose()
env = environ()

# directories for input atom files
env.io.atom_files_directories = ['.', '../atom_file']
env.io.water = True
env.io.hetatm = True

class MyModel(loopmodel):
def select_atoms(self):
      return selection(self.residue_range('1:A', '9:A'),
                     self.residue_range('68:A', '73:A'),
                     self.residue_range('196:B', '204:B'),
                     self.residue_range('240:B', '246:B'),
                     self.residue_range('270:B', '276:B'))


a = MyModel(env,
         alnfile = 'ali-ligand.ali',
         knowns = '2FMX',
         sequence = '2FMX_fill')

a.starting_model = 1
a.ending_model = 2

a.make()
注释:这里因为有两条链所以编号时B链的是在A链的基础上编的
第六步运行 mod9v7 select.py 结果提取pdb文件即可上面说的只是一些基本的东西，要想深入的学好Modeller 还要花点时间看看在线的tutorial
http://salilab.org/modeller/tutorial/

[ Last edited by lei0736 on 2009-11-24 at 22:03 ]

回复此楼

» 本主题相关商家推荐: (我也要在这里推广)

» 本主题相关价值贴推荐，对您同样有帮助:

似水年华

1楼2009-10-12 10:01:04

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

奋斗1s

金虫 (正式写手)

应助: 1 (幼儿园)
金币: 1256.1
散金: 109
红花: 1
帖子: 415
在线: 106.7小时
虫号: 980571
注册: 2010-03-24
专业: 有机合成

★
小木虫(金币+0.5):给个红包，谢谢回帖交流

引用回帖:

Originally posted by sijifengsd at 2009-10-12 10:01:04:
最近专注于分子动力学的模拟研究。发现好多的蛋白质晶体结构或多或少的有一部分残基丢失了，要做动力学模拟，就需要把丢失的残基给补上。看文献发现比较公认的、又是免费的软件当属Modeller了。所以本人花了两个周 ...

你好，我现在在学习modeller，但是有很多地方不懂，我想问你一下：env.io.atom_files_directory = ['.', '../atom_files']中，① ['.', '../atom_files']中应该写什么？路径？还是什么都不用写？要写的话你能给我一个模板吗？②atom_files应该怎样准备？
麻烦你了，谢谢

赞一下(1人)

回复此楼

10楼2011-04-05 10:00:55

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

奋斗1s

金虫 (正式写手)

应助: 1 (幼儿园)
金币: 1256.1
散金: 109
红花: 1
帖子: 415
在线: 106.7小时
虫号: 980571
注册: 2010-03-24
专业: 有机合成

★
小木虫(金币+0.5):给个红包，谢谢回帖交流

引用回帖:

Originally posted by xiaoling0523 at 2009-10-12 15:02:40:
非常感谢您的资料，正在学习，太有帮助了

你好，我现在刚接触modeller，想问你几个问题，①我装的modeller9v8，和python26，两个东西要装到一个文件夹里吗？安装有什么要求吗？②我建模的时候模板蛋白质应该放在哪个文件夹里，应该准备什么文件？我看了modeller手册，可是一点也没有搞懂。。现在老板让我做这方面，可是师兄师姐都没有做过，老板也不太懂，我只能自己给你们学，渴望你能给予指点，谢谢啦

赞一下(1人)

回复此楼

11楼2011-04-05 10:38:08

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

相关版块跳转我要订阅楼主 sijifengsd 的主题更新

返回列表

最具人气热帖推荐 [查看全部]		作者	回/看	最后发表

[有机交流] 想要用氢化钠拔掉吲哚N上的氢取代酰氯 50+3	光敏剂 2024-06-19	4/200	2024-06-20 18:41 by HF111001
[基金申请] 刚刚收到科研之友邮件 +19	olivermiaoer 2024-06-19	27/1350	2024-06-20 18:37 by kobe0107
[硕博家园] 怎么带研究生？ +8	豆豆小小2 2024-06-20	8/400	2024-06-20 18:03 by sakuraai
[基金申请] 国产期刊影响因子大于12的有20多个个了 +6	babu2015 2024-06-20	6/300	2024-06-20 18:01 by sakuraai
[论文投稿] 投稿求助 6+3	小短腿安琪拉 2024-06-19	4/200	2024-06-20 17:40 by 不一样烟火12345
[找工作] 初始合伙人来啦！（生物试剂耗材标准品） +15	欢快的小科研人 2024-06-15	26/1300	2024-06-20 17:26 by 20086126
[有机交流] 求助 10+5	脂质纳米粒 2024-06-20	6/300	2024-06-20 17:16 by czyzsu
[有机交流] 跑板能跑开，过柱过不纯怎么办 +5	小胡在努力 2024-06-18	7/350	2024-06-20 15:42 by 2461777831
[找工作] 高校两个offer选择 +15	cowox2021 2024-06-18	16/800	2024-06-20 15:24 by ase123456
[教师之家] 每次骚扰女学生的都是院系领导，而不是普通教师，小编们要注意措辞正确 +11	zju2000 2024-06-15	13/650	2024-06-20 15:19 by ase123456
[文学芳草园] 累并快乐着 +21	MYHLD521 2024-06-14	21/1050	2024-06-20 13:34 by 1429524838
[精细化工] 切削液交流群 +5	SZ吴彦祖 2024-06-17	5/250	2024-06-20 12:10 by 毛爱波BBB
[催化] 镍负载氧化铝的保存问题 8+3	lwn0130 2024-06-15	6/300	2024-06-20 09:00 by lwn0130
[访问学者] 国家公派访问学者申请结果出了吗？ +4	65syn 2024-06-13	4/200	2024-06-19 16:40 by 海洋之心168
[硕博家园] 关于硕博连读的一些疑问？ +8	Lwenter 2024-06-14	10/500	2024-06-19 10:00 by qingdao001
[教师之家] 请问事业编制和年薪制冲突吗？ +12	ZHONGWU_U 2024-06-14	12/600	2024-06-18 19:31 by fangyl2005
[高分子] 寻找聚酯反应釜 +3	茕茕恭煮 2024-06-15	6/300	2024-06-18 14:15 by 茕茕恭煮
[论文投稿] 论文已接收，但发现修改稿传的是旧版该怎么办？ +3	zsq54321 2024-06-15	6/300	2024-06-17 19:45 by wjykycg
[论文投稿] 审稿问题：为什么荧光激发波长和紫外吸收波长差的大？ 10+5	sdawege 2024-06-14	10/500	2024-06-17 18:54 by HH-探针
[论文投稿] 投稿被一个审稿人恶意评审了怎么样？ +5	1chen 2024-06-14	7/350	2024-06-15 23:15 by xy66xy

24小时热门版块排行榜

sijifengsd

[交流] 【经验】用Modeller补全残基学习心得已有8人参与

» 收录本帖的淘贴专辑推荐

» 本帖已获得的红花（最新10朵）

» 猜你喜欢

» 本主题相关商家推荐: (我也要在这里推广)

» 本主题相关价值贴推荐，对您同样有帮助:

奋斗1s

奋斗1s