版块导航: 正在加载中...

登录注册

应《网络安全法》要求，自2017年10月1日起，未进行实名认证将不得使用互联网跟帖服务。为保障您的帐号能够正常使用，请尽快对帐号进行手机号验证，感谢您的理解与支持！

24小时热门版块排行榜

北京石油化工学院2026年研究生招生接收调剂公告

返回列表

本帖产生 1 个 MolEPI ，点击这里进行查看

当前只显示满足指定条件的回帖，点击这里查看本话题的所有回帖

晋鹏

版主 (知名作家)

MolEPI: 6
应助: 626 (博士)
贵宾: 0.096
金币: 27591
散金: 1052
红花: 288
沙发: 2
帖子: 5663
在线: 726.4小时
虫号: 1183978
注册: 2011-01-05
性别: GG
专业: 生物信息学
管辖: 农林

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与，应助指数 +1
西门吹雪170: MolEPI+1 2017-07-28 07:44:12
西门吹雪170: 金币+6, 鼓励热心回帖交流 2017-07-28 07:44:45
cxl8400501: 金币+20 2017-07-29 16:47:50

正好熟悉这个，给你一个方法：利用MODLLER同源建模。

前期的准备工作（这里介绍并没有结构的蛋白序列的从头建立结构的过程）

首先：把你需要建立结构的蛋白序列写成modeller能够识别的文件格式
>P1;TvLDH
sequence:::::::::
MSEAAHVLITGAAGQIGYILSHWIASGELYGDRQVYLHLLDIPPAMNRLTALTMELEDCAFPHLAGFVATTDPKAAFKDIDCAFLVASMPLKPGQVRADLISSNSVIFKNTGEYLSKWAKPSVKVLVIGNPDNTNCEIAMLHAKNLKPENFSSLSMLDQNRAYYEVASKLGVDVKDVHDIIVWGNHGESMVADLTQATFTKEGKTQKVVDVLDHDYVFDTFFKKIGHRAWDILEHRGFTSAASPTKAAIQHMKAWLFGTAPGEVLSMGIPVPEGNPYGIKPGVVFSFPCNVDKEGKIHVVEGFKVNDWLREKLDFTEKDLFHEKEIALNHLAQGG*
第二行后面的字段基本没什么作用,只要把第一个字段sequence写上即可,注意，这一行一共10个字段用9个分号隔开。
第三行为将你要建立结构的序列的氨基酸写成单字母的形式，最后的 " * “ 符号表示序列的结束.

其次：
将PDB库中的序列准备好（modeller会经常更新PDB库中的序列,这些序列会经常更新,你可以从modeller的官网上下载）下面是将PDB库中的序列转化为二进制的文件格式,可以加快搜索具有高度相似的序列的速度. 转换的脚本如下所示：
from modeller import *
log.verbose()
env = environ()
sdb = sequence_db(env)
sdb.convert(seq_database_file='pdb_95.pir', seq_database_format='PIR',  chains_list='ALL', minmax_db_seq_len=(30, 4000),  clean_sequences=True, outfile='pdb_95.hdf5')

第四行 sequence_db()对象用于创建一个存放大量的蛋白序列的库对象。
第五行调用对象的convert()方法，以PIR格式的方式读入pdb_95.pir,去除残基序列的数目小于30并且大于4000的序列，用minmx_db_seq_len参数指出，去除不标准的残基用clean_sequences指出，最终文件以二进制的形式写到pdb_95.hdf5文件中。

第三：利用上一步中生成的二进制文件进行搜索，找到和未知序列相似的结构序列。
from modeller import *
log.verbose()
env = environ()
# Read in the sequence database in binary format
sdb = sequence_db(env, seq_database_file='pdb_95.hdf5', seq_database_format='BINARY', chains_list='ALL')
# Read in the target sequence in PIR alignment format
aln = alignment(env)
aln.append(file='TvLDH.ali', alignment_format='PIR', align_codes='ALL')
# Convert the input sequence "alignment" into profile format
prf = aln.to_profile()
# Scan sequence database to pick up homologous sequences
prf.build(sdb, matrix_offset=-450, rr_file='${LIB}/blosum62.sim.mat',  gap_penalties_1d=(-500, -50), n_prof_iterations=1, check_profile=False, max_aln_evalue=0.01)
# Write out the profile in text format
prf.write(file='build_profile.prf', profile_format='TEXT')
# Convert the profile back to alignment format
aln = prf.to_alignment()
#- Write out a PIR alignment file
aln.write(file='build_profile.ali', alignment_format='PIR‘）
*****在build_profile.prf文件中，最重要的列为第2,10,11，12列，第二列指出了PDB库中的晶体结构的代码，
第11列指出了待建结构与晶体结构的序列相似度的百分数，第12列指明了叠加之后的e值。

第四：从build_profile.prf这个输出文件中找到和待建序列的相似度高的模版，评价模版的结构和序列的相似性。
from modeller import *
env = environ()
env.io.atom_files_directory = ['.', '../atom_files']
# Make a simple 1:1 alignment of 7 template structures
aln = alignment(env)for (pdb, chain) in (('1b8p', 'A'), ('1y7t', 'A'), ('1civ', 'A'), ('5mdh', 'A'), ('7mdh', 'A'), ('3d5t', 'A'), ('1smk', 'A')):
m = model(env, file=pdb, model_segment=('FIRST:'+chain, 'LAST:'+chain))
aln.append_model(m, atom_files=pdb, align_codes=pdb+chain)
# Sequence alignment
aln.malign()
# Structure alignment
aln.malign3d()
# Report details of the sequence/structure alignment
aln.compare_structures()
aln.id_table(matrix_file='family.mat')
env.dendrogram(matrix_file='family.mat', cluster_cut=-1.0)

对角线中的内容为每个结构的残基数目，上三角为相同的残基的数目，下三角为两个结构的序列相似度的百分数。
我们选择了1y7t作为模版结构，因为这个结构的结晶分辨率为1.6埃以及它与待建结构的序列的相似度为45%。

第五：将待建结构与模版结构进行align, MODELLER利用这些align的结果来提取出构建结构时必要的限制。
最好的方法是利用align2d()的方法，尽管align2d()方法是基于一种动态的算法，但是它不同于标准的序列-序列的align
方法，因为这种方法在进行align的时候会考虑到模版的结构信息。
from modeller import *
env = environ()
env.io.atom_files_directory = ['.', '../atom_files']
aln = alignment(env)
# Read in the 1y7t template structure and add to alignment
mdl = model(env, file='1y7t', model_segment=('FIRST:A','LAST:A'))
aln.append_model(mdl, align_codes='1y7tA', atom_files='1y7t')
# Add in the TvLDH sequence
aln.append(file='../step1_search/TvLDH.ali', align_codes='TvLDH')
# Sequence/structure alignment
aln.align2d(max_gap_length=40)
# Write out resulting alignment in both PIR and PAP formats
aln.write(file='TvLDH-1y7tA.ali', alignment_format='PIR')
aln.write(file='TvLDH-1y7tA.pap', alignment_format='PAP')

第六：创建比较模型
可以使用MODELLER中的automodel类，只需要告诉automodel alignment文件，使用哪个代码以及要建立多少个模型。
from modeller import *
from modeller.automodel import *
env = environ()
env.io.atom_files_directory = ['.', '../atom_files']
a = automodel(env,alnfile='../step3_align/TvLDH1y7tA.ali',  knowns='1y7tA',sequence='TvLDH',assess_methods=assess.DOPE)
a.starting_model = 1
a.ending_model = 5
a.make()

第七：评价所建的模型
从上面的步骤中找到最好的模型，评价的方法有很多种，最简单的方法是molecule PDF (molpdf)方法，标准的MODELLER评分函数。这个评分结果会在每个PDB开头的REMARK中加入。其他的评价方法包括DOPE和GA341.
从上面产生的log文件中可以发现，第一个PDB文件模型是最好的，因为DOPE的值最小。

第八：Fit models into cryo-EM maps
通过将TvLDH的 cryo-EM数据导入来使产生的蛋白结构与这些数据相吻合，通过使用MODELLER中的Mod-EM方法。
from modeller import *
log.verbose()
env = environ()
struct='../step4_model/TvLDH.B99990001.pdb'
map='TvLDH.10A.mrc'
resolution=10.0
box_size=48
apix=1.88
x=-26.742; y=-9.5205; z=-10.375 #origin
steps=20
# Read in cryo-EM density map
den = density(env, file=map, em_density_format='MRC',
voxel_size=apix, resolution=resolution, em_map_size=box_size,
density_type='GAUSS', px=x,py=y,pz=z)
# Fit the PDB file into the map by MC simulated annealing
den.grid_search(em_density_format='MRC', num_structures=1,  em_pdb_name=struct, chains_num=[1],
start_type='CENTER', number_of_steps=steps, angular_step_size=30., temperature=100.,
best_docked_models=1, translate_type='RANDOM',  em_fit_output_file='modem.log')

赞一下(1人)

回复此楼

» 本帖已获得的红花（最新10朵）

cxl8400501

及时行乐，人生不留遗憾！

2楼2017-07-27 23:54:23

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

相关版块跳转我要订阅楼主 cxl8400501 的主题更新

返回列表

最具人气热帖推荐 [查看全部]		作者	回/看	最后发表

[考研] 332求调剂 +7	蕉蕉123 2026-03-28	7/350	2026-03-29 08:25 by fmesaito
[考研] 一志愿北京化工大学材料与化工（085600）296求调剂 +13	稻妻小编 2026-03-26	13/650	2026-03-29 08:20 by fmesaito
[考研] 本科双非材料，跨考一志愿华电085801电气，283求调剂，任何专业都可以 +6	芝士雪baoo 2026-03-28	8/400	2026-03-29 08:16 by 松花缸1201
[考研] 295求调剂 +4	wei-5 2026-03-26	4/200	2026-03-28 23:20 by 小木虫tim
[考研] 一志愿郑州大学，080500学硕，总分317分求调剂 +5	举个栗子oi 2026-03-24	6/300	2026-03-28 23:03 by lizhi8172
[考研] 311（085601）求调剂 +4	liziyeyeye 2026-03-28	4/200	2026-03-28 18:50 by 535743368
[考研] 材料与化工（0856）304求B区调剂 +8	邱gl 2026-03-27	8/400	2026-03-28 12:42 by 唐沐儿
[考研] 求调剂推荐材料 304 +15	荷包蛋hyj 2026-03-26	15/750	2026-03-28 04:13 by fmesaito
[考研] 265求调剂11408 +3	刘小鹿lu 2026-03-27	3/150	2026-03-27 20:53 by nihaoar
[考研] 材料292调剂 +12	橘颂思美人 2026-03-23	12/600	2026-03-27 15:44 by caszguilin
[考研] 283求调剂（080500） +4	A child 2026-03-27	4/200	2026-03-27 15:34 by XPU李庆
[考研] 305求调剂 +5	哇卢卡库 2026-03-26	5/250	2026-03-27 14:01 by laoshidan
[考研] 324求调剂 +5	hanamiko 2026-03-26	5/250	2026-03-27 10:33 by wangjy2002
[考研] 329求调剂 +7	钮恩雪 2026-03-25	7/350	2026-03-27 04:28 by wxiongid
[考研] 304材料求调剂 +4	钟llll 2026-03-26	4/200	2026-03-27 03:42 by wxiongid
[考研] 调剂求收留 +7	果然有我 2026-03-26	7/350	2026-03-27 00:26 by wxiongid
[考研] 290分调剂求助 +3	吉祥止止陈 2026-03-25	3/150	2026-03-25 19:58 by barlinike
[考研] 302求调剂 +4	锦衣卫藤椒 2026-03-25	4/200	2026-03-25 16:29 by 功夫疯狂
[基金申请] 请教下大家 2026年国家基金申请是双盲审吗？ +3	lishucheng1 2026-03-22	5/250	2026-03-24 08:22 by gltch
[考研] 一志愿国科过程所081700，274求调剂 +3	三水研0水立方 2026-03-23	3/150	2026-03-23 23:11 by MajorWen