24小时热门版块排行榜    

查看: 1315  |  回复: 13
当前主题已经存档。
【有奖交流】积极回复本帖子,参与交流,就有机会分得作者 yf-deng 的 4 个金币

yf-deng

金虫 (正式写手)

[交流] 生物信息学求助:序列比对相似性的获得?

大家好,我在丁香园发了个http://www.dxy.cn/bbs/post/view? ... amp;tpg=1&age=0求助有关基因序列比对的帖,至今问题还是没有解决?还有就是要想知道一个物种的单个基因若想知道与其他物种的序列相似性是用多重比对还是目的基因与其他物种的基因两两比对?另一个物种的家族内基因的相似性呢?
[search]序列比对[/search]
http://www.dxy.cn/bbs/post/view?bid=73&id=12288520&sty=1&tpg=1&age=0

[ Last edited by yf-deng on 2008-7-15 at 14:47 ]
回复此楼

» 猜你喜欢

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xyklmu

至尊木虫 (知名作家)

虫眼看世界

★ ★
yf-deng(金币+2,VIP+0):谢谢您的回复,我马上把帖子贴出来
你在丁香园的帖子看不到,还需要注册才可以浏览,何不把帖子的内容贴过来??
对于要想知道一个物种的单个基因其他物种的类似序列的相似程度有多大,一般是用多重对比的软件来测算,如DNASTAR(lasergene)、DNATOOL等。用这些软件既可以知道此基因和别的类似基因的两两之间的相似性和趋异性,也可以知道这个基因在整个谱系中的聚类或者是进化地位。同一个物种内的基因家族成员之间的关系也可以用这种多重比对来进行比较。另外进化树软件Philip也可以通过树形的形式展示基因家族内或者基因类似物的相似性或者趋异性,相互之间的关系可以用进化距离来表示的。
位卑未敢忘忧国。
2楼2008-07-14 19:26:05
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yf-deng

金虫 (正式写手)

上图所显示的是我用两种方法比对的结果,请问我的比对方法是否正确,如何才能获得序列间的相似性?谢谢!
3楼2008-07-15 14:49:17
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zcslzf

捐助贵宾 (小有名气)

各种软件的过程和算法基本没有区别,你一定要搞清楚用的是什么比对方法(全局或者局部),打分矩阵,和记分的方法.选择的不同出来的结果肯定是不同的,你的结果要想和文献中的结果有可比性,参数的选择首先要一样.
4楼2008-07-15 16:02:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yf-deng

金虫 (正式写手)

谢谢zcslzf兄弟 可是到底哪个才是相似性呀
5楼2008-07-16 01:23:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xyklmu

至尊木虫 (知名作家)

虫眼看世界

★ ★
yf-deng(金币+2,VIP+0):谢谢您的回复
附件图片6中的数值的确是相似性的比较,这一点不用怀疑,至于你的结果和文章中的结果有很大的出入,我觉着可能是所用的软件不同,而每个软件的默认设置参数不同,还有就是你和文章中所比较的基因片段完全相同吗?是采取的保守domain 比较的还是全长比较的,基因的比较还是蛋白水平的比较,这些都会引起最后的数值发生不一致的现象。DNASTAR软件包中的Megalign软件,基本上不能设参数,也就是做做一般的比较还可以,正式发表的论文大都不用DNASTAR(lasergene)的。Clustal W或者是Philip都是做系统进化以及进化树研究的好工具。

用Philip做分析的时候,除了要选择好各种参数以外,尤其是一个boottrap数值要设好,一般是设1000的,好像是做1000次不同的比较,最后得出一个结果。还有就是一个外类群(outgroup)的选定同样很关键的。一般选择一个亲缘关系最远的物种做外类群。这个软件有一个中文说明,你很容易在网上搜到的。
位卑未敢忘忧国。
6楼2008-07-16 02:00:05
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zcslzf

捐助贵宾 (小有名气)

你的附件6是两两序列之间的Identity表,每一列或者每一行中的最大值对应的行和列才是一对最相似的,neighbour-joining的方法就是以此表为基础,现找出identity最大的一组,然后再把其他的逐个加就来就得到了系统进化树.
7楼2008-07-16 08:32:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yf-deng

金虫 (正式写手)

谢谢大家的宝贵建议,我比较的蛋白序列都是和文献上一摸一样的,但是丁香园的一位战友是这样解释第六张图的“zaiai wrote:
帮你上去看了下,你理解的有误
“比对结果.jpg (46.14 K ”
这张图上的红色字注解有误。那一串数字不是序列相似性结果,是序列之间的距离,这个距离与选择的替代模型相关。你要明白的是序列相似性与序列距离有关系但不等同。


还有请问大家图10 bioedit显示的是什么意思呢?实在是太菜了,麻烦大家了
8楼2008-07-16 16:32:57
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yf-deng

金虫 (正式写手)

还有请问大家similarity和identity有什么区别呢?问题太多了!
9楼2008-07-16 16:37:41
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xyklmu

至尊木虫 (知名作家)

虫眼看世界

我觉着一般情况下我们比较的是相似性,我不知道你是如何设置的DNASTAR?有些情况下,氨基酸不同,但是软件会认为是同源的,也就是相似的,而不认为是相同的。也说不好这个问题。实在不行,你贴出所有用于比较的序列,我做一下试试看,只要不涉及你的保密性就好。
位卑未敢忘忧国。
10楼2008-07-16 16:50:57
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 yf-deng 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见