24小时热门版块排行榜    

CyRhmU.jpeg
查看: 1912  |  回复: 12

bettyshan

木虫 (正式写手)

梦幻biobrick

[求助] 批量序列比对分析已有2人参与

想同时比对几百个基因在某一个基因组中是否存在同源基因,如何实现?
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

我们都是芸芸众生的小人物,相遇相知,都是幸福!
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lcat

木虫 (小有名气)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
wizardfan: 金币+2, 感谢应助 2014-10-03 07:16:47
bettyshan: 金币+5, 有帮助 2014-10-06 15:29:02
你可以下载bioedit这个软件(google一下就有),用它的本地blast功能,可以同时做多个query序列。摸索一下就行。
2楼2014-10-02 22:49:06
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

bettyshan

木虫 (正式写手)

梦幻biobrick

引用回帖:
2楼: Originally posted by lcat at 2014-10-02 22:49:06
你可以下载bioedit这个软件(google一下就有),用它的本地blast功能,可以同时做多个query序列。摸索一下就行。

可以做多个序列与一个相同的基因组比对吗?
我们都是芸芸众生的小人物,相遇相知,都是幸福!
3楼2014-10-04 16:51:22
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

liuderong

铁杆木虫 (正式写手)

【答案】应助回帖

★ ★ ★ ★ ★
bettyshan: 金币+5, 有帮助 2014-10-06 15:29:12
NCBI有local blast供下载,网上还有很多教程。本地blast的确非常合适解决你的问题

[ 发自手机版 http://muchong.com/3g ]
4楼2014-10-04 18:46:34
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

bettyshan

木虫 (正式写手)

梦幻biobrick

引用回帖:
4楼: Originally posted by liuderong at 2014-10-04 18:46:34
NCBI有local blast供下载,网上还有很多教程。本地blast的确非常合适解决你的问题

谢谢~
我们都是芸芸众生的小人物,相遇相知,都是幸福!
5楼2014-10-05 15:53:57
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

bettyshan

木虫 (正式写手)

梦幻biobrick

引用回帖:
4楼: Originally posted by liuderong at 2014-10-04 18:46:34
NCBI有local blast供下载,网上还有很多教程。本地blast的确非常合适解决你的问题

你好,想请教一个问题:我想比对多个蛋白在整个链霉菌种属中的同源蛋白,因为不可能把所有链霉菌的蛋白数据库都下载到本地,应该如何实现呢?另外,新版本的blastp参数应该如何设置呢?要求e-value 1-e-30,  identity above 80%, a matching length of at least 70% of the query sequence
非常感谢!
我们都是芸芸众生的小人物,相遇相知,都是幸福!
6楼2014-10-11 15:44:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

bettyshan

木虫 (正式写手)

梦幻biobrick

引用回帖:
4楼: Originally posted by liuderong at 2014-10-04 18:46:34
NCBI有local blast供下载,网上还有很多教程。本地blast的确非常合适解决你的问题

你好,想请教一个问题:我想比对多个蛋白在整个链霉菌种属中的同源蛋白,因为不可能把所有链霉菌的蛋白数据库都下载到本地,应该如何实现呢?另外,新版本的blastp参数应该如何设置呢?要求e-value 1-e-30,  identity above 80%, a matching length of at least 70% of the query sequence
非常感谢!
我们都是芸芸众生的小人物,相遇相知,都是幸福!
7楼2014-10-11 15:44:19
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

liuderong

铁杆木虫 (正式写手)

引用回帖:
7楼: Originally posted by bettyshan at 2014-10-11 15:44:19
你好,想请教一个问题:我想比对多个蛋白在整个链霉菌种属中的同源蛋白,因为不可能把所有链霉菌的蛋白数据库都下载到本地,应该如何实现呢?另外,新版本的blastp参数应该如何设置呢?要求e-value 1-e-30,  ident ...

用本地blast是要下载所有链霉菌的蛋白序列的,NCBI里好像没有单独将链霉菌的蛋白整理出来,你可以下载所有细菌的蛋白,ftp://ftp.ncbi.nlm.nih.gov/refseq/release/bacteria/这个FTP里头,进去之后网页拉到下面一点,下载那些带“nonredundant” 和“faa”的,所有231个文件,蛋白估计也就10多个G,总能下载完的。下载完之后可以从这些序列中挑出链霉菌的序列,然后构建blast数据库,这一步估计要写一些计算机代码,不知道你会不会。
上面的方法最准确但是有些麻烦,你也可以到uniprot网站http://www.uniprot.org/里头,搜索streptomyces,出来的就是链霉菌的蛋白,大约是60万条,搜索完后这个网站会提供序列下载,点击download就行了,下载fasta格式的序列可以直接用来构建blast数据库。
有blast数据库之后比对就比较简单了,难的估计是分析比对结果。你说的e-value比较好办, identity和 matching我不知道该怎么控制,不过用blast的-m8参数可以输出Tab类型的结果,要筛选 identity和 matching应该也不难。
我以前做过类似你说的东西,不过我找的是真菌蛋白,当时找到的真菌序列大约是200万,我估计链霉菌的也是百万级别。百万级别的序列不算多,想要完成你说的这类任务,你得习惯同这种大数据打交道。
8楼2014-10-11 17:18:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

bettyshan

木虫 (正式写手)

梦幻biobrick

引用回帖:
8楼: Originally posted by liuderong at 2014-10-11 17:18:50
用本地blast是要下载所有链霉菌的蛋白序列的,NCBI里好像没有单独将链霉菌的蛋白整理出来,你可以下载所有细菌的蛋白,ftp://ftp.ncbi.nlm.nih.gov/refseq/release/bacteria/这个FTP里头,进去之后网页拉到下面一点 ...

真的是要这样下载吗?感觉下载时间好久呀。。。。
我们都是芸芸众生的小人物,相遇相知,都是幸福!
9楼2014-10-13 09:23:59
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

bettyshan

木虫 (正式写手)

梦幻biobrick

引用回帖:
8楼: Originally posted by liuderong at 2014-10-11 17:18:50
用本地blast是要下载所有链霉菌的蛋白序列的,NCBI里好像没有单独将链霉菌的蛋白整理出来,你可以下载所有细菌的蛋白,ftp://ftp.ncbi.nlm.nih.gov/refseq/release/bacteria/这个FTP里头,进去之后网页拉到下面一点 ...

非常感谢了,如果有什么高速下载方法就好了~~
我们都是芸芸众生的小人物,相遇相知,都是幸福!
10楼2014-10-13 09:24:46
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 bettyshan 的主题更新
信息提示
请填处理意见