24小时热门版块排行榜    

查看: 3345  |  回复: 14
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

ValYu

银虫 (小有名气)

[求助] 关于uniprot的批量序列下载

我想从uniprot上批量下载400多个kinase的protein kinase domain,手工操作太麻烦且容易出错,网站自身又没有批处理功能,怎样能够实现这样的程序化批量下载呢?是不是要编写什么网页脚本?求大神指教!如回答的好我会继续加金币的!

[ 来自科研家族 化学生物学 ]
回复此楼
生命灿烂,精神永恒
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wizardfan

至尊木虫 (著名写手)

优秀版主

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
silicare: 金币+5, 应助指数+1, 可行,不过这个工程太浩大了,做到精确下载有难度 2013-04-20 08:46:56
ValYu: 金币+5, 有帮助 2013-04-21 09:20:36
去ftp网站上下载你所需物种的全部蛋白质FASTA序列,然后写了perl或者其他啥的,只要描述行里有kinase的就保留。
不过你到底要的是domain,还是整个蛋白?如果是domain的话,就不能光下载FASTA文件,而是要下载DAT文件了。
3楼2013-04-20 08:20:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 15 个回答

547star

木虫 (著名写手)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
wizardfan: 金币+2, BLAST也是个可行的思路 2013-04-20 08:21:40
ValYu: 金币+5, 有帮助 2013-04-21 09:20:25
坐等高手。
如果是我,会选择做BLAST,把blast结果下载,其中的fasta格式基本满足我的需要,想需要多的序列,BLAST的时候先设置一下参数。可以参考刚做的结果: http://www.uniprot.org/blast/uniprot/201304196009B639SI.* 或 http://www.uniprot.org/blast/uni ... e=yes&limit=250
为什么
2楼2013-04-19 21:54:23
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

帘外飞雪

银虫 (小有名气)

【答案】应助回帖

★ ★
感谢参与,应助指数 +1
wizardfan: 金币+2, 谢谢参与,不过这个效率不高,还容易被屏蔽IP 2013-04-21 08:13:12
写perl批量抓网页,分析网页,提取想要的东东
4楼2013-04-20 19:49:15
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ValYu

银虫 (小有名气)

引用回帖:
4楼: Originally posted by 帘外飞雪 at 2013-04-20 19:49:15
写perl批量抓网页,分析网页,提取想要的东东

我正准备学python,据说比perl简单
生命灿烂,精神永恒
5楼2013-04-21 09:12:46
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
信息提示
请填处理意见