24小时热门版块排行榜    

CyRhmU.jpeg
南方科技大学公共卫生及应急管理学院2025级博士研究生招生报考通知
查看: 1040  |  回复: 2

hxswdl

至尊木虫 (文坛精英)

Tortoise

文献杰出贡献

[求助] 有一批基因组的NC号,求助批量下载对应的基因文件已有1人参与

想下载线粒体基因组数据库对应的所有基因,已经批量下载了基因组数据,但是基因只知道单个的怎么下,真心求教!
单个下载基因是这样的:
比如这个基因组:http://www.ncbi.nlm.nih.gov/nuccore/NC_001224.1
只需要选择send==>coding sequences==>fasta就可以了。
但是这样的基因组有点多,几百个,请问怎么批量下载呢?
回复此楼
Dripping Concentrated!!energetic and active!
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

白水游鱼

金虫 (初入文坛)

【答案】应助回帖

简单粗暴的方法:
用你的例子下载了一个文件, 观察到下载链接是:
http://www.ncbi.nlm.nih.gov/svie ... 6&maxplex=3
这个下载链接其实是有格式的,比如说val=49643087这个参数就是gene的GI number,所以所以想下载哪个gene就用哪个gene的GI number在此处替换。很简单的脚本就能完成。

官方一点的NCBI大批量处理数据的工具Entrez Programming Utilities
给个链接:http://www.ncbi.nlm.nih.gov/books/NBK25500/
自己慢慢研究吧

» 本帖已获得的红花(最新10朵)

2楼2016-01-03 22:32:10
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hxswdl

至尊木虫 (文坛精英)

Tortoise

文献杰出贡献

送红花一朵
引用回帖:
2楼: Originally posted by 白水游鱼 at 2016-01-03 22:32:10
简单粗暴的方法:
用你的例子下载了一个文件, 观察到下载链接是:
http://www.ncbi.nlm.nih.gov/sviewer/viewer.cgi?tool=portal&sendto=on&log$=seqview&db=nuccore&dopt=fasta_cds_na&sort ...

是只要cds区域的,批量下基因会下,但是只需要蛋白编码区域。
Dripping Concentrated!!energetic and active!
3楼2016-01-03 22:47:14
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 hxswdl 的主题更新
信息提示
请填处理意见