24小时热门版块排行榜    

查看: 4349  |  回复: 6
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

qaz199018

金虫 (小有名气)

[交流] Genbank登录号前两位英文字母代表什么? 已有1人参与

在Genbank搜索某物种的序列,有些貌似是重复的,提交者、物种、发表的期刊信息什么的都一样,具体序列是否一样没仔细看(看着眼花),但是登录号不一样,有NC_开头的,还有什么JQ,KR开头的。。。那我在统计时能把这两条算作一条吗,能的话应该用哪条呢?NC_开头的吗?谢谢大神!!
回复此楼
~~~
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

stone2239

铁杆木虫 (著名写手)

http://www.ncbi.nlm.nih.gov/books/NBK21091/
最早登陆号是一个字母加5个数字,后来不够用,变成现在的2个字母加6个数字。但是提交的大量序列中有很多冗余序列,为了减小冗余,NCBI就通过利用计算机算法把一致的序列归并在一起,这些人工生成的序列都是用类似NP_xxxxx的格式编码,严格的编码规则是[ANXYZ][CPGMPRTWZS]_([A-Z]{1,4})[0-9]{1,9}。每种的特定含义见链接中的 Table I。也就是说你查到的其实是同一条序列,一个登陆号是最早提交时生成的,NC的是计算机二次注释时生成的。
4楼2015-11-08 23:17:31
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 7 个回答

stone2239

铁杆木虫 (著名写手)


小木虫: 金币+0.5, 给个红包,谢谢回帖
http://www.ncbi.nlm.nih.gov/books/NBK21091/
最早登陆号是一个字母加5个数字,后来不够用,变成现在的2个字母加6个数字。但是提交的大量序列中有很多冗余序列,为了减小冗余,NCBI就通过利用计算机算法把一致的序列归并在一起,这些人工生成的序列都是用类似NP_xxxxx的格式编码,严格的编码规则是[ANXYZ][CPGMPRTWZS]_([A-Z]{1,4})[0-9]{1,9}。每种的特定含义见链接中的 Table I
3楼2015-11-08 23:15:43
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

qaz199018

金虫 (小有名气)

引用回帖:
4楼: Originally posted by stone2239 at 2015-11-08 23:17:31
http://www.ncbi.nlm.nih.gov/books/NBK21091/
最早登陆号是一个字母加5个数字,后来不够用,变成现在的2个字母加6个数字。但是提交的大量序列中有很多冗余序列,为了减小冗余,NCBI就通过利用计算机算法把一致的序 ...

原来如此!谢谢!!那一般写到文章里的话用NC的还是用原始的,这个有没有讲究啊
~~~
5楼2015-11-08 23:27:06
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

stone2239

铁杆木虫 (著名写手)


小木虫: 金币+0.5, 给个红包,谢谢回帖
引用回帖:
5楼: Originally posted by qaz199018 at 2015-11-08 23:27:06
原来如此!谢谢!!那一般写到文章里的话用NC的还是用原始的,这个有没有讲究啊...

都可以,建议用NC的。

发自小木虫Android客户端
6楼2015-11-09 10:30:27
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见