现在有一大堆的蛋白质组学数据,需要搜库,就发现现在的NCBI数据库和我去年搜的有很大不同。原来我做的物种蛋白序列就3000多条,现在主要是加了几万条PREDICTED蛋白序列,我看了下解释,this record is predicted by automated computational analysis. This record is derived from a genomic sequence。我的数据搜完库以后,很多都是和这个PREDICTED蛋白序列对上的。
现在主要是考虑到写文章的时候,能不能直接写我搜的库下载于NCBI,不过里面的序列大多是根据基因组序列预测的?
由于还没有看到搜库是得到这么多PREDICTED蛋白序列的文献(如果你看到了相关文献,麻烦告诉我一下),有点心虚