24小时热门版块排行榜    

查看: 2290  |  回复: 4
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

大爷给跪了

新虫 (小有名气)

[求助] 测转录组遇到的一个问题 求高手解答 已有1人参与

最近在华大测了个转录组,基本所有东西都是分析好的

在看数据的时候遇到一个问题:
没有参考基因组,得到几万个unigene。现在用Nr数据库注释到的基因比如是n个,但是同时用Nr数据库预测CDS的时候,居然<n,这种情况怎么理解
我想的是基因注释做blast,unigene和NR库里的数据比对,哪怕不在CDS区也算是注释上?可能在非编码区比对上了也就算注释上了。

还有  我得到的cds序列不是从起始密码子开始,是不是转录组CDS预测不一定得到完整的cds

因为涉及到数据注释的一些问题了,也不太了解,求高手解答
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

大爷给跪了

新虫 (小有名气)

引用回帖:
2楼: Originally posted by growlywolf at 2014-05-06 11:44:14
第一,ncbi nr数据库不是万能的,很多基因,尤其是近年来高通量测序得到的基因并不包含在该数据库中。
第二,unigene是用转录组测序的结果直接拼接然后去冗余得到的,在进行注释的时候,不仅仅是参考nr数据库。在数 ...

十分感谢growlywolf,让我知道我不是单机版
你说的基本理解了。那你的意思是不是  那些unknown protein  可能就是得不到CDS的?
3楼2014-05-06 16:57:09
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 大爷给跪了 的主题更新
信息提示
请填处理意见