24小时热门版块排行榜    

CyRhmU.jpeg
查看: 920  |  回复: 9

微笑生活

铜虫 (小有名气)

[求助] 有做过基因预测的朋友吗

用各种软件把基因预测出来后,进一步注释功能,可是有很多杂乱的序列需要筛除,这个要怎么做呢,因为预测出来的基因太多了,筛过一遍还是留下很多
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wizardfan

至尊木虫 (著名写手)

优秀版主

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
微笑生活: 金币+10, 有帮助 2012-11-05 21:35:12
不同软件都有一定的正确率,像这种情况下,一般使用consensus结果。
2楼2012-10-31 08:12:04
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

robertorun

金虫 (正式写手)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★
微笑生活: 金币+10 2012-11-05 21:35:35
evm或glean等整合

[ 发自手机版 http://muchong.com/3g ]
3楼2012-11-03 12:31:06
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

微笑生活

铜虫 (小有名气)

引用回帖:
2楼: Originally posted by wizardfan at 2012-10-31 08:12:04
不同软件都有一定的正确率,像这种情况下,一般使用consensus结果。

谢谢,但是可能我表达得不清楚,我想问的是怎样筛除预测出来的基因中那些假阳性的序列
4楼2012-11-05 21:34:54
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

微笑生活

铜虫 (小有名气)

引用回帖:
3楼: Originally posted by robertorun at 2012-11-03 12:31:06
evm或glean等整合

谢谢,但是可能我表达得不清楚,我想问的是怎样筛除预测出来的基因中那些假阳性的序列
5楼2012-11-05 21:35:29
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wizardfan

至尊木虫 (著名写手)

优秀版主

【答案】应助回帖

引用回帖:
4楼: Originally posted by 微笑生活 at 2012-11-05 21:34:54
谢谢,但是可能我表达得不清楚,我想问的是怎样筛除预测出来的基因中那些假阳性的序列...

consensus result means all tools you use agree with that result, therefore the consensus result should be the most reliable result. Then remove the rest.
For example, you use 5 tools:
A predict a b c
B predict b c
C predict a b d
D predict b c d
E predict b e
In this case result b will be kept and all other result a, c, d, e will be removed.
6楼2012-11-05 22:37:07
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

微笑生活

铜虫 (小有名气)

引用回帖:
6楼: Originally posted by wizardfan at 2012-11-05 22:37:07
consensus result means all tools you use agree with that result, therefore the consensus result should be the most reliable result. Then remove the rest.
For example, you use 5 tools:
A predict a ...

嗯,谢谢,我明白你的意思,能不能请教点具体的,
比如说我用Pfam来注释基因,用什么标准来确定哪些基因该保留,那些该舍弃呢,是e值,还是只要能注释出来的都算呢
7楼2012-11-06 09:08:21
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wizardfan

至尊木虫 (著名写手)

优秀版主

【答案】应助回帖

引用回帖:
7楼: Originally posted by 微笑生活 at 2012-11-06 09:08:21
嗯,谢谢,我明白你的意思,能不能请教点具体的,
比如说我用Pfam来注释基因,用什么标准来确定哪些基因该保留,那些该舍弃呢,是e值,还是只要能注释出来的都算呢...

if you have some measurement like e-value or p-value which estimate the significance of the prediction, using them is a clever way.
Note: there is no comparison between e- or p- values from different tools
8楼2012-11-06 20:28:15
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xj8442cn

铜虫 (初入文坛)

【答案】应助回帖

有整合软件如Maker PASA等,但是这些软件也有问题,比如MAKER会删除很多实际存在的基因。
9楼2012-11-14 00:10:09
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

微笑生活

铜虫 (小有名气)

引用回帖:
9楼: Originally posted by xj8442cn at 2012-11-14 00:10:09
有整合软件如Maker PASA等,但是这些软件也有问题,比如MAKER会删除很多实际存在的基因。

看来你有经验啊
对于partial sequences,不知道该怎么处理呢
我看到有文献对于短于80%或者多少的序列进行删除,
可那样也会删掉一些本来存在的基因
10楼2012-11-14 17:40:37
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 微笑生活 的主题更新
信息提示
请填处理意见