24小时热门版块排行榜    

查看: 1610  |  回复: 9

西岩

金虫 (小有名气)

[求助] Mascot搜库结果,软件自动筛选了还是要根据protein scores再作筛选?

Mascot搜库后导出的csv文件,其中列出的鉴定到的蛋白还需要再用鉴定结果给出的protein scores筛选一下吧?得分在给出的protein score以上的,才是p-value小于0.05的?

可是为什么format as 下面那行已经标注Significance threshold<0.05,难道是输出的结果软件已经自动按p-value筛选过了?

1.png
回复此楼
长路漫浩浩
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wizardfan

至尊木虫 (著名写手)

优秀版主

【答案】应助回帖

★ ★ ★ ★ ★
感谢参与,应助指数 +1
西岩: 金币+5, ★★★★★最佳答案, Thank you so much! 2013-01-30 20:58:35
In my opinion, p-value having the statistical significance is far more important than mascot score (the value you select).
According to http://www.matrixscience.com/help/msms_summaries_help.html
Format Controls
These controls enable the report format to be modified. After making changes, press the "Format As" button to reload the report using the new settings.
    Significance threshold The default significance threshold is p < 0.05. You can change this to any value in the range 0.99 to 1E-18.

the p value is set to be 0.05 by default and the listed proteins have that level of significance. You can play with it by setting to a big number e.g. 0.5, reformatting the result and checking whether new protein turns up in the list and what is the p-value for them.
2楼2013-01-30 17:27:40
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

西岩

金虫 (小有名气)

我的理解是下面这样的,再帮忙看一下对不对吧,多谢  

是不是说,在mascot软件里,protein score和p-value是两种不同的评价方式

注意到输出的csv文件中的蛋白数目比搜库后网页显示的蛋白数目少,是不是就是因为已经进行了p-value的筛选?

对于选定significance threshold后的输出结果,其中列出的蛋白都是满足选定的p-value条件的?
长路漫浩浩
3楼2013-01-30 21:42:42
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

西岩

金虫 (小有名气)

引用回帖:
2楼: Originally posted by wizardfan at 2013-01-30 17:27:40
In my opinion, p-value having the statistical significance is far more important than mascot score (the value you select).
According to http://www.matrixscience.com/help/msms_summaries_help.html
F ...

我的理解是下面这样的,再帮忙看一下对不对吧,多谢啦!

是不是说,在mascot软件里,protein score和p-value是两种不同的评价方式

注意到输出的csv文件中的蛋白数目比搜库后网页显示的蛋白数目少,是不是就是因为已经进行了p-value的筛选?

对于选定significance threshold后的输出结果,其中列出的蛋白都是满足选定的p-value条件的?
长路漫浩浩
4楼2013-01-30 21:43:38
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wizardfan

至尊木虫 (著名写手)

优秀版主

I think so.
The reason I say that is because I use mascot xml file format all the time, not the csv.
5楼2013-01-30 22:56:43
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

西岩

金虫 (小有名气)

引用回帖:
5楼: Originally posted by wizardfan at 2013-01-30 22:56:43
I think so.
The reason I say that is because I use mascot xml file format all the time, not the csv.

Thanks a lot!
长路漫浩浩
6楼2013-01-30 23:35:19
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

shygza

铜虫 (初入文坛)

引用回帖:
4楼: Originally posted by 西岩 at 2013-01-30 21:43:38
我的理解是下面这样的,再帮忙看一下对不对吧,多谢啦!

是不是说,在mascot软件里,protein score和p-value是两种不同的评价方式

注意到输出的csv文件中的蛋白数目比搜库后网页显示的蛋白数目少,是不是就是 ...

p-value 是根据单个谱图的在整个数据库中评估后给出当前谱图的随机匹配的概率;蛋白得分与所有匹配到该蛋白的肽段的数量及可信度的加权加和。至少有一个肽段的p<0.05,mascot才会报告该蛋白结果可信,但是如果此蛋白有其他高于0.05的肽段匹配的话,mascot也会在结果中报告。
输出结果时你需要选择导出参数,如果require bold red的话,那么大于0.05的结果会被舍弃,否则全部导出。

» 本帖已获得的红花(最新10朵)

7楼2013-01-31 10:09:55
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

西岩

金虫 (小有名气)

送鲜花一朵
引用回帖:
7楼: Originally posted by shygza at 2013-01-31 10:09:55
p-value 是根据单个谱图的在整个数据库中评估后给出当前谱图的随机匹配的概率;蛋白得分与所有匹配到该蛋白的肽段的数量及可信度的加权加和。至少有一个肽段的p<0.05,mascot才会报告该蛋白结果可信,但是如果此 ...

嗯,谢谢啦
长路漫浩浩
8楼2013-01-31 11:03:51
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

87115wh

木虫 (小有名气)

七吃喀嚓

这个问题很简单的,其实0.05的情况属于统计学分析意义上可信最高阈值,在p<0.05的情况下,mascot算法得出个标准得分,你的是75分,如果您的蛋白与数据库中结果的匹配得分在75分以上的,我们认为该结果是阳性可信,即得到了确切的蛋白质鉴定结果,如果在75分一下,认为该结果为阴性。如有需要,请联系qq540421990

» 本帖已获得的红花(最新10朵)

老妹,你说这是为什么呢
9楼2013-02-05 10:45:07
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

西岩

金虫 (小有名气)

送鲜花一朵
引用回帖:
9楼: Originally posted by 87115wh at 2013-02-05 10:45:07
这个问题很简单的,其实0.05的情况属于统计学分析意义上可信最高阈值,在p<0.05的情况下,mascot算法得出个标准得分,你的是75分,如果您的蛋白与数据库中结果的匹配得分在75分以上的,我们认为该结果是阳性可信 ...

谢谢啦
长路漫浩浩
10楼2013-02-07 11:01:01
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 西岩 的主题更新
信息提示
请填处理意见