24小时热门版块排行榜    

CyRhmU.jpeg
查看: 1148  |  回复: 8
当前主题已经存档。

njut007

银虫 (小有名气)

[交流] 【求助】请教遗传算法进行描述符的筛选和回归分析中F值问题

使用遗传算法进行描述符的筛选和回归分析
模型结果中的F大小有什么意义?

[ Last edited by zzgyb on 2008-1-9 at 11:40 ]
回复此楼
化学计算/软件模拟群——49971432 欢迎各位志同道合虫友的加入
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yalefield

金虫 (文坛精英)

老汉一枚

★ ★
spur(金币+2,VIP+0):感谢帮助!:)
F-test (F-检验,叫做F是为了纪念数学家/统计学家Fisher)

A test for the quality of the variance of two populations having normal distributions, based on the ratio of the variance of a sample of observations taken from each. Most often encountered in the "analysis of avariance", where testing whether particular variances are the same also tests for the equality of a set of means.
2楼2008-01-09 19:40:55
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

dnp

荣誉版主 (知名作家)

小木虫浪子

优秀版主

★ ★
spur(金币+2,VIP+0):感谢帮助!!
我来翻译一下2楼的英文吧:
F检验就是利用两个具有正态分布的样本群体内各变量之间是否具有显著性差异的一种检验方法,其是利用一类样本的方差比上此类样本的标准偏差的值与另一类样本按照第一类样本那样计算得到的值相比较(两者相除得到F值),看是否具有显著性(计算得到的F值与表中查得的值比较),如果有,则说明这两个变量具有显著差异,即变化显著。
What would Jesus do?
3楼2008-01-09 21:10:28
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yalefield

金虫 (文坛精英)

老汉一枚

★ ★
spur(金币+2,VIP+0):辛苦了!!
引用回帖:
Originally posted by dnp at 2008-1-9 21:10:
如果有,则说明这两个变量具有显著差异,即变化显著

多谢3楼翻译。

不过,“具有显著差异,即变化显著”的说法,就不专业了。

“具有显著差异”的意思,是在一定的显著性水平(或置信水平)上,两个变量之间的差异,并不完全来自随机因素,而是存在非随机的因素。

如果“不具有显著差异”,那就是说,在一定的显著性水平(或置信水平)上,两个变量之间的差异,完全来自随机因素。

有时,我们期望“具有显著差异”,以表示我们研究的变量之间确实有某些内在联系,而并非仅仅由随即因素导致。例如,我们要比较一个信号确实是由化学体系产生的,而不是仪器、基底或者环境的偶然变化,就期望“具有显著差异”。

有时,我们又期望“不具有显著差异”,以表示我们研究的变量的差异与变化,仅仅由随即因素导致。例如,当比较两台仪器时,我们期望从它们测得的变量“不具有显著差异”。

在表述这类问题是,经常出现的不专业说法是所谓“变化显著”、“变化较显著”、“变化及其显著”。严格地说,只有:
(1)“具有显著差异”

(2)“不具有显著差异”
这两种表述方式


并且,这样的表述也是有条件的,即:
(1)一定的显著性水平(或置信水平)上;
(2)自由度


在某显著性水平(或置信水平)和自由度的条件下,“具有显著差异”的两组变量,换个显著性水平(或置信水平)或自由度,就可能“不具有显著差异”了。

再补充说明一点:

显著性水平(或置信水平)都是人为设定的,常见的0.05(95%)、 0.01(99%)等,纯粹是经验或者习惯而已,没有任何数学或者统计学依据
4楼2008-01-09 23:17:40
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yalefield

金虫 (文坛精英)

老汉一枚

再说一句:

这个F检验,并非仅仅针对遗传算法。
5楼2008-01-09 23:20:21
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

alwens

铁杆木虫 (正式写手)

老木虫

不错,yale兄辛苦了:)
万里夕阳锦背高 翻身犹恨东洋小 太公怎钓?
6楼2008-01-10 10:05:22
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

njut007

银虫 (小有名气)

听说如果几个描述符相关度高的话F值差异显著也不能说明问题,是这样的吗?
化学计算/软件模拟群——49971432 欢迎各位志同道合虫友的加入
7楼2008-01-10 19:04:54
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

njut007

银虫 (小有名气)

F值如果明显小于显著性水平,说明回归的方程不是偶然联系的,而是必然的关系
这种说法对于存在相关性高的描述符的模型还适应吗??
因为遗传算法是允许相关性高的描述符存在的
化学计算/软件模拟群——49971432 欢迎各位志同道合虫友的加入
8楼2008-01-10 19:08:19
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

dnp

荣誉版主 (知名作家)

小木虫浪子

优秀版主

呵呵,yalefield,受教了……
按照yalefield的解释,的确是这样的,在一定的置信度上才能判断两个变量或者两个体系之间是否存在这个差异,这个也是进行F值检验的时候已经判断了的,因为我们查表的时候必须得在一定的置信度下与表中的值进行比较,否者无法比较!
对于两个描述符之间的显著性差异,这个不好判断。在遗传算法中,有很多个描述符,而各个描述符之间存在相互关系是无法用F进行判断的,因为F值的检验是单变量检验,如果对于一个具有多变量的检验,F检验或者T检验往往会给人以误导,所以对于多变量体系,不要迷信与F检验……
这个也是个问题,如果对于多变量体系,我们应该怎么判断他们之间的差异?
我现在也搞不大懂,如果yalefield再回来,也请回答我这个问题,谢谢。
What would Jesus do?
9楼2008-01-10 22:35:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 njut007 的主题更新
普通表情 高级回复(可上传附件)
信息提示
请填处理意见