24小时热门版块排行榜    

查看: 272  |  回复: 5
当前主题已经存档。
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

philips001

铁虫 (初入文坛)

[交流] 【求助统计分析高手关于主成分分析】【已评分】

主成分分析的问题

我有8个样地,每个样地测定11个指标,X1 X2--------------X11

最终要通过标准化数据,主成分分析,得到样地土壤质量指数的排序

通过主成分分析,发现11个主成分,到达第七个的时候,累计贡献率已经达到了1.000,这说明后边4个主成分已经没有意义了,对土壤质量没有贡献。。。
是不是也说明我的部分指标是相关的?
但是都是独立土壤指标,怎么会相关呢?

参考前人的文献,应该是到达第11个指标才会是1.000

老板叫我找原因。。。

谁能帮我解释一下,或者找下错误在哪里?

[ Last edited by philips001 on 2008-6-20 at 00:17 ]

» 猜你喜欢

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lenienter

至尊木虫 (知名作家)

太高深了,不懂。
4楼2008-06-18 21:24:11
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 6 个回答

dnp

荣誉版主 (知名作家)

小木虫浪子

优秀版主

★ ★ ★ ★ ★ ★
philips001(金币+6,VIP+0):非常感谢
主成分分析的原理是线性的,同时各个变量之间没有相关性,所以如果变量之间有相关性,则主成分分析会有很大误差。

对于楼主的结果,如果变量之间都是独立的,那这个分析就没有问题,可以采用前面七个变量进行建模,这个可以通过训练集和预测集来完成,如果预测得很好,那说明你前面的工作是可以的。

另外,对于文献上的报道,并不一定是真实的,相信自己的结果倒是真的。
实在不行,就用PLS或者PLS-LDA,或者其它的非线性建模方法再进行分析。
What would Jesus do?
2楼2008-06-18 18:03:33
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

philips001

铁虫 (初入文坛)

各指标之间的选取应该是没有相关性的。。
如果前七个主成分累积贡献率达到100%
是不是说明指标有相关性?

==============
对于楼主的结果,如果变量之间都是独立的,那这个分析就没有问题,可以采用前面七个变量进行建模,这个可以通过训练集和预测集来完成,如果预测得很好,那说明你前面的工作是可以的。
===================
LS刚才说会有很大误差,然后又说变量独立就可以采取前七个建模
怎么才能知道预测的好不好呢?》
多谢ls
3楼2008-06-18 19:48:00
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

dnp

荣誉版主 (知名作家)

小木虫浪子

优秀版主

引用回帖:
Originally posted by philips001 at 2008-6-18 19:48:
各指标之间的选取应该是没有相关性的。。
如果前七个主成分累积贡献率达到100%
是不是说明指标有相关性?

==============
对于楼主的结果,如果变量之间都是独立的,那这个分析就没有问题,可以采用前面七个 ...

对于预测,很简单的,在建模中有常用的方法比如去一法,或者k折法等……

对于你的样本,或者对于你的数据,你可以取出其中的一部分来或者取出90%作为训练集,即进行建模训练,然后再拿剩下的10%作为预测集,如果训练出来的参与放到预测集中得到的结果,即算出来的y值和实际没有显著差异的话,就认为这些变量可以代表你的总体样本的特征,那这些变量在以后就可以直接采用了。

对于前面的那个问题,不一定,如果前面七个主成分贡献达到100%,那说明这些变量具有显著的作用,但是不能排除其中有一些其他因素的影响,就像楼主说的,应该没有相关性,但不能排除它们的相关性,还有就是这些变量所建的模确定是线性的么?
数据样本中没有奇异样本存在么?

这些都需要考虑,因为主成分并不是稳健的,如果有奇异点将会有很大的影响……
What would Jesus do?
5楼2008-06-18 22:42:10
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见