24小时热门版块排行榜    

查看: 8695  |  回复: 68
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

mike880102

金虫 (著名写手)


[交流] 一篇文章中的统计问题——主成分分析!

在东北林业大学学报中的一篇文章,作者采用了主成分分析。(见下图)
涉及降雨量、降雨强度、风速、气温、空气湿度5个因素。
在结果分析中,作者将主成分分析的结果因素依然确定为降雨量、降雨强度、风速、气温、空气湿度这5个因素,个人认为是有错误的!
主成分分析得到的应该是新变量,坐标是经过变换过的。应该根据专业知识给予新变量以新的定义,不能直接套用原成分。
用SPSS分析的结果也应该直接显示为factor1-5,不知道作者是如何将这1—-5factor 与原来的因素对应起来的!
个人拙见,请大家探讨交流。











如下是我对作者数据进行的主成分分析结果:

作者是如何将Component1—5与原因是一一对应的???

[ Last edited by mike880102 on 2012-1-6 at 21:29 ]
回复此楼

» 收录本帖的淘帖专辑推荐

文献阅读,科研心得 科研 ynyaf的专辑 资料

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

» 抢金币啦!回帖就可以得到:

查看全部散金贴

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


引用回帖:
3楼: Originally posted by wanhscn at 2012-01-06 16:08:21:
有原文题目吗?我下下来看看!

重庆四面山暖性针叶林林冠截留及其影响因素
7楼2012-01-06 16:53:39
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


张文彤“SPSS统计分析高级教程_2004”中的一个案例






[ Last edited by mike880102 on 2012-1-6 at 17:02 ]

» 本帖附件资源列表

  • 欢迎监督和反馈:小木虫仅提供交流平台,不对该内容负责。
    本内容由用户自主发布,如果其内容涉及到知识产权问题,其责任在于用户本人,如对版权有异议,请联系邮箱:xiaomuchong@tal.com
  • 附件 1 : factor1.sav
  • 2012-01-06 17:02:21, 3.25 K
  • 附件 2 : factor1.xls
  • 2012-01-06 17:02:52, 5.25 K
9楼2012-01-06 17:01:24
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


引用回帖:
4楼: Originally posted by ly197408 at 2012-01-06 16:45:23:
虽然没有见过原文,但是文章说法是正确的。主成份分析,计算过程中是将数据进行转换,利用特征根大小来比较各个因素的贡献大小。也有根据贡献率来说明各个因素哪些因素起主要作用。并不是产生新的变量。
无论计算 ...

我又查了一下胡良平“运用三型理论进行多元统计分析”和张文彤“SPSS统计分析高级教程”两本书。主成分分析得到的结果必然是新的变量。
我在8楼对一个主成分分析的案例用SPSS进行了简单的分析,得到的结果,产生8个新的变量,这8个变量是不等同于原来的8个变量的,但是可以用原来的变量表示出来:
如:新变量Z1=0.884X1+0.606X2+0.911X3+0.465X4+0.486X5-0.510X6-0.621X7+0.822X8
说明新变量与X1、X2、X3、X8关系密切,可以看作是反应该四者的综合指标,并通过专业知识给予新的定义。





13楼2012-01-06 17:35:30
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


引用回帖:
3楼: Originally posted by wanhscn at 2012-01-06 16:08:21:
有原文题目吗?我下下来看看!

原文

» 本帖附件资源列表

  • 欢迎监督和反馈:小木虫仅提供交流平台,不对该内容负责。
    本内容由用户自主发布,如果其内容涉及到知识产权问题,其责任在于用户本人,如对版权有异议,请联系邮箱:xiaomuchong@tal.com
  • 附件 1 : 重庆四面山暖性针叶林林冠截留及其影响因素1.pdf
  • 2012-01-06 17:36:15, 382.3 K
14楼2012-01-06 17:36:17
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


引用回帖:
6楼: Originally posted by hls85915 at 2012-01-06 16:53:29:
应该是行的。计算过程中是将数据进行转换,利用特征根大小来比较各个因素的贡献大小。也有根据贡献率来说明各个因素哪些因素起主要作用

是用特征根和贡献率来表达原有成分。且特征根>1时,认为经统计分析得到的新的主成分比原成分表达了更多的信息,方采纳;小于1的则不采纳。但一定是用新产生的主成分来说明问题,是不是单纯的用原有的因素,并且新产生的成分与原因素也无法一一对应,但是每一个新成分都可以用所有原因素唯一表达出来。
12楼对该问题进行了说明,望探讨
15楼2012-01-06 17:41:40
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


对原文数据用SPSS处理结果如下,Total Variance Explained中,component1——5怎么就能分别代表降雨量、降雨强度、气温、空气湿度、风速?
事实上,由Component Matrix可知:
Component1=0.791降雨量+0.913降雨强度-0.050风速+0.742气温+0.027空气湿度
Component2=0.127降雨量+0.226降雨强度+0.834风速-0.329气温-0.755空气湿度
也就是说,第一主成分Component1 是与降雨量、降雨强度、气温三种关系密切的一个综合因素(系数较大);第二主成分Component2 是与风速和空气湿度关系密切的一个综合因素。用这两个新的成分可以表达原来5个变量的全部信息的69%+,其实不算大,所以即便没错误,该文章用主成分分析有意义也不大


» 本帖附件资源列表

  • 欢迎监督和反馈:小木虫仅提供交流平台,不对该内容负责。
    本内容由用户自主发布,如果其内容涉及到知识产权问题,其责任在于用户本人,如对版权有异议,请联系邮箱:xiaomuchong@tal.com
  • 附件 1 : data.xlsx
  • 2012-01-06 18:04:57, 10.04 K
16楼2012-01-06 18:14:04
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


引用回帖:
17楼: Originally posted by nono2009 at 2012-01-06 18:38:58:
楼主说的是有道理的。
但该文中的所谓“主成分分析”,可能是一种不规范的说法。或者就是对“主成分分析PCA”的方法理解有误。

主管区长能来,真是让小帖“蓬荜生辉”
我在15楼对他文章中给的数据用主成分分析算了一下,数据上和他得到的结果是一样的。所以他应该就是用的主成分分析做出来的……
主成分分析PCA是什么?
22楼2012-01-06 19:44:33
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


引用回帖:
17楼: Originally posted by nono2009 at 2012-01-06 18:38:58:
楼主说的是有道理的。
但该文中的所谓“主成分分析”,可能是一种不规范的说法。或者就是对“主成分分析PCA”的方法理解有误。

懂了……英语不好的人伤不起啊~~
23楼2012-01-06 19:48:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


引用回帖:
25楼: Originally posted by wanhscn at 2012-01-06 20:10:53:
老兄,你讲得没错!不过作者的解释也没错,降雨(主要包括降雨量和降雨强度)是第一主成分解释40.4%,其次风速相关因素(主要是风速)是第二主成分解释28.8%。
以上纯属个人理解,有不合理之处在所难免!
[eimg ...

你的解释我是赞同的:降雨是第一主成分,风速相关因素是第二主成分。
但是作者的解释我仍然不认同:我对作者的数据做了主成分分析(15楼),结果数据上与作者一致
但作者的表4中,将原有的5个因素与主成分分析得到的5个主成分依依对应起来了,第一主成分为降雨量、第二主成分为降雨强度……
这些他是如何对应起来的?
33楼2012-01-06 21:12:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


引用回帖:
27楼: Originally posted by ly197408 at 2012-01-06 20:26:47:
个人感觉楼主理解错误,我刚才也查了些资料,论文中说法不完全,但是正确的。依然可以根据原始变量说明问题。主成分分析,是将多个变量降为一元进行分析,最后每个主成分可以包括几个原始因素。不是产生新的变量 ...

我把主成分说出新的因素确实是有错误的!
我对作者的数据进行了主成分分析(结果见15楼),数据上与作者是一致的,但是作者的表4中,是如何将得到的5个主成分与原来的5个因素一一对应起来的?这是问题的关键!我认为他在这里错了!
由主成分分析结果的Component Matrix可知:
Component1=0.791降雨量+0.913降雨强度-0.050风速+0.742气温+0.027空气湿度……
显然Component1是与降雨量、降雨强度、气温关系密切的一个主成分
而在作者的表述中,直接用降雨量代替的Component1……
并以此用降雨强度、气温、空气湿度、风速代替第二、第三……主成分

另外,“依然可以根据原始变量说明问题。” 求相关资料学习……
34楼2012-01-06 21:25:22
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


引用回帖:
35楼: Originally posted by wanhscn at 2012-01-06 21:40:48:
你是对的,看SCI上的文章PCA是怎么分析的,给你一个Plant cell (IF=9) 的文章,主要看supplemental info,你就知道你是对的了!

非常非常感谢……
本人小硕,平时英文文章看的少,更少涉及到统计的~~谢谢提供文献!
38楼2012-01-06 22:27:40
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


引用回帖:
42楼: Originally posted by 几天 at 2012-01-08 08:56:14:
那个影响因子有多少?国内期刊不是所有的写的都有道理啊

东北林业大学学报,核心,不是一级。影响因子就不清楚了……
这个大学来讲也还可以吧
43楼2012-01-08 09:24:09
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


引用回帖:
57楼: Originally posted by tanglang109 at 2012-03-14 09:10:05:
是不是还要看个球形检验的啊    KMO值

这个一点都不懂哎~~给简单介绍下~~
58楼2012-03-14 09:49:54
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 mike880102 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见