24小时热门版块排行榜    

查看: 8639  |  回复: 68

mike880102

金虫 (著名写手)


[交流] 一篇文章中的统计问题——主成分分析!

在东北林业大学学报中的一篇文章,作者采用了主成分分析。(见下图)
涉及降雨量、降雨强度、风速、气温、空气湿度5个因素。
在结果分析中,作者将主成分分析的结果因素依然确定为降雨量、降雨强度、风速、气温、空气湿度这5个因素,个人认为是有错误的!
主成分分析得到的应该是新变量,坐标是经过变换过的。应该根据专业知识给予新变量以新的定义,不能直接套用原成分。
用SPSS分析的结果也应该直接显示为factor1-5,不知道作者是如何将这1—-5factor 与原来的因素对应起来的!
个人拙见,请大家探讨交流。











如下是我对作者数据进行的主成分分析结果:

作者是如何将Component1—5与原因是一一对应的???

[ Last edited by mike880102 on 2012-1-6 at 21:29 ]
回复此楼

» 收录本帖的淘帖专辑推荐

文献阅读,科研心得 科研 ynyaf的专辑 资料

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

» 抢金币啦!回帖就可以得到:

查看全部散金贴

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
回帖支持 ( 显示支持度最高的前 50 名 )
引用回帖:
27楼: Originally posted by ly197408 at 2012-01-06 20:26:47:
个人感觉楼主理解错误,我刚才也查了些资料,论文中说法不完全,但是正确的。依然可以根据原始变量说明问题。主成分分析,是将多个变量降为一元进行分析,最后每个主成分可以包括几个原始因素。不是产生新的变量 ...

如果单纯说PCA分析,楼主说得没有错。其实如果要研究这些因素对截留量的影响,单做主成分PCA分析是不够的,还要对自变量(PC1以及PC2)和因变量(截留量)做多元回归模拟,然后看哪个自变量解释的表型最大,最大的那个就是主要影响因素,PCA只是对自变量的简化和提取!
29楼2012-01-06 20:41:56
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


引用回帖:
27楼: Originally posted by ly197408 at 2012-01-06 20:26:47:
个人感觉楼主理解错误,我刚才也查了些资料,论文中说法不完全,但是正确的。依然可以根据原始变量说明问题。主成分分析,是将多个变量降为一元进行分析,最后每个主成分可以包括几个原始因素。不是产生新的变量 ...

我把主成分说出新的因素确实是有错误的!
我对作者的数据进行了主成分分析(结果见15楼),数据上与作者是一致的,但是作者的表4中,是如何将得到的5个主成分与原来的5个因素一一对应起来的?这是问题的关键!我认为他在这里错了!
由主成分分析结果的Component Matrix可知:
Component1=0.791降雨量+0.913降雨强度-0.050风速+0.742气温+0.027空气湿度……
显然Component1是与降雨量、降雨强度、气温关系密切的一个主成分
而在作者的表述中,直接用降雨量代替的Component1……
并以此用降雨强度、气温、空气湿度、风速代替第二、第三……主成分

另外,“依然可以根据原始变量说明问题。” 求相关资料学习……
34楼2012-01-06 21:25:22
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通回帖

mike880102(金币+1):谢谢参与
有原文题目吗?我下下来看看!
2楼2012-01-06 16:08:14
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
有原文题目吗?我下下来看看!
3楼2012-01-06 16:08:21
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102(金币+1):谢谢参与
虽然没有见过原文,但是文章说法是正确的。主成份分析,计算过程中是将数据进行转换,利用特征根大小来比较各个因素的贡献大小。也有根据贡献率来说明各个因素哪些因素起主要作用。并不是产生新的变量。
无论计算过程如何变化,最终结果都是用原因素进行解释的。
4楼2012-01-06 16:45:23
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102(金币+1):谢谢参与
应该是行的。计算过程中是将数据进行转换,利用特征根大小来比较各个因素的贡献大小。也有根据贡献率来说明各个因素哪些因素起主要作用
6楼2012-01-06 16:53:29
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


引用回帖:
3楼: Originally posted by wanhscn at 2012-01-06 16:08:21:
有原文题目吗?我下下来看看!

重庆四面山暖性针叶林林冠截留及其影响因素
7楼2012-01-06 16:53:39
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


张文彤“SPSS统计分析高级教程_2004”中的一个案例






[ Last edited by mike880102 on 2012-1-6 at 17:02 ]

» 本帖附件资源列表

  • 欢迎监督和反馈:小木虫仅提供交流平台,不对该内容负责。
    本内容由用户自主发布,如果其内容涉及到知识产权问题,其责任在于用户本人,如对版权有异议,请联系邮箱:xiaomuchong@tal.com
  • 附件 1 : factor1.sav
  • 2012-01-06 17:02:21, 3.25 K
  • 附件 2 : factor1.xls
  • 2012-01-06 17:02:52, 5.25 K
9楼2012-01-06 17:01:24
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


引用回帖:
4楼: Originally posted by ly197408 at 2012-01-06 16:45:23:
虽然没有见过原文,但是文章说法是正确的。主成份分析,计算过程中是将数据进行转换,利用特征根大小来比较各个因素的贡献大小。也有根据贡献率来说明各个因素哪些因素起主要作用。并不是产生新的变量。
无论计算 ...

我又查了一下胡良平“运用三型理论进行多元统计分析”和张文彤“SPSS统计分析高级教程”两本书。主成分分析得到的结果必然是新的变量。
我在8楼对一个主成分分析的案例用SPSS进行了简单的分析,得到的结果,产生8个新的变量,这8个变量是不等同于原来的8个变量的,但是可以用原来的变量表示出来:
如:新变量Z1=0.884X1+0.606X2+0.911X3+0.465X4+0.486X5-0.510X6-0.621X7+0.822X8
说明新变量与X1、X2、X3、X8关系密切,可以看作是反应该四者的综合指标,并通过专业知识给予新的定义。





13楼2012-01-06 17:35:30
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


引用回帖:
3楼: Originally posted by wanhscn at 2012-01-06 16:08:21:
有原文题目吗?我下下来看看!

原文

» 本帖附件资源列表

  • 欢迎监督和反馈:小木虫仅提供交流平台,不对该内容负责。
    本内容由用户自主发布,如果其内容涉及到知识产权问题,其责任在于用户本人,如对版权有异议,请联系邮箱:xiaomuchong@tal.com
  • 附件 1 : 重庆四面山暖性针叶林林冠截留及其影响因素1.pdf
  • 2012-01-06 17:36:15, 382.3 K
14楼2012-01-06 17:36:17
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


引用回帖:
6楼: Originally posted by hls85915 at 2012-01-06 16:53:29:
应该是行的。计算过程中是将数据进行转换,利用特征根大小来比较各个因素的贡献大小。也有根据贡献率来说明各个因素哪些因素起主要作用

是用特征根和贡献率来表达原有成分。且特征根>1时,认为经统计分析得到的新的主成分比原成分表达了更多的信息,方采纳;小于1的则不采纳。但一定是用新产生的主成分来说明问题,是不是单纯的用原有的因素,并且新产生的成分与原因素也无法一一对应,但是每一个新成分都可以用所有原因素唯一表达出来。
12楼对该问题进行了说明,望探讨
15楼2012-01-06 17:41:40
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


对原文数据用SPSS处理结果如下,Total Variance Explained中,component1——5怎么就能分别代表降雨量、降雨强度、气温、空气湿度、风速?
事实上,由Component Matrix可知:
Component1=0.791降雨量+0.913降雨强度-0.050风速+0.742气温+0.027空气湿度
Component2=0.127降雨量+0.226降雨强度+0.834风速-0.329气温-0.755空气湿度
也就是说,第一主成分Component1 是与降雨量、降雨强度、气温三种关系密切的一个综合因素(系数较大);第二主成分Component2 是与风速和空气湿度关系密切的一个综合因素。用这两个新的成分可以表达原来5个变量的全部信息的69%+,其实不算大,所以即便没错误,该文章用主成分分析有意义也不大


» 本帖附件资源列表

  • 欢迎监督和反馈:小木虫仅提供交流平台,不对该内容负责。
    本内容由用户自主发布,如果其内容涉及到知识产权问题,其责任在于用户本人,如对版权有异议,请联系邮箱:xiaomuchong@tal.com
  • 附件 1 : data.xlsx
  • 2012-01-06 18:04:57, 10.04 K
16楼2012-01-06 18:14:04
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102(金币+1):谢谢参与
楼主说的是有道理的。
但该文中的所谓“主成分分析”,可能是一种不规范的说法。或者就是对“主成分分析PCA”的方法理解有误。
17楼2012-01-06 18:38:58
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

N222

铁杆木虫 (知名作家)



mike880102(金币+1):谢谢参与
恭喜楼主
21楼2012-01-06 19:15:36
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


引用回帖:
17楼: Originally posted by nono2009 at 2012-01-06 18:38:58:
楼主说的是有道理的。
但该文中的所谓“主成分分析”,可能是一种不规范的说法。或者就是对“主成分分析PCA”的方法理解有误。

主管区长能来,真是让小帖“蓬荜生辉”
我在15楼对他文章中给的数据用主成分分析算了一下,数据上和他得到的结果是一样的。所以他应该就是用的主成分分析做出来的……
主成分分析PCA是什么?
22楼2012-01-06 19:44:33
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


引用回帖:
17楼: Originally posted by nono2009 at 2012-01-06 18:38:58:
楼主说的是有道理的。
但该文中的所谓“主成分分析”,可能是一种不规范的说法。或者就是对“主成分分析PCA”的方法理解有误。

懂了……英语不好的人伤不起啊~~
23楼2012-01-06 19:48:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
老兄,你讲得没错!不过作者的解释也没错,降雨(主要包括降雨量和降雨强度)是第一主成分解释40.4%,其次风速相关因素(主要是风速)是第二主成分解释28.8%。
以上纯属个人理解,有不合理之处在所难免!



[ Last edited by wanhscn on 2012-1-6 at 20:35 ]
25楼2012-01-06 20:10:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
引用回帖:
13楼: Originally posted by mike880102 at 2012-01-06 17:35:30:
我又查了一下胡良平“运用三型理论进行多元统计分析”和张文彤“SPSS统计分析高级教程”两本书。主成分分析得到的结果必然是新的变量。
我在8楼对一个主成分分析的案例用SPSS进行了简单的分析,得到的结果,产生 ...

个人感觉楼主理解错误,我刚才也查了些资料,论文中说法不完全,但是正确的。依然可以根据原始变量说明问题。主成分分析,是将多个变量降为一元进行分析,最后每个主成分可以包括几个原始因素。不是产生新的变量。一般大家在论文中很少出现,第一主成分包括什么因素,第二主成分包括什么因素。最终结果依然是原始变量中若干变量的变化可以代表整个结果,也就是其贡献率已经达到理想要求。
楼主所说的新的变量,应该是主成分而已。在你说的论文中,表述是没有什么问题的。
27楼2012-01-06 20:26:47
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
其实如果要研究这些因素对截留量的影响,单做主成分PCA分析是不够的,还要对自变量(PC1以及PC2)和因变量(截留量)做多元回归模拟,然后看哪个自变量解释的表型最大,最大的那个就是主要影响因素,PCA只是对自变量的简化和提取!
28楼2012-01-06 20:40:06
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


引用回帖:
25楼: Originally posted by wanhscn at 2012-01-06 20:10:53:
老兄,你讲得没错!不过作者的解释也没错,降雨(主要包括降雨量和降雨强度)是第一主成分解释40.4%,其次风速相关因素(主要是风速)是第二主成分解释28.8%。
以上纯属个人理解,有不合理之处在所难免!
[eimg ...

你的解释我是赞同的:降雨是第一主成分,风速相关因素是第二主成分。
但是作者的解释我仍然不认同:我对作者的数据做了主成分分析(15楼),结果数据上与作者一致
但作者的表4中,将原有的5个因素与主成分分析得到的5个主成分依依对应起来了,第一主成分为降雨量、第二主成分为降雨强度……
这些他是如何对应起来的?
33楼2012-01-06 21:12:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
引用回帖:
33楼: Originally posted by mike880102 at 2012-01-06 21:12:50:
你的解释我是赞同的:降雨是第一主成分,风速相关因素是第二主成分。
但是作者的解释我仍然不认同:我对作者的数据做了主成分分析(15楼),结果数据上与作者一致
但作者的表4中,将原有的5个因素与主成分分析 ...

你是对的,看SCI上的文章PCA是怎么分析的,给你一个Plant cell (IF=9) 的文章,主要看supplemental info,你就知道你是对的了!

» 本帖附件资源列表

35楼2012-01-06 21:40:48
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102(金币+1):谢谢参与
楼主分析的很对
36楼2012-01-06 21:48:05
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

leimiao_hit

木虫之王 (文学泰斗)



mike880102(金币+1):谢谢参与
主成分分析
37楼2012-01-06 22:15:35
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


引用回帖:
35楼: Originally posted by wanhscn at 2012-01-06 21:40:48:
你是对的,看SCI上的文章PCA是怎么分析的,给你一个Plant cell (IF=9) 的文章,主要看supplemental info,你就知道你是对的了!

非常非常感谢……
本人小硕,平时英文文章看的少,更少涉及到统计的~~谢谢提供文献!
38楼2012-01-06 22:27:40
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Rasree02

铜虫 (初入文坛)



mike880102(金币+1):谢谢参与
你无疑是对的。SPSS分析得到两个主成分。我看了你说的那篇文章,基本肯定作者不懂什么是PCA。。
39楼2012-01-07 14:19:31
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
引用回帖:
28楼: Originally posted by wanhscn at 2012-01-06 20:40:06:
其实如果要研究这些因素对截留量的影响,单做主成分PCA分析是不够的,还要对自变量(PC1以及PC2)和因变量(截留量)做多元回归模拟,然后看哪个自变量解释的表型最大,最大的那个就是主要影响因素,PCA只是对自变 ...

我同意这种说法,应该先有相关分析,最好是有多元回归方程,找出最大的影响因素,然后结合主成分分析,主成分分析,本来就是对自变量的降维和简单化,主要是找出自变量的贡献。目前很少有人使用主成分分析,因为这种分析不太严谨。主成分分析是不考虑各个因素的之间的相互影响,是把各个因素作为独立个体进行分析的。如果文章中加上多元相关分析,然后结合主成分分析,原始自变量对应主成分是可以解释了。
我个人认为,对于这种分析,建议使用相关分析和间接通径分析,可以找出主要影响因子,以及其贡献的多少。
40楼2012-01-07 23:24:36
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
引用回帖:
40楼: Originally posted by ly197408 at 2012-01-07 23:24:36:
我同意这种说法,应该先有相关分析,最好是有多元回归方程,找出最大的影响因素,然后结合主成分分析,主成分分析,本来就是对自变量的降维和简单化,主要是找出自变量的贡献。目前很少有人使用主成分分析,因为 ...

我也很同意你的这种说法!
41楼2012-01-07 23:36:34
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

几天

铜虫 (小有名气)



mike880102(金币+1):谢谢参与
那个影响因子有多少?国内期刊不是所有的写的都有道理啊
42楼2012-01-08 08:56:14
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mike880102

金虫 (著名写手)


引用回帖:
42楼: Originally posted by 几天 at 2012-01-08 08:56:14:
那个影响因子有多少?国内期刊不是所有的写的都有道理啊

东北林业大学学报,核心,不是一级。影响因子就不清楚了……
这个大学来讲也还可以吧
43楼2012-01-08 09:24:09
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

几天

铜虫 (小有名气)


引用回帖:
43楼: Originally posted by mike880102 at 2012-01-08 09:24:09:
东北林业大学学报,核心,不是一级。影响因子就不清楚了……
这个大学来讲也还可以吧

不到0.5,不是很好的期刊吧。
44楼2012-01-08 09:32:45
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
引用回帖:
44楼: Originally posted by 几天 at 2012-01-08 09:32:45:
不到0.5,不是很好的期刊吧。

0.5是国内影响因子?
45楼2012-01-08 13:14:00
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

几天

铜虫 (小有名气)


引用回帖:
45楼: Originally posted by wanhscn at 2012-01-08 13:14:00:
0.5是国内影响因子?

当然了,国外怎么能有这杂志的排名~
46楼2012-01-08 17:41:41
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

liuyj863

银虫 (小有名气)



mike880102(金币+1):谢谢参与
初步一看,感觉是错误的,应该叫做因子1,2...或者叫做主成分1.2.3...,至于气候因子的影响应该是看loading值,也就是荷载值。PCA分析我曾经在文章中用过(FEMS Microbiology Ecology,2009,67:81-92)。
47楼2012-01-09 00:42:13
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangbl

木虫 (小有名气)



mike880102(金币+1):谢谢参与
楼主说的是有道理的
49楼2012-01-10 11:22:43
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
简单回复
2012-01-06 16:48   回复  
mike880102(金币+1):谢谢参与
bestlike8楼
2012-01-06 16:56   回复  
mike880102(金币+1):谢谢参与
2012-01-06 17:02   回复  
mike880102(金币+1):谢谢参与
taoxie197711楼
2012-01-06 17:04   回复  
mike880102(金币+1):谢谢参与
2012-01-06 17:06   回复  
mike880102(金币+1):谢谢参与
王虫木18楼
2012-01-06 18:40   回复  
mike880102(金币+1):谢谢参与
xiejf19楼
2012-01-06 18:43   回复  
mike880102(金币+1):谢谢参与
agentzero20楼
2012-01-06 18:50   回复  
mike880102(金币+1):谢谢参与
cqwhch24楼
2012-01-06 19:59   回复  
mike880102(金币+1):谢谢参与
wg42326楼
2012-01-06 20:17   回复  
mike880102(金币+1):谢谢参与
放大镜30楼
2012-01-06 20:54   回复  
mike880102(金币+1):谢谢参与
2012-01-06 21:01   回复  
mike880102(金币+1):谢谢参与
2012-01-06 21:10   回复  
mike880102(金币+1):谢谢参与
ljason48楼
2012-01-09 17:04   回复  
mike880102(金币+1):谢谢参与
clarktao50楼
2012-01-10 12:08   回复  
mike880102(金币+1):谢谢参与
相关版块跳转 我要订阅楼主 mike880102 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见