| 查看: 923 | 回复: 8 | |||
| 当前主题已经存档。 | |||
| 【悬赏金币】回答本帖问题,作者zhouwj906将赠送您 10 个金币 | |||
| 当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖 | |||
zhouwj906木虫 (小有名气)
|
[求助]
SAS进行数据分析
|
||
请教高手如下的实验数据应该怎样用SAS进行处理:评价方法 测量对象 A B C D E F 1 * * * * * * 2 * * * * * * 3 * * * * * * 4 * * * * * * 5 * * * * * * 6 * * * * * * 我该怎样1.对评价方法结果相关性进行分析;2.对不同测量对象及6种评价方法结果方差分析:3.怎样得出多重比较分析结果。 |
» 收录本帖的淘帖专辑推荐
统计软件SAS |
» 猜你喜欢
全日制(定向)博士
已经有5人回复
假如你的研究生提出不合理要求
已经有10人回复
萌生出自己或许不适合搞科研的想法,现在跑or等等看?
已经有4人回复
Materials Today Chemistry审稿周期
已经有4人回复
参与限项
已经有3人回复
实验室接单子
已经有4人回复
对氯苯硼酸纯化
已经有3人回复
求助:我三月中下旬出站,青基依托单位怎么办?
已经有12人回复
所感
已经有4人回复
要不要辞职读博?
已经有7人回复
ibelieve110
银虫 (小有名气)
- 博学EPI: 4
- 应助: 0 (幼儿园)
- 金币: 422.6
- 帖子: 280
- 在线: 26.1小时
- 虫号: 154319
- 注册: 2006-01-03
- 专业: 中药资源
|
在阅读以下内容之前,请先阅读第一章"SAS软件基本操作"。 单因素实验设计又称为完全随机化实验设计。该实验设计要求实验条件或实验环境的同质性很高。例如,比较a个作物品种的产量,每一品种设置n个重复,全部实验共有an次。根据完全随机化实验设计的要求,试验田中的an个试验小区的土质、肥力、含水量、小气候、田间管理等条件必须完全一致。至于哪一个品种的哪一次重复安排在哪一个小区,完全是随机的,因此得到了“完全随机化实验设计”这一名称。 例2.9 下面以课本中例8.1的数据为例,给出单因素方差分析的SAS程序。 解:先按以下输入方式建立一个称为a:\2-5data.dat的外部数据文件。 1 64.6 1 65.3 1 64.8 1 66.0 1 65.8 2 64.5 2 65.3 2 64.6 2 63.7 2 63.9 3 67.8 3 66.3 3 67.1 3 66.8 3 68.5 4 71.8 4 72.1 4 70.0 4 69.1 4 71.0 5 69.2 5 68.2 5 69.8 5 68.3 5 67.5 SAS程序如下: options linesize=76; data wheat; infile ‘a:\2-5data.dat’; input strain hight @@; run; proc anova; class strain; model hight=strain; means strain / duncan; means strain / lsd cldiff; run; 在PROC ANOVA过程中的CLASS语句(分类语句)是必须的,而且一定要放在MODEL语句之前。在方差分析中要使用的分类变量(因素),首先要在CLASS语句中说明。分类变量可以是数值型的,也可以是字符型的。MODEL语句用来规定因素对实验结果的效应,一般形式为,因变量=因素效应。本例即为株高=品系效应。 MEANS语句应放在MODEL语句之后,MEANS语句后列出希望得到均值的那些变量。MEANS语句有很多选项,下面列出几个与本教材有关的选项,将选项写在MEANS语句的“/”之后。 DUNCAN: 对MEANS语句列出的所有主效应均值进行DUNCAN检验。 SNK: 对MEANS语句列出的所有主效应均值进行Student-Newman-Keuls检验。 T | LSD: 对MEANS语句列出的所有主效应均值进行两两t检验,它相当于在样本含 量相同时的LSD检验。 ALPHA= 均值间对比检验的显著水平,缺省值是0.05。当用DUNCAN选项时只能取0.01、0.05和0.10,对于其它选项,α可取0.0001到0.9999之间的任何值。 CLDIFF: 在选项T和LSD时,过程将两个均值之差以置信区间的形式输出。 CLM: 在选项T和LSD时,过程把变量的每一水平均值以置信区间的形式输出。 执行上述程序,输出结果见表2-13。 表 2-13: 例2.9方差分析输出结果 The SAS System Analysis of Variance Procedure Class Level Information Class Levels Values STRAIN 5 1 2 3 4 5 Number of observations in data set = 25 The SAS System Analysis of Variance Procedure Dependent Variable: HIGHT Sum of Mean Source DF Squares Square F Value Pr > F Model 4 131.740000 32.935000 42.28 0.0001 Error 20 15.580000 0.779000 Corrected Total 24 147.320000 R-Square C.V. Root MSE HIGHT Mean 0.894244 1.311846 0.88261 67.2800 Source DF Anova SS Mean Square F Value Pr > F STRAIN 4 131.740000 32.935000 42.28 0.0001 The SAS System Analysis of Variance Procedure Duncan's Multiple Range Test for variable: HIGHT NOTE: This test controls the type I comparisonwise error rate, not the experimentwise error rate Alpha= 0.05 df= 20 MSE= 0.779 Number of Means 2 3 4 5 Critical Range 1.164 1.222 1.259 1.285 Means with the same letter are not significantly different. Duncan Grouping Mean N STRAIN A 70.8000 5 4 B 68.6000 5 5 C 67.3000 5 3 D 65.3000 5 1 D 64.4000 5 2 The SAS System Analysis of Variance Procedure T tests (LSD) for variable: HIGHT NOTE: This test controls the type I comparisonwise error rate not the experimentwise error rate. Alpha= 0.05 Confidence= 0.95 df= 20 MSE= 0.779 Critical Value of T= 2.08596 Least Significant Difference= 1.1644 Comparisons significant at the 0.05 level are indicated by '***'. Lower Difference Upper STRAIN Confidence Between Confidence Comparison Limit Means Limit 4 - 5 1.0356 2.2000 3.3644 *** 4 - 3 2.3356 3.5000 4.6644 *** 4 - 1 4.3356 5.5000 6.6644 *** 4 - 2 5.2356 6.4000 7.5644 *** 5 - 4 -3.3644 -2.2000 -1.0356 *** 5 - 3 0.1356 1.3000 2.4644 *** 5 - 1 2.1356 3.3000 4.4644 *** 5 - 2 3.0356 4.2000 5.3644 *** 3 - 4 -4.6644 -3.5000 -2.3356 *** 3 - 5 -2.4644 -1.3000 -0.1356 *** 3 - 1 0.8356 2.0000 3.1644 *** 3 - 2 1.7356 2.9000 4.0644 *** 1 - 4 -6.6644 -5.5000 -4.3356 *** 1 - 5 -4.4644 -3.3000 -2.1356 *** 1 - 3 -3.1644 -2.0000 -0.8356 *** 1 - 2 -0.2644 0.9000 2.0644 2 - 4 -7.5644 -6.4000 -5.2356 *** 2 - 5 -5.3644 -4.2000 -3.0356 *** 2 - 3 -4.0644 -2.9000 -1.7356 *** 2 - 1 -2.0644 -0.9000 0.2644 表中的各项内容都是很明确的,这里不再赘述。只有R2以前没有见过,请参阅课本11.2.1。 方差分析应具备三个条件,有时这三个条件并不能够得到满足,这时对原始数据就要进行变换,见课本§ 9.7。对原始数据进行变换,只需加上一个赋值语句即可,可参考配对数据t检验的SAS程序。 |
7楼2010-03-10 21:57:06
ibelieve110
银虫 (小有名气)
- 博学EPI: 4
- 应助: 0 (幼儿园)
- 金币: 422.6
- 帖子: 280
- 在线: 26.1小时
- 虫号: 154319
- 注册: 2006-01-03
- 专业: 中药资源
zhouwj906(金币+10):谢谢! 2010-03-09 09:15
|
利用CORR过程计算变量间相关系数的最简单的语句即: proc corr; run; 这时将给出所有变量两两间的相关系数,显著性概率和单变量有关的统计量。为了满足对数据的特殊要求,在PROC CORR中还有许多选项。几个与本教材有关的选项如下: COV 输出协方差 SSCP 输出平方和与交叉乘积和 NOPROB 不输出与相关性有关的概率 NOSIMPLE 不输出每个变量的简单描述性统计量 在PROC CORR过程中还有一些其它语句。其中常用的有VAR语句,WITH语句和PARTIAL语句等,简单介绍如下: VAR语句 列出计算相关系数的变量,例如 proc corr; var a b c; 将计算a、b、c三个变量两两间的相关系数。 WITH语句 WITH语句与VAR语句联合使用,可以计算变量间特殊组合的相关系数。例如: proc corr; var a b; with i j k; 将得到a与i、j、k和b与i、j、k间的相关系数。 PARTIAL语句 在该语句后列出固定变量的名字,则可得到在这些变量不变的情况下,两变量间的偏相关系数(关于偏相关系数的概念见课本11.2.2)。 例 2.19 表2-23给出了高粱在NaCl胁迫后的萎蔫程度(Y)与若干根中蛋白(R)、叶中蛋白(L)和脯氨酸(pro)之间的关系,计算变量间的相关系数。 表2-23 高粱在NaCl胁迫后的萎蔫程度与蛋白及脯氨酸之间的关系 萎蔫度(Y) R1 R7 R8 R15 L3 L9 脯氨酸(PRO) 0.9678 101 0 247 0 147 0 0.155 0.9661 91 0 272 0 158 0 0.119 0.9547 99 0 277 0 102 0 0.105 0.9300 79 105 155 0 0 0 0.093 1.0045 121 0 0 0 233 0 0.227 0.9856 87 0 0 0 176 0 0.217 1.0032 119 119 162 373 361 0 0.271 0.9735 136 0 0 0 0 0 0.351 1.0075 106 232 0 260 288 246 0.270 1.0186 84 335 0 248 240 257 0.282 0.9725 114 372 0 246 311 237 0.234 1.0260 188 391 0 275 259 207 0.222 1.0245 181 380 0 320 437 238 0.650 1.0364 168 408 0 313 336 212 0.407 1.0201 130 472 0 353 340 295 0.557 1.0283 146 572 0 357 210 600 0.611 解: 先建一个名为2-8data.dat的外部数据文件。SAS程序如下: options linesize=76; data protein; infile ‘a:\2-8data.dat’; input y r1 r7 r8 r15 l3 l9 pro; run; proc corr; var y r1 pro; run; proc corr cov nosimple; var y pro; partial r1 r7 r8 r15 l3 l9; run; ` proc corr sscp; var y pro; with r15 l3; run; 输出结果见表2-24。 表2-24 例2.19的相关分析 The SAS System Correlation Analysis 3 'VAR' Variables: Y R1 PRO Simple Statistics Variable N Mean Std Dev Sum Minimum Maximum Y 16 0.9950 0.0312 15.9193 0.9300 1.0364 R1 16 121.8750 34.2226 1950 79.0000 188.0000 PRO 16 0.2982 0.1749 4.7710 0.0930 0.6500 Pearson Correlation Coefficients / Prob > |R| under Ho: Rho=0 / N = 16 Y R1 PRO Y 1.00000 0.68332 0.72095 0.0 0.0035 0.0016 R1 0.68332 1.00000 0.64005 0.0035 0.0 0.0076 PRO 0.72095 0.64005 1.00000 0.0016 0.0076 0.0 The SAS System Correlation Analysis 6 'PARTIAL' Variables: R1 R7 R8 R15 L3 L9 2 'VAR' Variables: Y PRO Partial Covariance Matrix DF = 9 Y PRO Y 0.0002787855 -.0000728802 PRO -.0000728802 0.0151535322 Pearson Partial Correlation Coefficients / Prob > |R| under Ho: Partial Rho=0 / N = 16 Y PRO Y 1.00000 -0.03546 0.0 0.9225 PRO -0.03546 1.00000 0.9225 0.0 The SAS System Correlation Analysis 2 'WITH' Variables: R15 L3 2 'VAR' Variables: Y PRO Sum-of-Squares and Crossproducts Y PRO R15 2789.573000 1109.972000 L3 3623.478500 1255.415000 Simple Statistics Variable N Mean Std Dev Sum Minimum Maximum R15 16 171.5625 160.3874 2745 0 373.0000 L3 16 224.8750 124.1971 3598 0 437.0000 Y 16 0.9950 0.0312 15.9193 0.9300 1.0364 PRO 16 0.2982 0.1749 4.7710 0.0930 0.6500 Pearson Correlation Coefficients / Prob > |R| under Ho: Rho=0 / N = 16 Y PRO R15 0.77736 0.69279 0.0004 0.0029 L3 0.74969 0.56034 0.0008 0.0240 |
2楼2010-03-08 21:02:08
zhouwj906
木虫 (小有名气)
- 应助: 0 (幼儿园)
- 金币: 3985.8
- 红花: 5
- 帖子: 248
- 在线: 114.6小时
- 虫号: 493116
- 注册: 2008-01-09
- 性别: MM
- 专业: 分析仪器与试剂
|
您求的是(Y)与(R)、(L)和(pro)之间的关系,R包括R1、R7、R8、R15;L包括L3、L9;PRO。Y是一个随R、L、pro的变化而变化的量。 那如果我是想分析这样一种数据呢: C仪器测z B仪器测z A仪器测x B仪器测x A仪器测y B仪器测y 样品1 * * * * * * 样品2 * * * * * * 样品3 * * * * * * 样品4 * * * * * * 样品5 * * * * * * 样品6 * * * * * * 其中x、y、z类似于对ABTS+、DPPH.TEMPO的清除率,通过x、y、z来说明样品的抗氧化水平的。 这样的话我希望是可以进行一下分析: 1.C与B仪器测z的相关性;A与B仪器测量x的相关性;A与B仪器测量y的相关性; 2.总抗氧化水平与x、y、z之间的相关性; 3.仪器A检测x、y之间的相关性;仪器B检测x、y之间的相关性; 4.比较用C仪器测z、B仪器测z 、A仪器测x、 B仪器测x 、A仪器测y、B仪器测y来衡量抗氧化水平更有利; 5.样品1、2、3、4、5、6的抗氧化水平是有差别的。 还请高手能多多指教,我该如何进行以上分析呢? 在此不胜感激! |
4楼2010-03-09 09:38:49
小灯
金虫 (正式写手)
- 应助: 0 (幼儿园)
- 金币: 2287.1
- 散金: 100
- 红花: 2
- 帖子: 331
- 在线: 90.6小时
- 虫号: 738161
- 注册: 2009-04-02
- 性别: GG
- 专业: 有机合成

5楼2010-03-09 12:24:22












请教高手如下的实验数据应该怎样用SAS进行处理:
回复此楼
。。关系还是蛮交错的,难怪媳妇儿很闹心。。。