24小时热门版块排行榜    

查看: 923  |  回复: 8
当前主题已经存档。
【悬赏金币】回答本帖问题,作者zhouwj906将赠送您 10 个金币
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

zhouwj906

木虫 (小有名气)

[求助] SAS进行数据分析

请教高手如下的实验数据应该怎样用SAS进行处理:
                     评价方法
测量对象       A        B        C       D       E      F
1                   *        *        *       *        *     *
2                   *        *        *       *        *     *
3                   *        *        *       *        *     *
4                   *        *        *       *        *     *
5                   *        *        *       *        *     *   
6                   *        *        *       *        *     *
我该怎样1.对评价方法结果相关性进行分析;2.对不同测量对象及6种评价方法结果方差分析:3.怎样得出多重比较分析结果。

» 收录本帖的淘帖专辑推荐

统计软件SAS

» 猜你喜欢

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ibelieve110

银虫 (小有名气)

在阅读以下内容之前,请先阅读第一章"SAS软件基本操作"。

单因素实验设计又称为完全随机化实验设计。该实验设计要求实验条件或实验环境的同质性很高。例如,比较a个作物品种的产量,每一品种设置n个重复,全部实验共有an次。根据完全随机化实验设计的要求,试验田中的an个试验小区的土质、肥力、含水量、小气候、田间管理等条件必须完全一致。至于哪一个品种的哪一次重复安排在哪一个小区,完全是随机的,因此得到了“完全随机化实验设计”这一名称。

例2.9  下面以课本中例8.1的数据为例,给出单因素方差分析的SAS程序。
    解:先按以下输入方式建立一个称为a:\2-5data.dat的外部数据文件。
1        64.6        1        65.3        1        64.8        1        66.0        1        65.8        2        64.5        2        65.3        2        64.6
2        63.7        2        63.9        3        67.8        3        66.3        3        67.1        3        66.8        3        68.5        4        71.8
4        72.1        4        70.0        4        69.1        4        71.0        5        69.2        5        68.2        5        69.8        5        68.3
5        67.5                                                                                                               
SAS程序如下:
options  linesize=76;
data wheat;
infile  ‘a:\2-5data.dat’;
input  strain  hight  @@;
run;
proc  anova;
                class  strain;
                model  hight=strain;
                means  strain / duncan;
                means  strain / lsd  cldiff;
run;
在PROC ANOVA过程中的CLASS语句(分类语句)是必须的,而且一定要放在MODEL语句之前。在方差分析中要使用的分类变量(因素),首先要在CLASS语句中说明。分类变量可以是数值型的,也可以是字符型的。MODEL语句用来规定因素对实验结果的效应,一般形式为,因变量=因素效应。本例即为株高=品系效应。
MEANS语句应放在MODEL语句之后,MEANS语句后列出希望得到均值的那些变量。MEANS语句有很多选项,下面列出几个与本教材有关的选项,将选项写在MEANS语句的“/”之后。
        DUNCAN: 对MEANS语句列出的所有主效应均值进行DUNCAN检验。
SNK: 对MEANS语句列出的所有主效应均值进行Student-Newman-Keuls检验。
T | LSD: 对MEANS语句列出的所有主效应均值进行两两t检验,它相当于在样本含           量相同时的LSD检验。
ALPHA=  均值间对比检验的显著水平,缺省值是0.05。当用DUNCAN选项时只能取0.01、0.05和0.10,对于其它选项,α可取0.0001到0.9999之间的任何值。
CLDIFF: 在选项T和LSD时,过程将两个均值之差以置信区间的形式输出。
CLM: 在选项T和LSD时,过程把变量的每一水平均值以置信区间的形式输出。
执行上述程序,输出结果见表2-13。

表 2-13: 例2.9方差分析输出结果
                                                                             
                                 
The SAS System

                           Analysis of Variance Procedure
                              Class Level Information

Class        Levels        Values
STRAIN        5        1 2 3 4 5
               
                  Number of observations in data set = 25

                                 The SAS System                              

                           Analysis of Variance Procedure

Dependent Variable: HIGHT

                Sum of        Mean               
Source        DF        Squares        Square        F Value        Pr > F
                                       
Model        4        131.740000        32.935000        42.28        0.0001
Error        20        15.580000        0.779000               
Corrected Total        24        147.320000                       

R-Square        C.V.        Root MSE        HIGHT Mean
0.894244        1.311846        0.88261        67.2800

Source        DF        Anova SS        Mean Square        F Value        Pr > F
STRAIN        4        131.740000        32.935000        42.28        0.0001

                                  The SAS System                              

                            Analysis of Variance Procedure

                  Duncan's Multiple Range Test for variable: HIGHT

            NOTE: This test controls the type I comparisonwise error rate, not
                   the experimentwise error rate

                          Alpha= 0.05  df= 20  MSE= 0.779

Number of Means        2        3        4        5
Critical Range        1.164        1.222        1.259        1.285

        Means with the same letter are not significantly different.

Duncan Grouping        Mean        N        STRAIN
A        70.8000        5        4
B        68.6000        5        5
C        67.3000        5        3
D        65.3000        5        1
D        64.4000        5        2

                                  The SAS System                              

                           Analysis of Variance Procedure

                         T tests (LSD) for variable: HIGHT

            NOTE: This test controls the type I comparisonwise error rate not
                  the experimentwise error rate.

                 Alpha= 0.05  Confidence= 0.95  df= 20  MSE= 0.779
                            Critical Value of T= 2.08596
                        Least Significant Difference= 1.1644

     Comparisons significant at the 0.05 level are indicated by '***'.

Lower        Difference        Upper               
STRAIN        Confidence        Between        Confidence       
Comparison        Limit        Means        Limit       
                               
4  -  5        1.0356        2.2000        3.3644        ***
4  -  3        2.3356        3.5000        4.6644        ***
4  -  1        4.3356        5.5000        6.6644        ***
4  -  2        5.2356        6.4000        7.5644        ***
                               
5  -  4        -3.3644        -2.2000        -1.0356        ***
5  -  3        0.1356        1.3000        2.4644        ***
5  -  1        2.1356        3.3000        4.4644        ***
5  -  2        3.0356        4.2000        5.3644        ***
                               
3  -  4        -4.6644        -3.5000        -2.3356        ***
3  -  5        -2.4644        -1.3000        -0.1356        ***
3  -  1        0.8356        2.0000        3.1644        ***
3  -  2        1.7356        2.9000        4.0644        ***
                               
1  -  4        -6.6644        -5.5000        -4.3356        ***
1  -  5        -4.4644        -3.3000        -2.1356        ***
1  -  3        -3.1644        -2.0000        -0.8356        ***
1  -  2        -0.2644        0.9000        2.0644       
                               
2  -  4        -7.5644        -6.4000        -5.2356        ***
2  -  5        -5.3644        -4.2000        -3.0356        ***
2  -  3        -4.0644        -2.9000        -1.7356        ***
2  -  1        -2.0644        -0.9000        0.2644       

表中的各项内容都是很明确的,这里不再赘述。只有R2以前没有见过,请参阅课本11.2.1。
    方差分析应具备三个条件,有时这三个条件并不能够得到满足,这时对原始数据就要进行变换,见课本§ 9.7。对原始数据进行变换,只需加上一个赋值语句即可,可参考配对数据t检验的SAS程序。
7楼2010-03-10 21:57:06
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 9 个回答

ibelieve110

银虫 (小有名气)

zhouwj906(金币+10):谢谢! 2010-03-09 09:15
利用CORR过程计算变量间相关系数的最简单的语句即:
                proc  corr;
                run;
这时将给出所有变量两两间的相关系数,显著性概率和单变量有关的统计量。为了满足对数据的特殊要求,在PROC CORR中还有许多选项。几个与本教材有关的选项如下:
        COV  输出协方差
        SSCP  输出平方和与交叉乘积和
        NOPROB  不输出与相关性有关的概率
        NOSIMPLE  不输出每个变量的简单描述性统计量
        在PROC CORR过程中还有一些其它语句。其中常用的有VAR语句,WITH语句和PARTIAL语句等,简单介绍如下:
                VAR语句  列出计算相关系数的变量,例如
                        proc  corr;
                                var  a  b  c;
将计算a、b、c三个变量两两间的相关系数。
                WITH语句  WITH语句与VAR语句联合使用,可以计算变量间特殊组合的相关系数。例如:
                        proc  corr;
                                var  a  b;
                                with  i  j  k;
将得到a与i、j、k和b与i、j、k间的相关系数。
                PARTIAL语句  在该语句后列出固定变量的名字,则可得到在这些变量不变的情况下,两变量间的偏相关系数(关于偏相关系数的概念见课本11.2.2)。
       
例 2.19  表2-23给出了高粱在NaCl胁迫后的萎蔫程度(Y)与若干根中蛋白(R)、叶中蛋白(L)和脯氨酸(pro)之间的关系,计算变量间的相关系数。

表2-23  高粱在NaCl胁迫后的萎蔫程度与蛋白及脯氨酸之间的关系
萎蔫度(Y)        R1        R7        R8        R15        L3        L9        脯氨酸(PRO)
0.9678        101        0        247        0        147        0        0.155
0.9661        91        0        272        0        158        0        0.119
0.9547        99        0        277        0        102        0        0.105
0.9300        79        105        155        0        0        0        0.093
1.0045        121        0        0        0        233        0        0.227
0.9856        87        0        0        0        176        0        0.217
1.0032        119        119        162        373        361        0        0.271
0.9735        136        0        0        0        0        0        0.351
1.0075        106        232        0        260        288        246        0.270
1.0186        84        335        0        248        240        257        0.282
0.9725        114        372        0        246        311        237        0.234
1.0260        188        391        0        275        259        207        0.222
1.0245        181        380        0        320        437        238        0.650
1.0364        168        408        0        313        336        212        0.407
1.0201        130        472        0        353        340        295        0.557
1.0283        146        572        0        357        210        600        0.611
       
    解: 先建一个名为2-8data.dat的外部数据文件。SAS程序如下:
                        options  linesize=76;
                        data  protein;
                                infile  ‘a:\2-8data.dat’;
                                input  y  r1  r7  r8  r15  l3  l9  pro;
                        run;
                        proc  corr;
                                var  y  r1  pro;
                        run;
                        proc  corr  cov  nosimple;
                                var  y  pro;
                                partial  r1  r7  r8  r15  l3  l9;
                        run;
`                        proc  corr  sscp;
                                var  y  pro;
                                with  r15  l3;
                        run;
输出结果见表2-24。

表2-24  例2.19的相关分析
                                                                             
The SAS System
Correlation Analysis
3 'VAR' Variables:  Y        R1       PRO

Simple Statistics

Variable        N        Mean        Std Dev        Sum        Minimum        Maximum
                                               
Y        16        0.9950        0.0312        15.9193        0.9300        1.0364
R1        16        121.8750        34.2226        1950        79.0000        188.0000
PRO        16        0.2982        0.1749        4.7710        0.0930        0.6500

  Pearson Correlation Coefficients / Prob > |R| under Ho: Rho=0 / N = 16

        Y        R1        PRO
Y        1.00000        0.68332        0.72095
        0.0        0.0035        0.0016
R1        0.68332        1.00000        0.64005
        0.0035        0.0        0.0076
PRO        0.72095        0.64005        1.00000
        0.0016        0.0076        0.0

The SAS System Correlation Analysis

6 'PARTIAL' Variables:        R1        R7        R8        R15        L3        L9
2 'VAR' Variables:        Y        PRO                               

               Partial Covariance Matrix     DF = 9

        Y        PRO
Y        0.0002787855        -.0000728802
PRO        -.0000728802        0.0151535322

              Pearson Partial Correlation Coefficients
              / Prob > |R| under Ho: Partial Rho=0 / N = 16

        Y        PRO
Y        1.00000        -0.03546
        0.0        0.9225
PRO        -0.03546        1.00000
        0.9225        0.0



The SAS System
Correlation Analysis
2 'WITH' Variables:        R15        L3
2 'VAR' Variables:        Y        PRO

                      Sum-of-Squares and Crossproducts

        Y        PRO
R15        2789.573000        1109.972000
L3        3623.478500        1255.415000

Simple Statistics

Variable        N        Mean        Std Dev        Sum        Minimum        Maximum
                                               
R15        16        171.5625        160.3874        2745        0        373.0000
L3        16        224.8750        124.1971        3598        0        437.0000
Y        16        0.9950        0.0312        15.9193        0.9300        1.0364
PRO        16        0.2982        0.1749        4.7710        0.0930        0.6500

  Pearson Correlation Coefficients / Prob > |R| under Ho: Rho=0 / N = 16

        Y        PRO
R15        0.77736        0.69279
        0.0004        0.0029
L3        0.74969        0.56034
        0.0008        0.0240
2楼2010-03-08 21:02:08
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhouwj906

木虫 (小有名气)

您求的是(Y)与(R)、(L)和(pro)之间的关系,R包括R1、R7、R8、R15;L包括L3、L9;PRO。Y是一个随R、L、pro的变化而变化的量。
那如果我是想分析这样一种数据呢:
           C仪器测z    B仪器测z    A仪器测x      B仪器测x      A仪器测y      B仪器测y
样品1     *                *              *                  *               *                 *
样品2     *                *              *                  *               *                 *
样品3     *                *              *                  *               *                 *
样品4     *                *              *                  *               *                 *
样品5     *                *              *                  *               *                 *
样品6     *                *              *                  *               *                 *
其中x、y、z类似于对ABTS+、DPPH.TEMPO的清除率,通过x、y、z来说明样品的抗氧化水平的。
这样的话我希望是可以进行一下分析:
1.C与B仪器测z的相关性;A与B仪器测量x的相关性;A与B仪器测量y的相关性;
2.总抗氧化水平与x、y、z之间的相关性;
3.仪器A检测x、y之间的相关性;仪器B检测x、y之间的相关性;
4.比较用C仪器测z、B仪器测z 、A仪器测x、 B仪器测x 、A仪器测y、B仪器测y来衡量抗氧化水平更有利;
5.样品1、2、3、4、5、6的抗氧化水平是有差别的。
还请高手能多多指教,我该如何进行以上分析呢?
在此不胜感激!
4楼2010-03-09 09:38:49
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

小灯

金虫 (正式写手)

。。关系还是蛮交错的,难怪媳妇儿很闹心。。。
科技兴国!
5楼2010-03-09 12:24:22
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
不应助 确定回帖应助 (注意:应助才可能被奖励,但不允许灌水,必须填写15个字符以上)
信息提示
请填处理意见