24小时热门版块排行榜    

查看: 270  |  回复: 2
当前主题已经存档。

zijian0370

金虫 (小有名气)

[交流] minitab

哪位兄弟姐妹有mintab学习资料呀?在网站上搜了好久就是搜不到呀?请各位小木虫网友帮帮忙。
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

binbineva

金虫 (初入文坛)

2楼2008-05-03 08:32:20
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

youiscan

如何使用MINTAB进行回归分析
回归分析用来检验并建立一个响应变量与多个预测变量之间的关系模形。
MINITAB提供了多种最小二乘法和推理回归程序。
当响应变量为连续的量值时使用最小二乘法
当响应变量为分类值时使用推理回归。
最小二乘法和推理回归方法都是评估关系模型中的参数并使模型的按按拟合值达到最优化。
最小二乘法是使误差平方和以获得参数估计值。但是MINITAB的推理回归命令是获得参数最大概率估计。参考2-29页推理回归概要以获得更多关天推理回归分析信息。
使用下表来帮助选择适当的程序。
选择的程序         适合的条件         响应类型         评估方法        
回归
          执行简单或多元回归分析:选择合适的关系模型、存贮回归统计量、检验残差分析、产生点估计、产生预测和置信区间以及进行LACK-FIT检验。           连续型          
最小二乘法
 
         
逐步回归分析
 
 
          为了识别预测因素中有用的子集,执行逐步、进一步选择以及后退消除等方法从关系模型中增加或消除变量。
           
连续型
 
           
最小二乘法
 
         
最佳子集
          识别以R2为基础的预测因子最佳子集。          
连续型          
最小二乘法        
拟合线性图
 
 
          使用单个预测因子执行线性和多项回归,并且用数据绘制回归线。以实际和log10为基础。          
连续型          
最小二乘法        
残差图
 
 
          产生一组残差图用来进行残差分析。
正常score图,单值残差图,残差柱状图以及残差和拟合图。
           
连续型          
最小二乘法        
 
二元推理分析
          进行响应可能只有两个值的回归分析,例如:存在或不存在。
          分类         最大概率        
顺序推理
          对响应可能有三个或更多的值的响应进行回归分析,该响应值有自然的顺序,例如:无影响、中等影响、严重影响。         分类         最大概率        
名义推理         对响应可有三个或更多的值的响应进行回归分析,该响应值没自然的顺序,例如:甜、咸 、酸         分类         最大概率        
 
回归
您可以使用回归方法来进行用最小二乘法为基础的一元和多元回归分析。使用本程序您可以产生最小二乘法关系模型,贮存回归统计量,检验残差,产生点估计、进行预测以及置信区间,并且可以进行lack-of-fit检验。
同时您也可以使用该命令产生多元回归关系模型。然而,如果您要使用一个预测因子来获得一个多元回归关系模型,您将会发现使用拟合线性图更好。
数据
在数字型列中输入相等长度的响应和预测因子变量,这样您的工作表中每行的数据包含着对应观察值的测量结果。
在回归方程计算和方差分析表中,MINITAB忽略了响应或预测因子中所有包含丢失值的观测值列。
线性回归分析
1. 选择 统计>回归>回归

2. 在“响应”栏中,输入包含响应变量(Y)的列。
3. 在“预测因子”栏中输入包含预测因子(X)变量的列。
4. 如果需要的话,可以使用下面显示的选项,然后单击“确立”
选项
图形子对话框
为正常、标准、已删除残差图画5个不同的残差图。参考-----2-5页选择残差图类型。有效的残差图包括:
  柱状图
        正态概率图
        残差图及拟合值
  残差图及数据顺序。每个数据点的行号都显示在图中X轴上。(例如:1 2 3 4 5…n)
  独立的残差图及每个选定列。参考2-6页的残差图。
结果子对话框
        在对话窗口中显示下列内容:
  不输出
  估计的回归关系方程,系数表、S,R2,以及方差分析表。
  默认的输出设置,包括上面的输出方式加上连续平方和fits and residuals of unusual observations
选项子对话框
  执行加权回归分析-----参考2-6页加权回归分析
exclude the intercept term from the regression by unchecking Fit Intercept—see
Regression through the origin on page 2-7
        显示variance inflation因子(VIF---共线性影响度量值)
        与每个预测因子相关-----参考2-7页Variance inflation factor
  显示杜宾-瓦特森统计,它是用来检测残差的自相关—参考2-7页检测残差的自相关
  显示PRESS统计以及校正的R2。
  当预测因子重复时,用纯误差lack-of-fit来检验关系模型的适合性,---参考2-8页检验lack-of-fit
  用数据子子集lack-of-fit测试来检验关系模型的适合性---参考2-8页检验lack-of-fit
   预测响应结果、置信区间以及新观测值的区间---参考2-9页新的观测值的预测。
存储子对话框
存储系数、拟合值、以及正常、标准、已删除残差图---参考2-5页选择残差类型。
 
n store the leverages, Cook’s distances, and DFITS, for identifying outliers—see
Identifying outliers on page 2-9.
存储
store the mean square error, the (XX)-1 matrix, and the R matrix of the QR or
Cholesky decomposition. (The variance-covariance matrix of the coefficients is
MSE*(XX)-1.) See Help for information on these matrices.
残差分析及回归推断
当建立了回归关系模,回归分析通常没有完成。您同样也可以检验残差图和其它回归推理来评定残差图是否是随机和正态分布。
MINITAB通过图形子对话图提供许多残差图,做为选择,关系模型及残差被存储以后,您可以使用统计>回归>残差图命令可以在同一图形窗口获得四个残差图。
MINITAB也可以用回归推理来识别不正常的观测值,这些观测值可能对回归结果产生很显著的影响,参考2-9页识别OUTLIERS,您可检验一下这些异常数据看它们是否正确。假如这样的话,您可以确定它们为什么产生异常以及它们对回归关系方程有什么影响。您也可以验证当存在OUTLIERS时,回归结果的敏感程度。Outliers可以暗示关系模型不充分或者需要另外的信息。
选择残差类型
您可以计算三各残差类型,使用下表可以帮助您选择哪种图形。
 
残差类型         选择您需要列         计算方法        
常规         examine residuals in the original scale of the data         response fit        
标准         使用rule of thumb来识别与关系模型关联关系不十分密切的观测值。一个标准的残差绝对值大于2,MINITAB将这些观测值显示在异常观测值表中,并有R表示。         (残差)/(残差的标准差)
 
 
 
         
Studentized         识别与关系模型关联关系不十分密切的观测值,删除影响变量估计及参数估计的观测值。较大的Studentized残差绝对值表明关系模型中包含该观测值将会增大误差变化或者它对参数的估计有很大的影响,或者对二者都有影响。         (残差)/(残差的标准差)
第I个studentized残差值是用第I个被删除的观测值计算出来的。
         
残差图
MINITAB可以产生残差图这样您就可以验证您建立的关系模型的拟合度,您可以选择以下残差图:
残差正态分布图:如果残差服从正态分布,图中的点将基本形成一条直线。如果图中的点背离了该直线,残差服从正态布的假设就会不成立,检验数据是否服从正态分布,可以使用统计>基本统计>正态检验(1-43)。
残差柱状图:该图必须类似正态分布图并且其平均值为0(钟形),许多点串远离零点,关系模型之外的因子可能影响了您的结果。
残差及拟合度:本图应该显示的是残差应是随机的分布在0周围。在残差图内应该没有任何recognizable patterns,以下的几点可以说明残差图是非随机的:
----几点连续上升或下降
----绝大部分的点是正残差,或绝大部的点是负残差。
– patterns such as increasing residuals with increasing fits
残差与顺序图:本图所有残差都是按照数据搜集顺序排列的,它可以用来发现非随机错误,特别是与时间相关的影响。
残差图与其变量图:这是个残差与其它变量图。一般地,你可以使用关系模型中预测因子或变量来检查一下您的是否有您想要图形。如果某些残差值被考虑,您可以用刷子工具来标识这些值,您可以参考MINITAB使用者指南中Brushing Graphs的章节。
加权回归分析
加权最小二乘法回归分析用来分析观测值中包含有非常量变量的一种方法。如果变量不是常量变量那么:
        1)       带有大变量的观测值应相应地加上较小的权重。
2)  带有小变量的观测值应相应地加上较大的权重。
一般情况的权重是响应中纯误差变量相反值。
The usual choice of weights is the inverse of pure error variance in the response.
加权回归分析
1.选择统计>回归>回归>选项
2.在“权重”栏中,输入包含权重的列,权重必须大于或等于0,在每个对话框中单击“确定”
3.在数据组中有n个观测值,MINITAB产生了n n的矩阵W,权重列作为矩阵的对角和零点。MINITAB使用(XWX)-1 (XWY)来计回归系数,这样就等于将加权平方和误差最小化。
,式中wi为权重。
通过原点的回归
一般的情况下, y截矩(也叫常数项)被包含在等式,因此minitab选用下面关系模型:

然而,如果在x=0时,响应值也自然为0时,可以选用一个没有截矩的关系模型。如果是这样,在选项子对话框中,不选截矩项,并且0项就会被忽略,minitab选用下面的关系模型:

因为当没有常数项解释R2是非常困难的,所以R2没有显示出来。如果您想比较带有截矩项与不带有截矩项关系模型的拟合度,可以进行平均值平方误差及验证残差图。
变量inflation factor
The variance inflation factor (VIF) 用来检测一个预测因子和剩下的预测因子是否有很强的线性关系(预测因子中存在多重共线性)。如果您的预测因子是相关的(或多重线性相关)时,VIF测量的是估计的回归因子增加程序。VIF>=1时表明因子之间不相关,所有预测因子中最大的VIF通常是用来作为多重共线性的指示。Montgomery and Peck [21]建议当VIF大于5-10时,回归系数估计得毫无结果。
你应该考虑使用选项中的方法来分散预测因子间的多重共线性:
   重新搜集数据,删除预测因子,使用不同的预测因子或最小二乘法回归分析的替代,获得附加的信息请参考[3], [21].。
检验残差的自相关
在线性回归分析中,我们总是假设残差都是彼此相互独立的(即它们之间不存大自相关)。
如果相互独立的假设被破坏,一些关系模型的拟合结果就会被怀疑。例如:误差的正相关可以放在系数的t值。选定一个模型后检验关系模型的假设是回归分析的一个很重要的部分。Minitab提供了两种方法也检验这个假设:
1.残差与数据顺序(1 2 3 4 …….n)图可以提供很直观的方法来检验残差的自关性。
2.杜宾-瓦特森统计测试回归残差是否存在自相关是通过两个相邻误差项的相关系数是否为0来决定的。该测试是以误差由第一顺序自回归过程的假设为基础的。如果列中有丢失的观测值,同样在计算时这些数据就会忽略了,仅仅使用没有丢失的数据。
为了从检验中得出结论,您需要用表中的上下限比较显示的统计量,如果D>上限,没有相关;如果D<下限,表示存在正相关;如果D在上下限之间,不能确定其相关性。如果想得到其它信息,请参考[4], [22].
检验lack-of-fit
MINITAB提供了两种lack-of-fit 检验,这样您可确定建立的回归模型是否能够完全适合您的数据。纯误差lack-of-fit 检验需要副本(replicates); the data subsetting lack-of-fit test does not require replicates.
 
纯误差lack-of-fit检验----如果您的预测因子中包含重复的数据(一个因子几个同样的X值或多预测因子中有几个同样的X值组合),MINITAB可以为lack-of-fit计算一个纯误差检验。误差项将被分成纯误差(error within replicates)和lack-of-fit误差。F检验可以检验您是否选择了适合的回归关系方程。如果需要其它信息,请参考[9], [22], [29].
数据子集lack-of-fit检验---- MINITAB同样也可以进行lack-of-fit检验数据,其数据不需要副本但是要包含数据子集。该检验是非标准化的,但是它可提供关于每个变量的lack-of-fit的信息。参考[6] 和“帮助”得到更多的信息。MINITAB可进行2K+1的假设检验,其中K是预测因子数量,然后使用Bonferroni不等式组合它们以得到一个0.1的全面显著性水平。然后显示出每次检验的lack-of-fit.证据。For each predictor, a curvature test and an interaction test are performed by
comparing the fit above and below the predictor mean using indicator variables(对于每个预测因子,可以用曲率检验和交互检验检验通过使用指示变量业比较拟合度是高于并低于预测因子平均值)
也可以用另一个试验通过将关系模与数据“中心”部分拟合,然后比较中心数据误差平方和所有数据误差平方和。
新观测值的预测
如果您知道新预测因子值(X),并且您想知道通过使用回归方程计算出的响应值,那么您可以选项子对话框中新观测值的预测区间。输入常数或包含新X值的列,每个预测因子数据应是一列(one for each predictor)。每列的长度必须是相等。如果输入了常数和一列,MINITAB会认为您想要得到常数和每列数据组合的所有预测值。您可以将默认的置信水平95%改成其它值,您也可以储存显示的值:拟合度、拟合度标准误差、置信界限及预测界限。如果您使用带权重的预测,可以参考帮助中的获得正确的结果。
识别outliers
3楼2008-05-03 09:29:19
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 zijian0370 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见