24小时热门版块排行榜    

查看: 10343  |  回复: 17

chenlp211

禁虫 (小有名气)

本帖内容被屏蔽

11楼2012-06-20 10:12:23
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

rainbowguy

银虫 (正式写手)

引用回帖:
5楼: Originally posted by iamgjl at 2012-06-19 20:28:49
哪有要求因变量正态分布的!这写数据都是实验来的好不好!通常要求残差正态分布,这样说明拟合合理,还可以得到拟合的置信度。

最近深入考虑了线性回归模型,iamgjl大虾说的有错误!主要为以下两个方面:
(1)iamgjl大虾说“不要求因变量正态分布,只要求残差正态分布”-- 当残差符合正态分布N()时,因变量则符合正态分布N([latex](ax(i)+b,delta^2)/[latex]),其中预测函数y=ax(i)+b。这个结论可以由正态分布的概率密度函数得到。也就是说当残差符合正态分布时,其因变量必然也符合正态分布。
(2)iamgjl大虾意思说“在拟合后,要求残差符合正态分布,若不符合则重新拟合”-- 正确地应该是:在用线性回归模型拟合数据之前,首先要求数据应符合或近似符合正态分布,否则得到的拟合函数不正确。若本身样本不符合正态分布或不近似服从正态分布,则要采用其他的拟合方法,比如对于服从二项式分布的样本数据,可以采用logistics线性回归。这就是说不应该“选用回归方法拟合完后再看看残差的分布情况”,应该是在拟合之前就应该是样本数据有一个了解,然后再选用哪种回归方法。
12楼2012-06-29 21:09:23
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

rainbowguy

银虫 (正式写手)

引用回帖:
11楼: Originally posted by chenlp211 at 2012-06-20 10:12:23
线性回归模型中,响应变量服从正态分布,误差项满足高斯--马尔科夫条件(零均值、等方差、不相关)只是理想化的假定,为的是数学上有相应的较为成熟的结论。其实大多数实际问题都不完全满足这些理想化的假定。线性回归 ...

chenlp211 大虾你的理解是正确的! 线性回归模型中的一个前提假设就是要求样本数据与真实数据的残差服从正态分布(0均值),也即因变量也服从正态分布。但正如所说,这些只是个理想化的条件。
13楼2012-06-29 21:16:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

iamgjl

木虫 (著名写手)

引用回帖:
12楼: Originally posted by rainbowguy at 2012-06-29 21:09:23
最近深入考虑了线性回归模型,iamgjl大虾说的有错误!主要为以下两个方面:
(1)iamgjl大虾说“不要求因变量正态分布,只要求残差正态分布”-- 当残差符合正态分布N((0,delta^2))时,因变量则符合正态分布N((ax ...

1当残差符合正态分布N()时,因变量则符合正态分布N([latex](ax(i)+b,delta^2)/[latex]),其中预测函数y=ax(i)+b。
看不懂。残差是标准值(实验值?)与模型值的差,这里的因变量服从的分布怎会与残差分布有关。
2你说的很对,在用线性回归模型拟合数据之前,首先要求数据应符合或近似符合正态分布,否则得到的拟合函数不正确。若本身样本不符合正态分布或不近似服从正态分布,则要采用其他的拟合方法。
问题是多元回归是你也能看得出,或者就算看得出大概是线性模型也不见得是纯线性的,比如y=100x+sinx.
待人以诚,立身以信
14楼2012-06-29 22:45:54
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

iamgjl

木虫 (著名写手)

引用回帖:
12楼: Originally posted by rainbowguy at 2012-06-29 21:09:23
最近深入考虑了线性回归模型,iamgjl大虾说的有错误!主要为以下两个方面:
(1)iamgjl大虾说“不要求因变量正态分布,只要求残差正态分布”-- 当残差符合正态分布N((0,delta^2))时,因变量则符合正态分布N((ax ...

如果预测都这么严密的话。。。科研还有什么意思
待人以诚,立身以信
15楼2012-06-29 22:51:04
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

rainbowguy

银虫 (正式写手)

引用回帖:
14楼: Originally posted by iamgjl at 2012-06-29 22:45:54
1当残差符合正态分布N()时,因变量则符合正态分布N((ax(i)+b,delta^2)/),其中预测函数y=ax(i)+b。
看不懂。残差是标准值(实验值?)与模型值的差,这里的因变量服从的分布怎会与残差分布有关。
2你说的很对,在 ...

1. 数学符号打的有问题,意思是说当残差服从正态分布(均值为0,delta^2),则因变量也服从正态分布(ax(i)+b, delta^2).
2. 预测本身不要求特别严密,我的意思是当有一组样本数据时,先要对样本数据分析,如果大概有线性的关系,则使用线性模型,像你举得例子y=100x+sinx,在对样本分析时会发现线性关系上还存在周期性,显然如果还采用线性回归,则效果不会很好,而要采用Logistic回归可能效果会更好。这就要求我们一定要在模拟前对样本有个总体认识,而不是随便采用哪种模拟方法。另外,如果这样都被称为“预测严密的话”,我就不好说什么了。
16楼2012-07-01 20:54:11
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

iriver595t

木虫 (正式写手)

【答案】应助回帖

也有这个疑惑,
http://pan.baidu.com/s/1gdB0QEv
这个图,x和y具有一定相关是因为两个绝对值较大的点的影响
17楼2015-05-05 09:48:05
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

kingswordscu

铜虫 (正式写手)

【答案】应助回帖

残差服从正态分布的假定是为了进行变量显著性检测时候用,因为回归系数显著与否需要通过F或者T检测,这是建立在正态分布的基础上的。我觉得而你的因变量是否是正态分布倒无所谓,关键是残差。我觉得如果残差是正态分布,因变量不一定是正态分布,因为残差都是独立的。
go!!!
18楼2015-06-22 01:01:40
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 rainbowguy 的主题更新
信息提示
请填处理意见