24小时热门版块排行榜    

CyRhmU.jpeg
查看: 1449  |  回复: 16

kyuu

木虫 (小有名气)

[求助] 求请教一线性回归模型

现有一组数据Y,已知该数据呈线性,但直接用最小二乘法做回归模型误差较大,另已知该数据会受到温度的影响,温度每K会使Y下降一个常数值a(这个常数值目前物理学上没有很好的方式测量),温度已测量记做X,请问如何在考虑温度对系统的影响下对回归模型做出修正?统计模型的名称?
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
回帖支持 ( 显示支持度最高的前 50 名 )

我是小幸子

银虫 (小有名气)

你这显然遗漏关键变量造成的异方差性,建议加入温度变量,用逐步回归法,看效果

发自小木虫Android客户端
3楼2017-03-16 15:49:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通回帖

kyuu

木虫 (小有名气)

不要用多元线性回归,有高级点的没
2楼2017-03-09 17:12:05
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

kyuu

木虫 (小有名气)

引用回帖:
3楼: Originally posted by 我是小幸子 at 2017-03-16 15:49:53
你这显然遗漏关键变量造成的异方差性,建议加入温度变量,用逐步回归法,看效果

没毛病,我试试,其实我有试过ARIMAX模型,也是有考虑温度的,但是残差序列在原始数据最大值附近有一个点的残差高出其它点80倍,跟我的理论预期差的太多,你有这方面的经验吗,能解释一下这个现象的原因出在哪里?
好不容易遇见一个上神,能不能多纠缠你一会儿啊,原始数据Y里有随机误差,但是有一个总体下降的趋势,是温度造成的,所以数据不平稳,非平稳数据怎么做异方差统计检验啊,我只会处理平稳数据。
我们学校的老师一个个的都拽的不行,想跟统计系跟经济系的教授请教一下,还嫌弃我是历史系的,不爱搭理我。
上神在哪里高就啊,让小仙膜拜一下下呗,小仙毕生最崇拜的就是数学好的人了
4楼2017-03-16 18:53:51
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

我是小幸子

银虫 (小有名气)

残差过大,就可能是奇异值,可以计算其cook距离判别,对奇异值的处理,首先分析形成原因(如误测,异常其他人为因素等),之后再删除奇异点,进行回归分析,对比参数变化                        方差不齐的处理方法,具体得看残差图分析,如不改变原来模型,一个改良估计的方法是加权最小二乘估计

发自小木虫Android客户端
5楼2017-03-16 19:31:00
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

kyuu

木虫 (小有名气)

引用回帖:
5楼: Originally posted by 我是小幸子 at 2017-03-16 19:31:00
残差过大,就可能是奇异值,可以计算其cook距离判别,对奇异值的处理,首先分析形成原因(如误测,异常其他人为因素等),之后再删除奇异点,进行回归分析,对比参数变化                        方差不齐的处理方法 ...

这个还真不应该是奇异值,每个数据点是我采用超高样本数(N>一千万))对pseudo voigt分布求极限形成的正态分布,测量真值的数学期望没问题,我用的设备是高精密仪器没有人为因素,测量误差的来源是温度和交流电,后者我有方式消除,但是前者是原子尺度下温度对物质造成的体积膨胀,这个我真处理不了。不能去除异常点,是因为数据点的个数有限,去除了以后样本数不够我做小波分析,还有会打消数据的时序性。加权的话,不同的数据权不一致,建立的模型不通用啊。
数学家的世界好难懂啊,所以数学家们是不用Portmanteau Q和LM的?
今天一天一直挺抑郁的,还好抓到一只野生上神,现在好开心,上神带我一起上天吧
6楼2017-03-16 20:15:51
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

kyuu

木虫 (小有名气)

引用回帖:
5楼: Originally posted by 我是小幸子 at 2017-03-16 19:31:00
残差过大,就可能是奇异值,可以计算其cook距离判别,对奇异值的处理,首先分析形成原因(如误测,异常其他人为因素等),之后再删除奇异点,进行回归分析,对比参数变化                        方差不齐的处理方法 ...

这个异常的残差可能是应用数学模型时累积出来的,所以需要换模型,但是常用的模型不好代入互相关的多元变量,目前效果最烂的当属多元最小二乘线性回归
7楼2017-03-16 20:28:00
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

我是小幸子

银虫 (小有名气)

最小二乘估计的残差值不存在累积效应,是否奇异值是通过cook距离或者Welsch-Kuhd

发自小木虫Android客户端
8楼2017-03-16 20:54:45
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

我是小幸子

银虫 (小有名气)

最小二乘估计的残差值不存在累积效应,是否奇异值是通过cook距离或者Welsch-Kuh度量来判断      目前你的模型存在高离群值,自变量相关?(多重共线性),异方差性。。。。等问题。回归模型所有检验的可靠性都是基于模型假设合理的要求为前提的。      建议,重新选取变量(采用逐步回归或岭迹分析等选取合理自变量),或者考虑温度和其他变量的交互作用等,,,要自己试一下看看效果

发自小木虫Android客户端
9楼2017-03-16 21:01:34
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

kyuu

木虫 (小有名气)

引用回帖:
9楼: Originally posted by 我是小幸子 at 2017-03-16 21:01:34
最小二乘估计的残差值不存在累积效应,是否奇异值是通过cook距离或者Welsch-Kuh度量来判断      目前你的模型存在高离群值,自变量相关?(多重共线性),异方差性。。。。等问题。回归模型所有检验的可靠性都是基于 ...

因为残差异常只出现在数据最大值附近,之前用的是多元自回归积分滑动平均模型,所以猜测是累积的,其实我这个东西前人也做了一百多年,最小二乘法法一直都不成功,所以我之前不怎么考虑,数据是离散时间序列,高度自相关,高度偏自相关,数据里有很强的周期势(trend)和线性趋势, 非平稳(non-stationary),异方差其实是存在的,但是我一直不想考虑,太复杂,另外体系里的数据有一部分是跟量子力学有关的,这部分数据是混沌的。昨晚回家就睡了,我一会看一下逐步回归。
有这么个问题能不能看一下,因为我一直是按照误差驱动f(e)来寻原函数F(x)的理论来做的,虽然有一个残差异常点,但是残差依然是白噪声,所以我觉得是累积的,这个怎么解释才合理呢
10楼2017-03-17 10:34:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 kyuu 的主题更新
信息提示
请填处理意见