多元回归及数据中的单位问题
多元回归,多项式交互项回归
x1 x2 x3 x4 x5 y
95 25 0.035 800 90 35.7
75 50 0.035 500 150 38
65 75 0.015 900 150 199
55 50 0.025 800 30 191
65 125 0.045 700 120 27.7
95 100 0.005 700 120 105.5
85 125 0.025 900 60 218.2
75 25 0.005 600 60 57.3
55 100 0.015 500 90 57.5
85 75 0.045 600 30 28.9
和
x1 x2 x3 x4 x5 y
95 25 35 800 90 35.7
75 50 35 500 150 38
65 75 15 900 150 199
55 50 25 800 30 191
65 125 45 700 120 27.7
95 100 5 700 120 105.5
85 125 25 900 60 218.2
75 25 5 600 60 57.3
55 100 15 500 90 57.5
85 75 45 600 30 28.9
(1)这两组数据的回归方程是?(2)最优条件是?(3)两组数据中,后一组中x3是前一组中的1000倍(取值单位不同,前面是g,后面是mg),这种做法给数据回归会带来什么样的影响?为什呢?怎么消除这种影响呢? 返回小木虫查看更多
1 、方程形式很多种,多元有线性也有非线性的,最简单的 y=a1*x1+a2*x2+a3*x3+a4*x4+a5*x5
2、看拟合效果,哪个好就选那个
3、某一组数据比结果大很多时(差几个数量级),模型中关于这组数据的参数对结果非常敏感,随意改动有效数字的位数就可能使结果变化很大,可以将变量 归一化 处理来避免这一问题。
能不能把两组数据分别做一下拟合,多因子交互二项式的拟合?看一下各个回归参数,以及R,F,d-w值等
第一组数据的,你可以自己去尝试不同阶数的多元模型
模型公式: y = p1+p2*x1*x2+p3*x1*x3+p4*x1*x4+p5*x2*x3+p6*x2*x4+p7*x3*x4
均方差(RMSE): 27.3617248667278
残差平方和(SSR): 7486.63987682512
相关系数(R): 0.927822280511436
相关系数之平方(R^2): 0.860854184213442
修正R平方(Adj. R^2): 0.582562552640326
确定系数(DC): 0.860854184213442
卡方系数(Chi-Square): 85.7848730362282
F统计(F-Statistic): 3.09335275131036
参数 最佳估算
---------- -------------
p1 65.9896089399909
p2 -0.0207101151154979
p3 7.53992827447152
p4 -0.00159619725742188
p5 -66.5747447086552
p6 0.00514664611678067
p7 3.99501213042369
====== 结果输出 ======
No. 实测值 y 计算值 y
1 35.7 77.1027158566417
2 38 30.3346537858257
3 199 205.436377106546
4 191 151.719170817089
5 27.7 48.8387169571735
6 105.5 107.638261931382
7 218.2 200.697277086115
8 57.3 39.0196246717738
9 57.5 101.841771806318
10 28.9 -3.82857001511211,
matlab 拟合可以参考这个帖子:
http://muchong.com/t-10962975-1