24小时热门版块排行榜    

CyRhmU.jpeg
查看: 2555  |  回复: 9
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

lilirong2009

铜虫 (小有名气)

[交流] 【求助】多元线性回归模型训练集和验证集已有6人参与

我要建立一个多元线性回归模型,因为不是数学专业,有几个问题不了解请数学高手指点迷津
1.建立模型的时候随机抽取的训练集样本数>总体样本的50%就可以了吗?那取4/5或者2/3做训练集也是可以的?有没有更好的建议?
2.假如分别用逐步回归和主成分分析分别建立一个模型得到相关系数和标准差,你对于验证集也是用同样的方法建立方程得到验证集的相关系数和标准差吗?有时候验证集样本数小于10个且小于自变量个数不就不能用逐步回归分析了吗?
3.交叉(交互)验证交叉验证是对整个训练集做的吗?如抽一法能用软件做吗?那个Rcv怎么算出来?
4.我用的spss多国语言版,可是想装PLS模块怎么装了也用不了,谁装过PLS插件的帮个忙

以上问题希望有高人指点,感激不尽!

[ Last edited by javeey on 2010-7-27 at 06:21 ]
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lilirong2009

铜虫 (小有名气)


1)样本就只有40个左右
2)
3)据说spss的clementine12.0可以做,谁晓得?
4)装了个完整版就可以了
3楼2010-07-30 17:15:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 10 个回答

RyanPCH

木虫 (小有名气)

★ ★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
javeey(金币+2):谢谢参与交流 2010-07-30 14:49:13
引用回帖:
Originally posted by lilirong2009 at 2010-07-26 22:57:23:
我要建立一个多元线性回归模型,因为不是数学专业,有几个问题不了解请数学高手指点迷津
1.建立模型的时候随机抽取的训练集样本数>总体样本的50%就可以了吗?那取4/5或者2/3做训练集也是可以的?有没有更好的 ...

1)看你如何随机抽取,在计算出需要的样本。没有随便说去多少样本就多少的。
当然越多越好,但是如果设计费用,你舍得花那么多钱吗?
2)嗯~
3)看你要用什么方法了,后面的我不打洞,抱歉。
4)重新安装
2楼2010-07-30 11:35:19
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

RyanPCH

木虫 (小有名气)


小木虫(金币+0.5):给个红包,谢谢回帖交流
引用回帖:
Originally posted by lilirong2009 at 2010-07-30 17:15:25:

1)样本就只有40个左右
2)
3)据说spss的clementine12.0可以做,谁晓得?
4)装了个完整版就可以了

1)那么少?要做多元统计分析,样本不能少啊!
2)不一定的意思
3)我不晓得
4)跳过
4楼2010-08-04 11:37:57
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xmok77

金虫 (小有名气)

★ ★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
javeey(金币+2):谢谢耐心的解答 2010-08-08 14:42:18
有些安装问题,多试吧
专业问题我觉得注意两点就是了:
一是训练集和验证集大小取决于实际,没有硬性规定;
二是交叉验证,这个跟你选训练集合验证集有点类似,一般采用“缺一交叉验证”(Leave-one-out),就是拿出一个做验证,剩余的做训练,于是有n(样本容量)次验证机会,将这些验证结果做成某种统计量,如:RCV

这两个问题本质都是一样的,不像传统的统计模型讲求拟合效果(如:经典的R2,相关系数等),此处强调的是“预测能力”(Predictablity),或者说“泛化能力”(Generalization)
5楼2010-08-08 13:12:04
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复(可上传附件)
信息提示
请填处理意见