24小时热门版块排行榜    

查看: 1212  |  回复: 14
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

yulin2016

新虫 (小有名气)

[交流] 特征选择中的交叉验证 已有2人参与

急急急!有一个疑问,现在有一个数据,对数据做特征选择!有两种做法:1 对全部数据进行不同的特征选择算法,然后进行交叉验证 2 先把数据集分成训练集和测试集,然后对每一组训练集进行不同特征选择算法,再进行建模  哪种方法好啊?可不可以用第一种啊,因为比较方便,我只是想比较特征选择算法好坏
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yuanmd

至尊木虫 (知名作家)

衔头义定自


小木虫: 金币+0.5, 给个红包,谢谢回帖
然后进行交叉验证  这句话没弄懂。其实很多多特征选择算法也用 grid 方法,虽然不太合理。

发自小木虫Android客户端
梦想总是要有的,万一实现了呢?
3楼2017-01-12 10:03:48
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 15 个回答

yulin2016

新虫 (小有名气)

引用回帖:
3楼: Originally posted by yuanmd at 2017-01-12 10:03:48
然后进行交叉验证  这句话没弄懂。其实很多多特征选择算法也用 grid 方法,虽然不太合理。

重新问一下,特征选择算法是只用在训练集上,还是在没有划分训练集和测试集之前作用在原始数据集上?还是两种都可以?另外,您说的那个grid方法我也不太理解,您是做特征选择的吗?
4楼2017-01-12 10:13:44
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yulin2016

新虫 (小有名气)

引用回帖:
3楼: Originally posted by yuanmd at 2017-01-12 10:03:48
然后进行交叉验证  这句话没弄懂。其实很多多特征选择算法也用 grid 方法,虽然不太合理。

因为我是做互信息特征选择,不是lasso的
5楼2017-01-12 10:14:59
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yuanmd

至尊木虫 (知名作家)

衔头义定自


小木虫: 金币+0.5, 给个红包,谢谢回帖
引用回帖:
4楼: Originally posted by yulin2016 at 2017-01-12 10:13:44
重新问一下,特征选择算法是只用在训练集上,还是在没有划分训练集和测试集之前作用在原始数据集上?还是两种都可以?另外,您说的那个grid方法我也不太理解,您是做特征选择的吗?...

看你做分类还是聚类,聚类的话不用拆分数据,分类的话就需要分为测试和训练。

发自小木虫Android客户端
梦想总是要有的,万一实现了呢?
6楼2017-01-12 11:34:30
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见