24小时热门版块排行榜    

查看: 1216  |  回复: 14

yulin2016

新虫 (小有名气)

[交流] 特征选择中的交叉验证 已有2人参与

急急急!有一个疑问,现在有一个数据,对数据做特征选择!有两种做法:1 对全部数据进行不同的特征选择算法,然后进行交叉验证 2 先把数据集分成训练集和测试集,然后对每一组训练集进行不同特征选择算法,再进行建模  哪种方法好啊?可不可以用第一种啊,因为比较方便,我只是想比较特征选择算法好坏
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yulin2016

新虫 (小有名气)

2楼2017-01-12 09:40:46
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yuanmd

至尊木虫 (知名作家)

衔头义定自


小木虫: 金币+0.5, 给个红包,谢谢回帖
然后进行交叉验证  这句话没弄懂。其实很多多特征选择算法也用 grid 方法,虽然不太合理。

发自小木虫Android客户端
梦想总是要有的,万一实现了呢?
3楼2017-01-12 10:03:48
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yulin2016

新虫 (小有名气)

引用回帖:
3楼: Originally posted by yuanmd at 2017-01-12 10:03:48
然后进行交叉验证  这句话没弄懂。其实很多多特征选择算法也用 grid 方法,虽然不太合理。

重新问一下,特征选择算法是只用在训练集上,还是在没有划分训练集和测试集之前作用在原始数据集上?还是两种都可以?另外,您说的那个grid方法我也不太理解,您是做特征选择的吗?
4楼2017-01-12 10:13:44
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yulin2016

新虫 (小有名气)

引用回帖:
3楼: Originally posted by yuanmd at 2017-01-12 10:03:48
然后进行交叉验证  这句话没弄懂。其实很多多特征选择算法也用 grid 方法,虽然不太合理。

因为我是做互信息特征选择,不是lasso的
5楼2017-01-12 10:14:59
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yuanmd

至尊木虫 (知名作家)

衔头义定自


小木虫: 金币+0.5, 给个红包,谢谢回帖
引用回帖:
4楼: Originally posted by yulin2016 at 2017-01-12 10:13:44
重新问一下,特征选择算法是只用在训练集上,还是在没有划分训练集和测试集之前作用在原始数据集上?还是两种都可以?另外,您说的那个grid方法我也不太理解,您是做特征选择的吗?...

看你做分类还是聚类,聚类的话不用拆分数据,分类的话就需要分为测试和训练。

发自小木虫Android客户端
梦想总是要有的,万一实现了呢?
6楼2017-01-12 11:34:30
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yulin2016

新虫 (小有名气)

引用回帖:
6楼: Originally posted by yuanmd at 2017-01-12 11:34:30
看你做分类还是聚类,聚类的话不用拆分数据,分类的话就需要分为测试和训练。
...

分类啊,但是我问师兄,他说他就没拆,在论文里说清楚了就行!因为没拆跑数据比较快,不知道对不对
7楼2017-01-12 11:40:28
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yuanmd

至尊木虫 (知名作家)

衔头义定自


小木虫: 金币+0.5, 给个红包,谢谢回帖
引用回帖:
5楼: Originally posted by yulin2016 at 2017-01-12 10:14:59
因为我是做互信息特征选择,不是lasso的...

基于互信息的我不太清楚,我只了解基于稀疏表示的。

发自小木虫Android客户端
梦想总是要有的,万一实现了呢?
8楼2017-01-12 13:17:39
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yuanmd

至尊木虫 (知名作家)

衔头义定自

引用回帖:
7楼: Originally posted by yulin2016 at 2017-01-12 11:40:28
分类啊,但是我问师兄,他说他就没拆,在论文里说清楚了就行!因为没拆跑数据比较快,不知道对不对...

没拆?选出来后再分训练和测试吗?

发自小木虫Android客户端
梦想总是要有的,万一实现了呢?
9楼2017-01-12 13:18:18
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yuanmd

至尊木虫 (知名作家)

衔头义定自


小木虫: 金币+0.5, 给个红包,谢谢回帖
引用回帖:
4楼: Originally posted by yulin2016 at 2017-01-12 10:13:44
重新问一下,特征选择算法是只用在训练集上,还是在没有划分训练集和测试集之前作用在原始数据集上?还是两种都可以?另外,您说的那个grid方法我也不太理解,您是做特征选择的吗?...

我只是看过一段时间的特征选择,聚类倒是全部训练,分类感觉只能在训练数据上进行吧?

发自小木虫Android客户端
梦想总是要有的,万一实现了呢?
10楼2017-01-12 13:19:59
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 yulin2016 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见