当前位置: 首页 > 论文投稿 >特征选择中的交叉验证

特征选择中的交叉验证

作者 yulin2016
来源: 小木虫 700 14 举报帖子
+关注

急急急!有一个疑问,现在有一个数据,对数据做特征选择!有两种做法:1 对全部数据进行不同的特征选择算法,然后进行交叉验证 2 先把数据集分成训练集和测试集,然后对每一组训练集进行不同特征选择算法,再进行建模  哪种方法好啊?可不可以用第一种啊,因为比较方便,我只是想比较特征选择算法好坏 返回小木虫查看更多

今日热帖
  • 精华评论
  • yuanmd

    然后进行交叉验证  这句话没弄懂。其实很多多特征选择算法也用 grid 方法,虽然不太合理。

  • yulin2016

    引用回帖:
    3楼: Originally posted by yuanmd at 2017-01-12 10:03:48
    然后进行交叉验证  这句话没弄懂。其实很多多特征选择算法也用 grid 方法,虽然不太合理。

    重新问一下,特征选择算法是只用在训练集上,还是在没有划分训练集和测试集之前作用在原始数据集上?还是两种都可以?另外,您说的那个grid方法我也不太理解,您是做特征选择的吗

  • yulin2016

    引用回帖:
    3楼: Originally posted by yuanmd at 2017-01-12 10:03:48
    然后进行交叉验证  这句话没弄懂。其实很多多特征选择算法也用 grid 方法,虽然不太合理。

    因为我是做互信息特征选择,不是lasso的

  • yulin2016

    引用回帖:
    6楼: Originally posted by yuanmd at 2017-01-12 11:34:30
    看你做分类还是聚类,聚类的话不用拆分数据,分类的话就需要分为测试和训练。
    ...

    分类啊,但是我问师兄,他说他就没拆,在论文里说清楚了就行!因为没拆跑数据比较快,不知道对不对

猜你喜欢
下载小木虫APP
与700万科研达人随时交流
  • 二维码
  • IOS
  • 安卓