做特征选择时,特征需要归一化么?
请问:做特征选择时,特征需要归一化么?比如要用稀疏表示之类的构造Laplacian图。
一般情况下,在用稀疏表示构图进行谱聚类时,数据应该是要归一化的。
现在我想,在做特征选择时是否也需要归一化?
采用何种何一化呢?有以下几种情况:
1) 若尺度一致,比如人脸图像,是不是可以进行样本归一化?或者是除以256?
2)若尺度可能不一致,是否应该采用特征归一化(或者说采用f-min(f)/(max(f)-min(f)))?
找到相应的特征排序后,是提取原始特征还是归一化的特征做聚类?
恳请大家不吝赐教!~感谢!~~ 返回小木虫查看更多
今日热帖
自己顶一下,不要沉了~~~~
不管尺度是否一致,一般都要归一化。 归一化不光是因为尺度不一致问题,还有优化计算时候的问题。
归一化的方式很多, 常见的有除以和,L1,L2归一化, zero mean unit variance等。
楼主可以对比一下归一化和不归一化的效果,看看那个好。 毕竟不是所有问题答案都一样。
感谢 ,我就是看到有人做了归一化,有人没有做归一化,都不知道该如何选择了~~~~
,
这个是由于很多人数据的来源不同的。因为有些人用的数据已经是别人处理过的,所以这部分normalization没有提到
通常建议归一化。一个是千米单位,一个毫米,你不归一化,怎么知道两个因素对结果的影响大小?归一化后,可以有效规避这类问题