24小时热门版块排行榜    

查看: 2291  |  回复: 5

昼夜星雨

新虫 (初入文坛)

[求助] 为什么利用svm进行分类的时候进行特征提取的结果比没有特征提取还要差呢? 已有1人参与

对于数据集进行预处理时,尝试了SVM-RFE,FFT,小波分解与重构,小波包分解与重构,小波包提取能量和方差。参数寻优时尝试了网格寻优,粒子群等方法。求指导?是提取方式不对吗?
      我是规范化之后进行的特征提取,特征提取完再进行分类。
     是利用svm基于TEP过程的数据集进行的故障诊断,对于故障进行分类。
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

feixiaolin

荣誉版主 (文坛精英)

优秀版主

特征选择是否准确。可考虑多特征多级svm。
2楼2013-12-10 21:53:17
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

昼夜星雨

新虫 (初入文坛)

引用回帖:
2楼: Originally posted by feixiaolin at 2013-12-10 21:53:17
特征选择是否准确。可考虑多特征多级svm。

关键就是如何确定提取哪种特征对于当前数据集的分类最有利呢?
我使用的是libsvm,直接进行的多分类。多级svm是指二叉树形式,每级相当于进行2分类是吗?我需要分20类,可以解决这个问题么?
3楼2013-12-10 23:58:24
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

feixiaolin

荣誉版主 (文坛精英)

优秀版主

引用回帖:
3楼: Originally posted by 昼夜星雨 at 2013-12-10 23:58:24
关键就是如何确定提取哪种特征对于当前数据集的分类最有利呢?
我使用的是libsvm,直接进行的多分类。多级svm是指二叉树形式,每级相当于进行2分类是吗?我需要分20类,可以解决这个问题么?...

每级只是相当于进行2分类,因为树形会“走偏”
我需要分20类,我曾用到10类,从推理上讲,可以分20类。
4楼2013-12-11 07:25:34
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

nwaxe

金虫 (小有名气)

【答案】应助回帖

感谢参与,应助指数 +1
这个问题可以理解。 我觉得关键点在于你提取的特征,如果你用线性SVM, 这考虑你提取的特征在线性情况下是否可分性较好。举个例子:
你的原始特征是图像的像素点,可能在原始空间(假设线性空间),你的样本可分性还可以,用线性SVM还是可以取得不错的分类效果。当你对图像提取的协方差矩阵特征时,协方差矩阵特征是黎曼空间(非线性空间),这时候用线性SVM基本是不可分的,所以可能要考虑核的SVM。
因此,建议您两个策略:
1. 提取特征时考虑特征的属性,实在不行的话,可以用降维的方法对特征降维试试。
2. 用基于核的SVM试试。
另,libSVM 解决20类问题绰绰有余,我试过百类以上的,是没问题的。加油,祝好。
5楼2013-12-13 11:45:27
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

aini1990

新虫 (初入文坛)

引用回帖:
5楼: Originally posted by nwaxe at 2013-12-13 11:45:27
这个问题可以理解。 我觉得关键点在于你提取的特征,如果你用线性SVM, 这考虑你提取的特征在线性情况下是否可分性较好。举个例子:
你的原始特征是图像的像素点,可能在原始空间(假设线性空间),你的样本可分性还 ...

最近在用svm做多分类,遇到了一些问题不是很能理解,多分类需要改原来的的svm代码吗?我需要每个类别输出一个准确率,召回率,但是调用原来的代码时最终只输出一个准确率和召回率。
6楼2014-11-21 11:26:13
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 昼夜星雨 的主题更新
信息提示
请填处理意见