24小时热门版块排行榜    

CyRhmU.jpeg
查看: 2052  |  回复: 8
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

prettyfarmer

新虫 (初入文坛)


[交流] 对声音信号在svm里识别,识别率能达到100%,这样的结果正常么?

最近在对一维信号识别,包括声音信号
后期分类识别使用的是libSVM,发现识别效果都很高,基本上98%以上。
有一些识别率低的,对训练数据人工选取和对svm参数寻优调整后,也能上升到90%-100%。
这样的结果正常么? 会不会太高了
本人用的测试数据是和训练数据不同的。
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

» 抢金币啦!回帖就可以得到:

查看全部散金贴

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

chentianyu1

木虫 (小有名气)


★ ★ ★
prettyfarmer(金币+1): 谢谢参与
prettyfarmer: 金币+2 2012-12-08 13:24:38
判断方法很简单,拿一组真实的数据,用你训练出的模型分类一下,如果依然正确率很高,那么就没问题了。
可能存在的问题是,你数据本身的类内误差很小、类间误差很大,或者测试集与训练集太接近。
举例来说,假设是根据输入的声音文件分析场景,一个场景是卧室,另一个场景是街道,这个通过分贝平均值的特征进行分类显然正确率99%以上很正常,这就属于数据本身类内误差小类间误差大,出现这种情况可能说明你的分类问题很简单,或者你为某个较难的分类问题找到了很好的描述特征。
同样是这个声音分析场景的问题,假如你要通过声音数据区分会议室和化学实验室,这个显然分类效果应该比较差。但是,如果你采集的数据中会议室都是女性讲话的声音,实验室都是男性讲话的声音,则问题退化为男声女声分类,使用声音平均频率作为特征值,也很可能正确率超过90%。然而,这时候你重新采集另外一组会议室、实验室的声音测试,就会发现这个分类器完全不适用,这就是由你的测试集与训练集太接近造成的。
2楼2012-12-07 16:14:58
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 prettyfarmer 的主题更新
普通表情 高级回复(可上传附件)
信息提示
请填处理意见