24小时热门版块排行榜    

查看: 2136  |  回复: 42
当前主题已经存档。
【有奖交流】积极回复本帖子,参与交流,就有机会分得作者 damojinghong 的 470 个金币

maxiangl2007

木虫 (正式写手)

★ ★ ★
damojinghong(金币+3,VIP+0):很是遗憾 1-20 15:44
曾经用SVM做过识别,唉,完全是外行,pattern characterization看了一遍就全忘了。
现在太难拾起来了。
31楼2010-01-16 10:08:59
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

亲核取代

铁杆木虫 (知名作家)

好专业呀,这个问题嘛,不是这几个金币能解决的,建议发重金悬赏,不然某人是不会发话的
32楼2010-01-16 11:19:07
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wolfpl

木虫 (小有名气)

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ...
adu886886(金币+1,VIP+0):谢谢提供意见 1-16 15:48
damojinghong(金币+100,VIP+0):多谢朋友细心讲解,希望以后能向您请教! 1-20 16:06
实现SVM的工具有很多,如LIBSVM,SVMlight,SimpleSVM....具体可以参考http://en.wikipedia.org/wiki/Support_vector_machine中的介绍。不过本人认为其中Libsvm是一个操作简单、易于使用、快速有效的通用SVM 软件包,它是台湾大学林智仁(Chih-Jen Lin)博士等开发设计的,他的主页:http://www.csie.ntu.edu.tw/~cjlin/index.html,上面有很多关于libsvm的资料、工具和示例数据。
SVM的原理部分看看一两篇文章就能明白,其中中文文献张学工老师的文章觉得很不错;外文文献当然就看vapnik他老人家的呢。
具体LIBSVM的使用可以参考如下文章 http://luzhenbo.88uu.com.cn/Inte ... roduction_study.htm,或者参考下载的libsvm包里readme.txt,都有详细的使用说明。

SVM的训练预测过程可以简单的归纳为以下几个过程:

   1. 收集数据。相关性分析(p卡方检验),特征选择(主成份分析)。
   2. 归一化数据。就是根据实际要求,将数据的取值范围转化为统一的区间如[a,b],a,b为整数。
   3. 利用抽样技术将数据集分为训练集和测试集。抽样技术有分层抽样,简单抽样(等概率抽样)
   4. 将数据转化为软件(接口)所支持的格式。就libsvm(c++,java)来说,需要将数据转化为libsvmm所要求的格式。
   5. 选择核函数,可以优先考虑RBF。
   6. 对训练集利用交叉验证法选择最好的参数C和r(rbf核函数中的参数gama)。可以通过网格法寻找出最优的参数,注意一次交叉验证得到一个参数对所对应的模型精度,网格法目的就是找到使得模型精度达到对高的参数对(这里的参数对可能不止两个,有可能也有其他的),可以使用一些启发式的搜索来降低复杂度,虽然这个方法笨了点,但是它能得到很稳定的搜索结果。需要提到的这里在对训练集进行分割的时候涉及到抽样,一个较好的方法就是分层抽样。从这步可以看出其实 Cross-Validation是一种评估算法的方法。
   7. 用6中得到的参数对在整个训练集合上进行训练,从而得出模型。
   8. 利用测试集测试模型,得到精度。这个精度可以认为是模型最终的精度。当然有人会担心3步中抽样会有一定的误差,导致8得到的精度不一定是最好的,因此可以重复3-8得到多个模型的精度,然后选择最好的一个精度最为模型的精度(或者求所有精度的均值做为模型精度)。

你上面提到虽然采用rbf核函数,但预测精度还是比较低,可能就是没有做第6步,选择最好的参数gama

[ Last edited by wolfpl on 2010-1-16 at 12:53 ]
33楼2010-01-16 12:50:17
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xksong1982

铁杆木虫 (职业作家)


nono2009(金币-1,VIP+0):专业版请勿灌水! 1-16 13:22
帮忙顶一下
34楼2010-01-16 12:56:33
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

bamboorong

铁虫 (小有名气)

★ ★
adu886886(金币-2,VIP+0):专业版请勿灌水,谢谢合作 1-16 20:14
我帮你顶下吧
35楼2010-01-16 14:40:03
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wuyong5588

铁杆木虫 (正式写手)

★ ★
adu886886(金币-2,VIP+0):专业版请勿灌水,谢谢合作 1-16 20:14
怎么都不一样啊!
36楼2010-01-16 15:21:56
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

rgqsl

木虫 (正式写手)

★ ★
adu886886(金币-2,VIP+0):专业版请勿灌水,谢谢合作 1-16 20:14
有些专业,看不太懂
37楼2010-01-16 15:26:41
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

fuhuo

木虫 (小有名气)

★ ★
adu886886(金币-2,VIP+0):专业版请勿灌水,谢谢合作 1-16 20:15
专业性太强,帮你顶下
38楼2010-01-16 19:29:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

denghblzu9237

银虫 (正式写手)

★ ★
damojinghong(金币+2,VIP+0):再多讲点就好了 1-20 15:51
libsvm 是最常用的支持向量机源码之一。

[ Last edited by denghblzu9237 on 2010-1-16 at 22:52 ]
39楼2010-01-16 22:51:34
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

南国紫藤

银虫 (著名写手)

★ ★ ★
damojinghong(金币+3,VIP+0):多谢 1-20 15:51
曾经用SVM做过识别,唉,完全是外行,pattern characterization看了一遍就全忘了。
现在太难拾起来了。
40楼2010-01-17 10:10:51
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 damojinghong 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见