24小时热门版块排行榜    

CyRhmU.jpeg
查看: 3883  |  回复: 14
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

iverson闫

木虫 (初入文坛)

[求助] 支持向量机分类精度和样本数量大小的关系

1.对于机器学习,一般来说,样本数量越大训练出来的分类器分类正确率越高。
可是支持向量机对于大样本分类效率下降,占用内存高。这会不会影响到支持向量机对样本数量多时的准确率?
相同实验环境下,会不会产生200个样本训练出来的SVM要优于600个样本训练出来的SVM这种情况,还是一定是1000个样本训练结果好于800的好于600的?

2.对于这个问题,我用陆振波教授的工具箱在UCI数据集tic-tac-toe上做了模拟实验,结果显示200数据量训练出来的SVM最好,优于 900数据量训练出来的SVM,优于600数据量训练出来的SVM。
这是为什么?难道真的是支持向量机相当于只有一个神经元而记不住太大数据?还是我实验过程中产生了错误?还是我的参数设置不对?

以上两个问题,跪求大神解答!
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hua_007

铜虫 (小有名气)

【答案】应助回帖

★ ★
感谢参与,应助指数 +1
webbery: 金币+2, 感谢经验分享 2013-03-19 07:52:37
svm的特点是针对小样本,样本太多的时间容易产生“过拟合”的情况。
这种情况下,不一定比ann效果好啊。
江湖
3楼2013-03-16 23:14:19
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 15 个回答

iverson闫

木虫 (初入文坛)

引用回帖:
3楼: Originally posted by hua_007 at 2013-03-16 23:14:19
svm的特点是针对小样本,样本太多的时间容易产生“过拟合”的情况。
这种情况下,不一定比ann效果好啊。

我知道这个问题。那支持向量机对于2000内的样本还是不是样本数量越多分类效果越好呢?总趋势来看。
4楼2013-03-17 11:10:06
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yuanruiju

铁虫 (小有名气)

【答案】应助回帖

感谢参与,应助指数 +1
支持一下。都是高科级东东,路过。
在路上
5楼2013-03-17 11:20:28
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangQX23

金虫 (小有名气)

【答案】应助回帖

★ ★
感谢参与,应助指数 +1
webbery: 金币+2, 感谢经验分享 2013-03-19 07:52:55
有一个问题我的觉得需要注意,不是样本个数越多就越好,而且是说样本所包含的信息越多越大,也就是在符合相应关系的前提下,样本的差异性越大越大,这样拟合的越准确。200个样本,所包含的信息以足够多,再加入另外i400个样本,只会使信息重复,从而掩盖那些相比比较少的信息,形成过拟合。
看别人的幸福,过自己的生活
6楼2013-03-17 16:19:15
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
信息提示
请填处理意见