| 查看: 3878 | 回复: 14 | |||
[求助]
支持向量机分类精度和样本数量大小的关系
|
|||
|
1.对于机器学习,一般来说,样本数量越大训练出来的分类器分类正确率越高。 可是支持向量机对于大样本分类效率下降,占用内存高。这会不会影响到支持向量机对样本数量多时的准确率? 相同实验环境下,会不会产生200个样本训练出来的SVM要优于600个样本训练出来的SVM这种情况,还是一定是1000个样本训练结果好于800的好于600的? 2.对于这个问题,我用陆振波教授的工具箱在UCI数据集tic-tac-toe上做了模拟实验,结果显示200数据量训练出来的SVM最好,优于 900数据量训练出来的SVM,优于600数据量训练出来的SVM。 这是为什么?难道真的是支持向量机相当于只有一个神经元而记不住太大数据?还是我实验过程中产生了错误?还是我的参数设置不对? 以上两个问题,跪求大神解答! |
» 猜你喜欢
到新单位后,换了新的研究方向,没有团队,持续积累2区以上论文,能申请到面上吗
已经有7人回复
申请2026年博士
已经有5人回复
天津工业大学郑柳春团队欢迎化学化工、高分子化学或有机合成方向的博士生和硕士生加入
已经有5人回复
寻求一种能扛住强氧化性腐蚀性的容器密封件
已经有6人回复
2025冷门绝学什么时候出结果
已经有7人回复
请问有评职称,把科研教学业绩算分排序的高校吗
已经有6人回复
Bioresource Technology期刊,第一次返修的时候被退回好几次了
已经有7人回复
请问哪里可以有青B申请的本子可以借鉴一下。
已经有4人回复
请问下大家为什么这个铃木偶联几乎不反应呢
已经有5人回复
康复大学泰山学者周祺惠团队招收博士研究生
已经有6人回复

3楼2013-03-16 23:14:19
zhangQX23
金虫 (小有名气)
- 应助: 3 (幼儿园)
- 金币: 1344.6
- 散金: 122
- 帖子: 181
- 在线: 117.5小时
- 虫号: 804671
- 注册: 2009-07-07
- 性别: MM
- 专业: 光谱技术

6楼2013-03-17 16:19:15
orcimbalance
木虫 (著名写手)
- 应助: 22 (小学生)
- 金币: 2057.1
- 散金: 937
- 红花: 3
- 帖子: 1306
- 在线: 428.9小时
- 虫号: 1401449
- 注册: 2011-09-14
- 性别: GG
- 专业: 计算机体系结构
【答案】应助回帖
★ ★
感谢参与,应助指数 +1
webbery: 金币+2, 感谢经验分享 2013-03-19 07:54:21
感谢参与,应助指数 +1
webbery: 金币+2, 感谢经验分享 2013-03-19 07:54:21
| 样本越大只是使SVM的训练速度变慢,不是说样本越大越容易导致精确度下降,像你这种情况可能是数据量增大,导致数据偏斜,从而使学习得到的分类器产生了误差。前面好多同学说到,过拟合问题,其实SVM是很完美的解决了过拟合问题的,在SVM的优化过程中,其实已经加了入了惩罚变量C来解决过拟合问题,通过对训练样本几倍交叉验证来调节C及不同核函数的相关参数,也就是说训练样本中经过这个过程,产生的支持向量有的在超平(曲)面上,有的在两个超平(曲)面之间,后者就是为了解决过拟合而“牺牲”掉的。总之,我觉得是你的训练样本增大,然后其中一部分类别数量大幅增加,而存在另一部分的类随着样本数量增加而变化不大,即随着加入大量数据产生的数据偏斜问题。 |
8楼2013-03-17 21:05:01
![]() |
2楼2013-03-16 21:28:41
4楼2013-03-17 11:10:06

5楼2013-03-17 11:20:28
感谢参与,应助指数 +1
|
本帖内容被屏蔽 |
7楼2013-03-17 17:05:04
![]() |
9楼2013-03-18 00:08:33
![]() |
10楼2013-03-18 11:25:50













回复此楼


