24小时热门版块排行榜    

查看: 4205  |  回复: 14

iverson闫

木虫 (初入文坛)

[求助] 支持向量机分类精度和样本数量大小的关系

1.对于机器学习,一般来说,样本数量越大训练出来的分类器分类正确率越高。
可是支持向量机对于大样本分类效率下降,占用内存高。这会不会影响到支持向量机对样本数量多时的准确率?
相同实验环境下,会不会产生200个样本训练出来的SVM要优于600个样本训练出来的SVM这种情况,还是一定是1000个样本训练结果好于800的好于600的?

2.对于这个问题,我用陆振波教授的工具箱在UCI数据集tic-tac-toe上做了模拟实验,结果显示200数据量训练出来的SVM最好,优于 900数据量训练出来的SVM,优于600数据量训练出来的SVM。
这是为什么?难道真的是支持向量机相当于只有一个神经元而记不住太大数据?还是我实验过程中产生了错误?还是我的参数设置不对?

以上两个问题,跪求大神解答!
回复此楼

» 猜你喜欢

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
回帖支持 ( 显示支持度最高的前 50 名 )

hua_007

铜虫 (小有名气)

【答案】应助回帖

★ ★
感谢参与,应助指数 +1
webbery: 金币+2, 感谢经验分享 2013-03-19 07:52:37
svm的特点是针对小样本,样本太多的时间容易产生“过拟合”的情况。
这种情况下,不一定比ann效果好啊。
江湖
3楼2013-03-16 23:14:19
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhangQX23

金虫 (小有名气)

【答案】应助回帖

★ ★
感谢参与,应助指数 +1
webbery: 金币+2, 感谢经验分享 2013-03-19 07:52:55
有一个问题我的觉得需要注意,不是样本个数越多就越好,而且是说样本所包含的信息越多越大,也就是在符合相应关系的前提下,样本的差异性越大越大,这样拟合的越准确。200个样本,所包含的信息以足够多,再加入另外i400个样本,只会使信息重复,从而掩盖那些相比比较少的信息,形成过拟合。
看别人的幸福,过自己的生活
6楼2013-03-17 16:19:15
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

orcimbalance

木虫 (著名写手)

【答案】应助回帖

★ ★
感谢参与,应助指数 +1
webbery: 金币+2, 感谢经验分享 2013-03-19 07:54:21
样本越大只是使SVM的训练速度变慢,不是说样本越大越容易导致精确度下降,像你这种情况可能是数据量增大,导致数据偏斜,从而使学习得到的分类器产生了误差。前面好多同学说到,过拟合问题,其实SVM是很完美的解决了过拟合问题的,在SVM的优化过程中,其实已经加了入了惩罚变量C来解决过拟合问题,通过对训练样本几倍交叉验证来调节C及不同核函数的相关参数,也就是说训练样本中经过这个过程,产生的支持向量有的在超平(曲)面上,有的在两个超平(曲)面之间,后者就是为了解决过拟合而“牺牲”掉的。总之,我觉得是你的训练样本增大,然后其中一部分类别数量大幅增加,而存在另一部分的类随着样本数量增加而变化不大,即随着加入大量数据产生的数据偏斜问题。
8楼2013-03-17 21:05:01
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通回帖
2楼2013-03-16 21:28:41
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

iverson闫

木虫 (初入文坛)

引用回帖:
3楼: Originally posted by hua_007 at 2013-03-16 23:14:19
svm的特点是针对小样本,样本太多的时间容易产生“过拟合”的情况。
这种情况下,不一定比ann效果好啊。

我知道这个问题。那支持向量机对于2000内的样本还是不是样本数量越多分类效果越好呢?总趋势来看。
4楼2013-03-17 11:10:06
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yuanruiju

铁虫 (小有名气)

【答案】应助回帖

感谢参与,应助指数 +1
支持一下。都是高科级东东,路过。
在路上
5楼2013-03-17 11:20:28
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

liuzhi388

禁虫 (正式写手)

感谢参与,应助指数 +1
本帖内容被屏蔽

7楼2013-03-17 17:05:04
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
9楼2013-03-18 00:08:33
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
10楼2013-03-18 11:25:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 iverson闫 的主题更新
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[考研] 本人考085602 化学工程 专硕 +9 不知道叫什么! 2026-03-15 10/500 2026-03-16 10:04 by houyaoxu
[考研] 085600材料与化工 求调剂 +12 enenenhui 2026-03-13 13/650 2026-03-16 08:30 by Linda Hu
[基金申请] NSFC申报书里申请人简历中代表性论著还需要在申报书最后的附件里面再上传一遍吗 20+5 NSFC2026我来了 2026-03-10 14/700 2026-03-15 23:53 by 不负韶华的虎
[考研] 化学调剂0703 +7 啊我我的 2026-03-11 7/350 2026-03-15 23:03 by 凌千颂111
[考研] 梁成伟老师课题组欢迎你的加入 +6 一鸭鸭哟 2026-03-14 7/350 2026-03-15 22:12 by Winj1e
[考研] 290求调剂 +4 @将就将就看 2026-03-10 8/400 2026-03-14 14:23 by 千千运气
[考研] 333求调剂 +3 球球古力 2026-03-09 3/150 2026-03-14 01:57 by JourneyLucky
[考研] 材料工程,326分,求调剂 +6 KRSLSR 2026-03-10 6/300 2026-03-13 23:47 by JourneyLucky
[考研] 复试调剂 +9 Copy267 2026-03-10 9/450 2026-03-13 23:45 by userper
[考研] 285 求调剂 资源与环境 一志愿北京化工大学 +3 未名考生 2026-03-10 3/150 2026-03-13 23:04 by JourneyLucky
[考研] 材料与化工304求B区调剂 +5 邱gl 2026-03-11 6/300 2026-03-13 22:37 by JourneyLucky
[考研] 0703,333分求调剂 一志愿郑州大学-物理化学 +3 李魔女斗篷 2026-03-11 3/150 2026-03-13 22:24 by JourneyLucky
[考研] 材料与化工求调剂一志愿 985 总分 295 +8 dream…… 2026-03-12 8/400 2026-03-13 22:17 by 星空星月
[考研] 求材料调剂 085600英一数二总分302 前三科235 精通机器学习 一志愿哈工大 +4 林yaxin 2026-03-12 4/200 2026-03-13 22:04 by 星空星月
[考研] 材料与化工085600调剂求老师收留 +9 jiaanl 2026-03-11 9/450 2026-03-13 20:22 by JourneyLucky
[考研] 材料工程调剂 +4 咪咪空空 2026-03-11 4/200 2026-03-13 19:57 by JourneyLucky
[考研] 314求调剂 +7 无懈可击的巨人 2026-03-12 7/350 2026-03-13 15:40 by JourneyLucky
[考研] 304求调剂(085602一志愿985) +12 化工人999 2026-03-09 12/600 2026-03-13 12:02 by JourneyLucky
[考研] 277求调剂 +4 anchor17 2026-03-12 4/200 2026-03-13 11:15 by 白夜悠长
[基金申请] 提交后的基金本子,已让学校撤回了,可否换口子提交 +3 dut_pfx 2026-03-10 3/150 2026-03-11 08:38 by kudofaye
信息提示
请填处理意见