版块导航: 正在加载中...

登录注册

应《网络安全法》要求，自2017年10月1日起，未进行实名认证将不得使用互联网跟帖服务。为保障您的帐号能够正常使用，请尽快对帐号进行手机号验证，感谢您的理解与支持！

24小时热门版块排行榜

>论坛更新日志 (3693)
>文献求助 (414)
>导师招生 (300)
>虫友互识 (245)
>考博 (133)
>基金申请 (123)
>论文投稿 (111)
>招聘信息布告栏 (109)
>硕博家园 (109)
>考研 (101)
>休闲灌水 (95)
>博后之家 (58)
>教师之家 (48)
>论文道贺祈福 (33)
>物理 (33)
>找工作 (30)

返回列表

iverson闫

木虫 (初入文坛)

应助: 0 (幼儿园)
金币: 6922.5
帖子: 29
在线: 12.2小时
虫号: 1092229
注册: 2010-09-07
专业: 管理科学与工程

[求助] 支持向量机分类精度和样本数量大小的关系

1.对于机器学习，一般来说，样本数量越大训练出来的分类器分类正确率越高。
可是支持向量机对于大样本分类效率下降，占用内存高。这会不会影响到支持向量机对样本数量多时的准确率？
相同实验环境下，会不会产生200个样本训练出来的SVM要优于600个样本训练出来的SVM这种情况，还是一定是1000个样本训练结果好于800的好于600的？

2.对于这个问题，我用陆振波教授的工具箱在UCI数据集tic-tac-toe上做了模拟实验，结果显示200数据量训练出来的SVM最好，优于 900数据量训练出来的SVM，优于600数据量训练出来的SVM。
这是为什么？难道真的是支持向量机相当于只有一个神经元而记不住太大数据？还是我实验过程中产生了错误？还是我的参数设置不对？

以上两个问题，跪求大神解答！

回复此楼

» 猜你喜欢

又一批高校组建人工智能学院师资行吗不是骗人吗已经有7人回复
国自然面上和省基金B类撒花已经有18人回复
有没有学校收留已经有3人回复
312求调剂已经有3人回复
华师大读博已经有5人回复
急需审稿人！！！已经有3人回复
申博/考博已经有8人回复
295分求调剂已经有6人回复
085600材料与化工调剂已经有6人回复
有没有接收比较快的sci期刊呀，最好在一个月之内的，研三孩子求毕业已经有7人回复

1楼 2013-03-16 16:45:03

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

回帖支持 ( 显示支持度最高的前 50 名 )

hua_007

铜虫 (小有名气)

应助: 6 (幼儿园)
金币: 228.6
帖子: 135
在线: 30.9小时
虫号: 728476
注册: 2009-03-22
性别: GG
专业: 模式识别

【答案】应助回帖

★ ★
感谢参与，应助指数 +1
webbery: 金币+2, 感谢经验分享 2013-03-19 07:52:37

svm的特点是针对小样本，样本太多的时间容易产生“过拟合”的情况。
这种情况下，不一定比ann效果好啊。

赞一下(3人)

回复此楼

江湖

3楼2013-03-16 23:14:19

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

zhangQX23

金虫 (小有名气)

应助: 3 (幼儿园)
金币: 1344.6
散金: 122
帖子: 181
在线: 117.5小时
虫号: 804671
注册: 2009-07-07
性别: MM
专业: 光谱技术

【答案】应助回帖

★ ★
感谢参与，应助指数 +1
webbery: 金币+2, 感谢经验分享 2013-03-19 07:52:55

有一个问题我的觉得需要注意，不是样本个数越多就越好，而且是说样本所包含的信息越多越大，也就是在符合相应关系的前提下，样本的差异性越大越大，这样拟合的越准确。200个样本，所包含的信息以足够多，再加入另外i400个样本，只会使信息重复，从而掩盖那些相比比较少的信息，形成过拟合。

赞一下(2人)

回复此楼

看别人的幸福，过自己的生活

6楼2013-03-17 16:19:15

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

orcimbalance

木虫 (著名写手)

应助: 22 (小学生)
金币: 2057.1
散金: 937
红花: 3
帖子: 1306
在线: 428.9小时
虫号: 1401449
注册: 2011-09-14
性别: GG
专业: 计算机体系结构

【答案】应助回帖

★ ★
感谢参与，应助指数 +1
webbery: 金币+2, 感谢经验分享 2013-03-19 07:54:21

样本越大只是使SVM的训练速度变慢，不是说样本越大越容易导致精确度下降，像你这种情况可能是数据量增大，导致数据偏斜，从而使学习得到的分类器产生了误差。前面好多同学说到，过拟合问题，其实SVM是很完美的解决了过拟合问题的，在SVM的优化过程中，其实已经加了入了惩罚变量C来解决过拟合问题，通过对训练样本几倍交叉验证来调节C及不同核函数的相关参数，也就是说训练样本中经过这个过程，产生的支持向量有的在超平（曲）面上，有的在两个超平（曲）面之间，后者就是为了解决过拟合而“牺牲”掉的。总之，我觉得是你的训练样本增大，然后其中一部分类别数量大幅增加，而存在另一部分的类随着样本数量增加而变化不大，即随着加入大量数据产生的数据偏斜问题。

赞一下(1人)

回复此楼

8楼2013-03-17 21:05:01

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

普通回帖

icdmse

2楼2013-03-16 21:28:41

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

iverson闫

木虫 (初入文坛)

应助: 0 (幼儿园)
金币: 6922.5
帖子: 29
在线: 12.2小时
虫号: 1092229
注册: 2010-09-07
专业: 管理科学与工程

引用回帖:

3楼: Originally posted by hua_007 at 2013-03-16 23:14:19
svm的特点是针对小样本，样本太多的时间容易产生“过拟合”的情况。
这种情况下，不一定比ann效果好啊。

我知道这个问题。那支持向量机对于2000内的样本还是不是样本数量越多分类效果越好呢？总趋势来看。

赞一下

回复此楼

4楼2013-03-17 11:10:06

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

yuanruiju

铁虫 (小有名气)

应助: 1 (幼儿园)
金币: 65.4
帖子: 125
在线: 11.6小时
虫号: 1741658
注册: 2012-04-07
性别: GG
专业: 金融学

【答案】应助回帖

感谢参与，应助指数 +1

支持一下。都是高科级东东，路过。

赞一下

回复此楼

在路上

5楼2013-03-17 11:20:28

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

liuzhi388

禁虫 (正式写手)

感谢参与，应助指数 +1

本帖内容被屏蔽

7楼2013-03-17 17:05:04

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

Alicezf

9楼2013-03-18 00:08:33

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

dengbiao

10楼2013-03-18 11:25:50

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

相关版块跳转我要订阅楼主 iverson闫的主题更新

返回列表

最具人气热帖推荐 [查看全部]		作者	回/看	最后发表

[教师之家] 又一批高校组建人工智能学院师资行吗不是骗人吗 +6	yexuqing 2026-04-19	7/350	2026-04-23 12:32 by yexuqing
[基金申请] 国自然面上和省基金B类撒花 +18	花田半亩～白 2026-04-21	18/900	2026-04-23 11:31 by 12021227
[考研] 有没有学校收留 +3	蒋昌鹏qtj 2026-04-20	3/150	2026-04-22 20:25 by 学员JpLReM
[考研] 312求调剂 +3	山河似你温柔 2026-04-22	3/150	2026-04-22 20:17 by 学员JpLReM
[考博] 华师大读博 +3	xq83 2026-04-22	5/250	2026-04-22 10:42 by xq83
[论文投稿] 急需审稿人！！！ +3	陆小果画大饼 2026-04-21	3/150	2026-04-21 23:54 by jzy_123456
[考博] 申博/考博 +4	啃面包的小书虫 2026-04-17	8/400	2026-04-21 16:26 by 啃面包的小书虫
[考研] 295分求调剂 +6	?要上岸? 2026-04-17	6/300	2026-04-21 08:18 by Equinoxhua
[考研] 085600材料与化工调剂 5+3	孜孜不倦2002 2026-04-19	6/300	2026-04-20 21:25 by babero
[论文投稿] 有没有接收比较快的sci期刊呀，最好在一个月之内的，研三孩子求毕业 20+4	之护着 2026-04-16	7/350	2026-04-20 15:45 by 豆豆7758
[考研] 337求调剂 +3	jyz04 2026-04-18	3/150	2026-04-20 12:24 by 研可安
[考博] 申博 +3	Xyyx. 2026-04-18	3/150	2026-04-20 10:44 by YuY66
[考博] 湖南大学刘巧玲课题组2026年第二批次博士研究生招生信息 +3	南风观火 2026-04-18	5/250	2026-04-20 10:13 by 南风观火
[考研] 294求调剂 +8	淡然654321 2026-04-17	9/450	2026-04-19 19:51 by Equinoxhua
[考研] 304求调剂 +8	castLight 2026-04-16	8/400	2026-04-19 17:14 by 中豫男
[考研] 求调剂 +6	苦命人。。。 2026-04-18	7/350	2026-04-19 16:27 by 中豫男
[考研] 接受任何调剂 +6	也就是栗子 2026-04-17	7/350	2026-04-18 17:20 by 涵竹刘
[考研] 260求调剂 +4	Zyt1314520.. 2026-04-17	5/250	2026-04-18 08:28 by babysonlkd
[有机交流] 二苯甲酮酸类衍生物 50+3	小白爱主人 2026-04-17	6/300	2026-04-17 18:47 by kf2781974
[考研] 322求调剂 +6	tekuzu 2026-04-17	6/300	2026-04-17 13:48 by Espannnnnol