24小时热门版块排行榜    

CyRhmU.jpeg
查看: 8490  |  回复: 9

ilovethis

金虫 (小有名气)

[求助] 为什么训练集的交叉验证准确率低于测试集的准确率已有1人参与

最近做了一个分类模型,训练集做10折交叉验证,准确率在60%,而测试集的准确率却达到了90%,好像不太常见,不知道原因是什么?
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zongzhiyuan

金虫 (小有名气)

【答案】应助回帖

感谢参与,应助指数 +1
如果训练集和测试集确实是不相关的话,确实不正常。换一组测试集试试?
2楼2013-01-15 15:02:36
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

漫天雕

金虫 (正式写手)

【答案】应助回帖

感谢参与,应助指数 +1
是不是分类器设计上有问题!
宝贵青春,耗不起!
3楼2013-01-16 12:47:29
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

michael.lu

金虫 (著名写手)

检查编程是否有问题。
还需努力。
4楼2013-01-17 16:01:41
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

mirage_cn

木虫 (正式写手)

【答案】应助回帖

你应当分析一下测试集和训练是否有相同的数据,如果有相同的数据且相同的数据又比较多,那自然在测试数据上的准备率会比较高!
5楼2013-01-18 15:59:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ilovethis

金虫 (小有名气)

引用回帖:
5楼: Originally posted by mirage_cn at 2013-01-18 15:59:32
你应当分析一下测试集和训练是否有相同的数据,如果有相同的数据且相同的数据又比较多,那自然在测试数据上的准备率会比较高!

没有相同的数据
6楼2013-01-18 17:40:06
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

木鸟2012

铁虫 (小有名气)

【答案】应助回帖

求教:训练集和测试集可以自己划分吗,comfa测试集用知道它们的实际活性数值吗?不胜感激啊?
努力做科研
7楼2013-02-23 17:06:01
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

youth0826

至尊木虫 (著名写手)

weibo.com/138147022

【答案】应助回帖

10-fold cv是不是太多了?考虑少一点,比如3-5
又或者将测试集和验证集反过来训练试试
QQ群:202610705,关注计算机视觉,模式识别,模式分析,机器学习,人工智能,统计学习,图像处理等,欢迎加入!
8楼2013-02-23 18:04:55
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

MathApp

新虫 (初入文坛)

【答案】应助回帖

建议如下:1)运行调试中,检查程序问题。程序bug是制造“惊喜”的源头
2)如果程序很好的实现了模型,那么就是模型不适合你的数据,因为这表明存在如下问题:每次训练,都使得训练之后的模型对测试的 1折效果很好,而对用于训练的9折效果惨淡,也就是模型落入了局部极值点而非全局极值点。这很有可能是模型在具体数据下的失效问题。这个,也要跟踪程序运行或者仔细分析数据空间才能知道真正的原因。
9楼2013-02-24 00:00:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yang16

新虫 (小有名气)

【答案】应助回帖

想请问下你是怎么划分训练集和测试集的啊?随机?
10楼2014-09-12 16:12:51
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 ilovethis 的主题更新
信息提示
请填处理意见