版块导航: 正在加载中...

登录注册

应《网络安全法》要求，自2017年10月1日起，未进行实名认证将不得使用互联网跟帖服务。为保障您的帐号能够正常使用，请尽快对帐号进行手机号验证，感谢您的理解与支持！

24小时热门版块排行榜

返回列表

xmcrobbie

银虫 (小有名气)

应助: 0 (幼儿园)
金币: 868.2
红花: 2
帖子: 262
在线: 27小时
虫号: 2625854
注册: 2013-08-30
性别: GG
专业: 模式识别

[求助] 样本数据归一化的问题求助！已有5人参与

libsvm自带一个模板里头有个：
a_template_flow_usingSVM_class.m，在进行数据归一化的时候，是调用scaleForSVM(train_data,test_data,0,1);把训练样本和测试样本合在一起进行归一化。最终准确率可以达到98%。这合理吗？我做了测试，如果把训练样本和测试样本分开归一化，准确率会大幅度降低，只有60%多。哪个才是真正的结果呢？

回复此楼

» 猜你喜欢

国自科面上基金字体已经有6人回复
304求调剂已经有3人回复
304求调剂已经有6人回复
材料与化工一志愿南昌大学327求调剂推荐已经有8人回复
0703 物理化学调剂已经有5人回复
化学工程321分求调剂已经有7人回复
0703化学调剂 290分有科研经历，论文在投已经有7人回复
308求调剂已经有3人回复
本人考085602 化学工程专硕已经有10人回复
焦虑已经有9人回复

» 本主题相关价值贴推荐，对您同样有帮助:

1楼 2014-01-21 13:47:36

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

回帖支持 ( 显示支持度最高的前 50 名 )

ilmeiyi

金虫 (正式写手)

应助: 8 (幼儿园)
金币: 1117.1
散金: 898
红花: 1
帖子: 357
在线: 205.3小时
虫号: 1045877
注册: 2010-06-22
专业: 制造系统与自动化

【答案】应助回帖

★ ★ ★ ★
感谢参与，应助指数 +1
xmcrobbie: 金币+3 2014-01-24 02:33:41
xmcrobbie: 金币+1 2014-01-24 02:34:25

极端例子
训练 0 100
测试 25 50

那么分开归一，0当0,100当1,25当0,50当1
统一归一，0当0,100当1,25当0.25,50当0.5

对吗？

赞一下(1人)

回复此楼

5楼2014-01-22 13:01:34

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

普通回帖

yongcailiu

金虫 (小有名气)

应助: 63 (初中生)
金币: 2283.9
红花: 10
帖子: 181
在线: 250.4小时
虫号: 1406563
注册: 2011-09-18
性别: GG
专业: 计算数学与科学工程计算

【答案】应助回帖

感谢参与，应助指数 +1

以我的了解，两个结果应该都是正确的。原因是，前者中把测试样本进行了训练，所以准确率就高。打个比方，就像我们学习新知识，对于已经学习过的东西，掌握的程度当然好了（98%），而运用已有的知识（只训练训练样本）再来学习新知识，掌握的程度自然会差很多（60%）

赞一下

回复此楼

2楼2014-01-22 10:32:48

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

xmcrobbie

银虫 (小有名气)

应助: 0 (幼儿园)
金币: 868.2
红花: 2
帖子: 262
在线: 27小时
虫号: 2625854
注册: 2013-08-30
性别: GG
专业: 模式识别

引用回帖:

2楼: Originally posted by yongcailiu at 2014-01-22 10:32:48
以我的了解，两个结果应该都是正确的。原因是，前者中把测试样本进行了训练，所以准确率就高。打个比方，就像我们学习新知识，对于已经学习过的东西，掌握的程度当然好了（98%），而运用已有的知识（只训练训练样本 ...

测试样本只是用来归一化，根本没参与训练！

[ 发自小木虫客户端 ]

赞一下

回复此楼

3楼2014-01-22 12:14:19

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

stxiahu

木虫 (小有名气)

应助: 28 (小学生)
金币: 3170.7
帖子: 207
在线: 140.4小时
虫号: 1377444
注册: 2011-08-23
专业: 通信理论与系统

【答案】应助回帖

感谢参与，应助指数 +1

我觉得是训练样本涵盖的区域没有测试样本大，导致学习测试样本的能力下降。如果把训练和测试样本混合，然后10折交叉验证，只用选作训练的那部分样本归一化，我想得到的测试结果应该有高有低，高的应该接近98%吧。。

赞一下

回复此楼

4楼2014-01-22 13:00:57

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

xmcrobbie

银虫 (小有名气)

应助: 0 (幼儿园)
金币: 868.2
红花: 2
帖子: 262
在线: 27小时
虫号: 2625854
注册: 2013-08-30
性别: GG
专业: 模式识别

引用回帖:

5楼: Originally posted by ilmeiyi at 2014-01-22 13:01:34
极端例子
训练 0 100
测试 25 50

那么分开归一，0当0,100当1,25当0,50当1
统一归一，0当0,100当1,25当0.25,50当0.5

对吗？

我觉得尺度的角度来说，合在一起归一化更合理，否则训练样本的尺度和测试样本的尺度都不一样的话，测试结果当然会降低。但是这样一来会有一个问题，每来一个新的测试样本，都要重新归一化，这样的效率不是很低？

赞一下

回复此楼

6楼2014-01-22 13:49:41

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

HRL_RS

金虫 (小有名气)

应助: 13 (小学生)
金币: 1377.7
红花: 2
帖子: 108
在线: 154.2小时
虫号: 2602830
注册: 2013-08-17
专业: 模式识别

【答案】应助回帖

★
感谢参与，应助指数 +1
xmcrobbie: 金币+1 2014-01-24 02:33:58

个人觉得两个放在一块进行归一化是正确的，之前一直都是这么做的

赞一下

回复此楼

7楼2014-01-22 20:15:40

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

dden

新虫 (初入文坛)

应助: 2 (幼儿园)
金币: 246.1
帖子: 22
在线: 12.5小时
虫号: 1602475
注册: 2012-02-06
专业: 计算机应用技术

【答案】应助回帖

感谢参与，应助指数 +1

放在一起进行归一化是合理的。。但是测试结果应该采用k折交叉验证的平均结果。

赞一下

回复此楼

8楼2014-01-22 23:00:01

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

xmcrobbie

银虫 (小有名气)

应助: 0 (幼儿园)
金币: 868.2
红花: 2
帖子: 262
在线: 27小时
虫号: 2625854
注册: 2013-08-30
性别: GG
专业: 模式识别

引用回帖:

8楼: Originally posted by dden at 2014-01-22 23:00:01
放在一起进行归一化是合理的。。但是测试结果应该采用k折交叉验证的平均结果。

每次k折交叉验证的结果都是不同的，一般要测试几次再求平均值？20次够么？

[ 发自小木虫客户端 ]

赞一下

回复此楼

9楼2014-01-23 08:38:57

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

xmcrobbie

银虫 (小有名气)

应助: 0 (幼儿园)
金币: 868.2
红花: 2
帖子: 262
在线: 27小时
虫号: 2625854
注册: 2013-08-30
性别: GG
专业: 模式识别

引用回帖:

我今天无意中用非线性函数log2进行归一化，训练样本和测试样本分开，竟然发现效果很好，但是不知道为什么！

[ 发自小木虫客户端 ]

赞一下

回复此楼

10楼2014-01-23 11:53:19

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

相关版块跳转我要订阅楼主 xmcrobbie 的主题更新

返回列表

最具人气热帖推荐 [查看全部]		作者	回/看	最后发表

[考研] 304求调剂 +3	ahbd 2026-03-14	3/150	2026-03-16 13:05 by Iveryant
[教师之家] 焦虑 +7	水冰月月野兔 2026-03-13	9/450	2026-03-16 10:00 by Quakerbird
[考研] 环境工程调剂 +3	大可digkids 2026-03-16	3/150	2026-03-16 09:09 by DDDddddmm
[考研] 梁成伟老师课题组欢迎你的加入 +6	一鸭鸭哟 2026-03-14	7/350	2026-03-15 22:12 by Winj1e
[考研] 材料工程专硕274一志愿211求调剂 +5	薛云鹏 2026-03-15	5/250	2026-03-15 20:38 by Logic2024
[考研] 材料专硕326求调剂 +4	墨煜姒莘 2026-03-15	4/200	2026-03-15 11:02 by dyw
[考研] 289求调剂 +4	这么名字咋样 2026-03-14	6/300	2026-03-14 18:58 by userper
[考研] 297一志愿上交085600求调剂 +5	指尖八千里 2026-03-14	5/250	2026-03-14 17:26 by a不易
[考研] 265求调剂 +4	威化饼07 2026-03-12	4/200	2026-03-14 17:23 by userper
[考研] 255求调剂 +3	李嘉慧， 2026-03-12	4/200	2026-03-14 16:58 by 有只狸奴
[考研] 一志愿哈工大材料324分求调剂 +5	闫旭东 2026-03-14	5/250	2026-03-14 14:53 by 木瓜膏
[考研] 306求调剂 +4	唐薏薏 2026-03-09	4/200	2026-03-14 01:19 by JourneyLucky
[考研] 复试调剂 +9	Copy267 2026-03-10	9/450	2026-03-13 23:45 by userper
[考研] 求材料调剂 085600英一数二总分302 前三科235 精通机器学习一志愿哈工大 +4	林yaxin 2026-03-12	4/200	2026-03-13 22:04 by 星空星月
[考研] 工科，求调剂 +3	我887 2026-03-11	3/150	2026-03-13 21:39 by JourneyLucky
[考研] （081700）化学工程与技术-298分求调剂 +12	11啦啦啦 2026-03-11	35/1750	2026-03-13 21:25 by JourneyLucky
[考研] 工科278分求调剂 +5	周慢热啊 2026-03-12	7/350	2026-03-13 15:49 by JourneyLucky
[考研] 0856化学工程280分求调剂 +4	shenzxsn 2026-03-11	4/200	2026-03-13 11:55 by ymwdoctor
[考研] 求调剂资源与环境 285 +3	未名考生 2026-03-10	3/150	2026-03-13 10:31 by houyaoxu
[考研] 研究生招生 +3	徐海涛11 2026-03-10	7/350	2026-03-12 14:26 by 徐海涛11

24小时热门版块排行榜

[求助] 样本数据归一化的问题求助！ 已有5人参与

» 猜你喜欢

» 本主题相关价值贴推荐，对您同样有帮助:

【答案】应助回帖

【答案】应助回帖

【答案】应助回帖

【答案】应助回帖

【答案】应助回帖

[求助] 样本数据归一化的问题求助！已有5人参与