24小时热门版块排行榜    

CyRhmU.jpeg
查看: 2152  |  回复: 9
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

gaoyanyan3

银虫 (正式写手)

[求助] 有没研究最大熵(机器学习)的朋友,帮忙看一下!

我用最大熵训练一个训练集(10000条记录,每条记录20维,即20个属性),然后对对一个测试集(1000条记录)测试,把得分最高(99.8)的测试集的一条记录再加入训练集(变为10001条记录),而测试集不变。重新训练,
结果为:
1)测试集的准确率竟然降低了,为什么呀?
   要知道我只加入一条最有可能是真的记录呀。
2)该条记录的得分(概率)竟然从99.8降到99.7, 为什么?
  这个更无法理解了,这条记录的信息量增加了,概率按理说应该增加。
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wsy525

金虫 (正式写手)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
gaoyanyan3: 金币+10, 10 2012-06-08 11:40:37
说明你之前的训练,对现在的测试数据识别效果不好
4楼2012-04-17 10:38:33
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 10 个回答

cc3510050

金虫 (正式写手)

这是不是所谓的有效信息降低了
2楼2012-04-16 18:21:13
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gaoyanyan3

银虫 (正式写手)

引用回帖:
2楼: Originally posted by cc3510050 at 2012-04-16 18:21:13:
这是不是所谓的有效信息降低了

不对呀,我只加一条信息,而且这条信息的得分率本身是最高的,
也就是基本是准确答案了。
3楼2012-04-16 18:37:03
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gaoyanyan3

银虫 (正式写手)

引用回帖:
4楼: Originally posted by wsy525 at 2012-04-17 10:38:33:
说明你之前的训练,对现在的测试数据识别效果不好

不对呀,整体识别效果有81%呢。
5楼2012-04-17 11:37:36
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
信息提示
请填处理意见