24小时热门版块排行榜    

北京石油化工学院2026年研究生招生接收调剂公告
查看: 2385  |  回复: 9

gaoyanyan3

银虫 (正式写手)

[求助] 有没研究最大熵(机器学习)的朋友,帮忙看一下!

我用最大熵训练一个训练集(10000条记录,每条记录20维,即20个属性),然后对对一个测试集(1000条记录)测试,把得分最高(99.8)的测试集的一条记录再加入训练集(变为10001条记录),而测试集不变。重新训练,
结果为:
1)测试集的准确率竟然降低了,为什么呀?
   要知道我只加入一条最有可能是真的记录呀。
2)该条记录的得分(概率)竟然从99.8降到99.7, 为什么?
  这个更无法理解了,这条记录的信息量增加了,概率按理说应该增加。
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

cc3510050

金虫 (正式写手)

这是不是所谓的有效信息降低了
2楼2012-04-16 18:21:13
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gaoyanyan3

银虫 (正式写手)

引用回帖:
2楼: Originally posted by cc3510050 at 2012-04-16 18:21:13:
这是不是所谓的有效信息降低了

不对呀,我只加一条信息,而且这条信息的得分率本身是最高的,
也就是基本是准确答案了。
3楼2012-04-16 18:37:03
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wsy525

金虫 (正式写手)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
gaoyanyan3: 金币+10, 10 2012-06-08 11:40:37
说明你之前的训练,对现在的测试数据识别效果不好
4楼2012-04-17 10:38:33
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gaoyanyan3

银虫 (正式写手)

引用回帖:
4楼: Originally posted by wsy525 at 2012-04-17 10:38:33:
说明你之前的训练,对现在的测试数据识别效果不好

不对呀,整体识别效果有81%呢。
5楼2012-04-17 11:37:36
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gaoyanyan3

银虫 (正式写手)

1.我用最大熵训练一个训练集(10000条记录,每条记录20维,即20个属性),然后对对一个测试集(1000条记录)测试,把得分最高(99.8)的测试集的一条记录(a1,a2,...a20),该记录的分类结果如:
B1:0.01   B2:99.8 B3:0.00  B4:0.00 B5:0.01
(其中B指分类类别,0.01指相应概率)

2.指该记录(a1,a2,...a20),加入到训练集(变为10001条记录),再训练,该记录分类结果为:B1:0.01   B2:99.7 B3:0.01 B4:0.00 B5:0.01

从理论上分析,加入这条记录a1,a2..a20等各属性做为B2的可能性增大,应该整体概率也应提高才对呀。。
哪位大哥大姐帮忙再看一下呀!
6楼2012-04-17 11:46:17
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gaoyanyan3

银虫 (正式写手)

7楼2012-04-19 08:36:45
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

choirboy999

新虫 (初入文坛)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
gaoyanyan3: 金币+20 2012-06-08 11:40:29
这个应该是正常的吧。在机器学习算法中,有时候预测结果是有点出乎意料。比如特征维数的增加并不能带来分类精度的一定提高,交叉验证精度的提高也不总是能带来分类精度的提高。楼主将一条可信度很高的记录加入训练样本,精度没有提高我想也是这个原因,有一定的随机性,况且你加入的那条记录为真的可能性虽然极高,但只是上一次训练的判断,这次再进行训练判断时,有可能就判断为假了,这是有可能的吧。
8楼2012-04-20 09:30:01
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

liuzhen8936

金虫 (正式写手)

【答案】应助回帖

感谢参与,应助指数 +1
想问个比较弱的问题,熵到底是个什么东西啊,怎么理解
做有意义的事
9楼2012-04-21 08:59:21
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gaoyanyan3

银虫 (正式写手)

10楼2012-04-25 16:54:00
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 gaoyanyan3 的主题更新
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[考研] 材料334求调剂 +19 Eecho# 2026-04-03 19/950 2026-04-06 08:37 by 小小树2024
[考研] 求调剂 +7 张zic 2026-04-05 8/400 2026-04-05 22:57 by Hdyxbekcb
[考研] 0855求调剂材料 +11 红桃灼灼 2026-04-04 11/550 2026-04-05 22:13 by 醉翁wl
[考研] 求调剂,一志愿厦门大学,生物与医药,总分272,本科211 +3 Electron1cc 2026-04-01 4/200 2026-04-05 20:24 by lys0704
[考研] 材料0856 英一数二 323 求调剂 +14 袁sy 2026-04-01 14/700 2026-04-05 18:18 by cql1109
[考研] 288求调剂 +7 没有答案_ 2026-04-05 7/350 2026-04-05 17:01 by yulian1987
[考研] 一志愿北交大材料工程总分358求调剂 +6 cs0106 2026-04-05 6/300 2026-04-05 16:34 by imissbao
[考研] 272求调剂 +4 电气李 2026-04-05 4/200 2026-04-05 10:41 by lbsjt
[考研] 一志愿北京化工大学,初试成绩350求调剂 +9 沿岸?贝壳 2026-04-04 14/700 2026-04-05 01:09 by 沿岸?贝壳
[考研] 材料与化工306分找调剂 +12 沧海轻舟e 2026-04-03 13/650 2026-04-04 23:45 by lqwchd
[考研] 290求调剂 +7 luoziheng 2026-04-04 7/350 2026-04-04 23:17 by lqwchd
[考研] 320求调剂 +3 一样圆 2026-04-04 3/150 2026-04-04 22:29 by 啵啵啵0119
[考研] 0835学硕299求调剂 08大类可接受 +5 useryy 2026-04-03 5/250 2026-04-04 20:07 by 蓝云思雨
[考研] 一志愿重庆大学085404,总分314分,求调剂 +4 zf83hn 2026-04-03 4/200 2026-04-03 21:25 by 啵啵啵0119
[考研] 321求调剂 +17 y-yh 2026-04-01 20/1000 2026-04-03 12:57 by y-yh
[考研] 266求调剂 +4 学员97LZgn 2026-04-02 4/200 2026-04-02 13:03 by yulian1987
[考研] 能源动力 调剂 +3 不破不立0 2026-04-02 3/150 2026-04-02 12:46 by ffffjjjj
[考博] 26年申博 +3 staryer 2026-03-30 4/200 2026-04-01 23:21 by ai4pharm
[考研] 085600,321分求调剂 +13 大馋小子 2026-03-31 13/650 2026-04-01 12:35 by chemdavid
[考研] 358求调剂 +3 王向阳花 2026-03-31 3/150 2026-04-01 09:56 by zzchen2000
信息提示
请填处理意见