24小时热门版块排行榜    

北京石油化工学院2026年研究生招生接收调剂公告
查看: 2386  |  回复: 9

gaoyanyan3

银虫 (正式写手)

[求助] 有没研究最大熵(机器学习)的朋友,帮忙看一下!

我用最大熵训练一个训练集(10000条记录,每条记录20维,即20个属性),然后对对一个测试集(1000条记录)测试,把得分最高(99.8)的测试集的一条记录再加入训练集(变为10001条记录),而测试集不变。重新训练,
结果为:
1)测试集的准确率竟然降低了,为什么呀?
   要知道我只加入一条最有可能是真的记录呀。
2)该条记录的得分(概率)竟然从99.8降到99.7, 为什么?
  这个更无法理解了,这条记录的信息量增加了,概率按理说应该增加。
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

cc3510050

金虫 (正式写手)

这是不是所谓的有效信息降低了
2楼2012-04-16 18:21:13
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gaoyanyan3

银虫 (正式写手)

引用回帖:
2楼: Originally posted by cc3510050 at 2012-04-16 18:21:13:
这是不是所谓的有效信息降低了

不对呀,我只加一条信息,而且这条信息的得分率本身是最高的,
也就是基本是准确答案了。
3楼2012-04-16 18:37:03
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

wsy525

金虫 (正式写手)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
gaoyanyan3: 金币+10, 10 2012-06-08 11:40:37
说明你之前的训练,对现在的测试数据识别效果不好
4楼2012-04-17 10:38:33
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gaoyanyan3

银虫 (正式写手)

引用回帖:
4楼: Originally posted by wsy525 at 2012-04-17 10:38:33:
说明你之前的训练,对现在的测试数据识别效果不好

不对呀,整体识别效果有81%呢。
5楼2012-04-17 11:37:36
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gaoyanyan3

银虫 (正式写手)

1.我用最大熵训练一个训练集(10000条记录,每条记录20维,即20个属性),然后对对一个测试集(1000条记录)测试,把得分最高(99.8)的测试集的一条记录(a1,a2,...a20),该记录的分类结果如:
B1:0.01   B2:99.8 B3:0.00  B4:0.00 B5:0.01
(其中B指分类类别,0.01指相应概率)

2.指该记录(a1,a2,...a20),加入到训练集(变为10001条记录),再训练,该记录分类结果为:B1:0.01   B2:99.7 B3:0.01 B4:0.00 B5:0.01

从理论上分析,加入这条记录a1,a2..a20等各属性做为B2的可能性增大,应该整体概率也应提高才对呀。。
哪位大哥大姐帮忙再看一下呀!
6楼2012-04-17 11:46:17
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gaoyanyan3

银虫 (正式写手)

7楼2012-04-19 08:36:45
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

choirboy999

新虫 (初入文坛)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
gaoyanyan3: 金币+20 2012-06-08 11:40:29
这个应该是正常的吧。在机器学习算法中,有时候预测结果是有点出乎意料。比如特征维数的增加并不能带来分类精度的一定提高,交叉验证精度的提高也不总是能带来分类精度的提高。楼主将一条可信度很高的记录加入训练样本,精度没有提高我想也是这个原因,有一定的随机性,况且你加入的那条记录为真的可能性虽然极高,但只是上一次训练的判断,这次再进行训练判断时,有可能就判断为假了,这是有可能的吧。
8楼2012-04-20 09:30:01
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

liuzhen8936

金虫 (正式写手)

【答案】应助回帖

感谢参与,应助指数 +1
想问个比较弱的问题,熵到底是个什么东西啊,怎么理解
做有意义的事
9楼2012-04-21 08:59:21
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gaoyanyan3

银虫 (正式写手)

10楼2012-04-25 16:54:00
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 gaoyanyan3 的主题更新
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[考研] 0855求调剂材料 +11 红桃灼灼 2026-04-04 12/600 2026-04-06 10:26 by 蓝云思雨
[考研] 一志愿 江南大学 085602 化工专硕 338分求调剂 +15 路痴小琪 2026-04-05 15/750 2026-04-06 09:27 by cql1109
[考研] 一志愿武汉理工大学-085601材料工程(专硕)-总分353求调剂 +3 2626262626li 2026-04-02 3/150 2026-04-06 09:08 by 无际的草原
[考研] 294求调剂 +4 Grey_Ey 2026-04-01 5/250 2026-04-05 23:05 by Grey_Ey
[考研] 材料工程302分求调剂 +9 zyx上岸! 2026-04-04 9/450 2026-04-05 22:08 by 醉翁wl
[考研] 生物与医药调剂 +4 十七sa 2026-04-05 4/200 2026-04-05 20:05 by lys0704
[考研] 296求调剂 +3 汪!?! 2026-04-05 5/250 2026-04-05 17:38 by 蓝云思雨
[考研] 电子信息调剂交叉学科有推荐吗 +6 jhtfeybgj 2026-04-01 9/450 2026-04-05 11:13 by 猪会飞
[考研] 一志愿江南大学085501机械工程专硕326分,本科佳木斯大学 +5 顾若浮生 2026-04-03 9/450 2026-04-05 09:57 by 1753564080
[考研] 26考研调剂0710 0860 +9 补补不补 2026-04-03 14/700 2026-04-04 23:32 by 果冻大王
[考研] 11408,335分,本科211,求调剂,可转专业 +5 鳄梨大鳄鱼 2026-04-03 5/250 2026-04-04 22:49 by chongya
[考研] 295求调剂 +4 A你好研究生 2026-04-04 5/250 2026-04-04 22:46 by yu221
[考研] 309分085801求调剂 +11 MY_angel 2026-03-31 11/550 2026-04-04 19:11 by 蓝云思雨
[考研] 291求调剂 +4 迷蒙木木 2026-04-01 5/250 2026-04-04 15:59 by sihailian3
[考研] 复试调剂 +6 范根培 2026-04-04 6/300 2026-04-04 14:27 by 土木硕士招生
[考研] 319求调剂 +18 太容易1018 2026-04-01 18/900 2026-04-03 11:18 by linyelide
[考研] 318求调剂 +3 笃行致远. 2026-03-31 4/200 2026-04-02 15:56 by Jaylen.
[考研] 学硕化学工程与技术,一志愿中国海洋大学320+求调剂 +8 披星河 2026-04-02 8/400 2026-04-02 14:12 by oooqiao
[考研] 08工科求调剂290分 +5 1314捧花 2026-04-02 8/400 2026-04-02 13:16 by 乔哒哒哒
[考研] 吉大生物学326分求调剂 +3 sunnyupup 2026-03-31 3/150 2026-03-31 09:28 by longlotian
信息提示
请填处理意见