24小时热门版块排行榜    

查看: 1707  |  回复: 6

鼠用人标

铜虫 (初入文坛)

[交流] 【求助】关于Adaboost算法的疑问 已有4人参与

如果成员分类器的训练误差为0,这时正确分类样本的重采样权重就为0,是否应当退出基分类器的构造?那么在决策时,由于该基分类器的权值很大,集成的输出就完全由这个分类器决定了?(当然,按理说弱分类器分类误差不应当为0,但不可避免可能会有这种情况出现)
回复此楼

» 收录本帖的淘帖专辑推荐

国家基金

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

涛涛涛123

金虫 (小有名气)


小木虫(金币+0.5):给个红包,谢谢回帖交流
不懂,希望高手也可以指教我一下
2楼2011-04-16 22:47:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

摘星者

铁杆木虫 (正式写手)

★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
conanwj(金币+1): 鼓励研讨 2011-04-17 08:35:13
事实上是有可能在训练过程中出现training set的错误率达到0的。但即使如此,继续增加弱分类器也能持续改善泛化误差。你可以看看adaboost中margin distribution或者叫margin view方面的内容。

[ Last edited by 摘星者 on 2011-4-17 at 00:35 ]
3楼2011-04-17 00:32:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

鼠用人标

铜虫 (初入文坛)

楼上提到“继续增加弱分类器也能持续改善泛化误差”,我在文章里看到过这个说法。

我不清楚的是接下来如何构造弱分类器?
因为这个时候正确分类样本的权值为0,重采样会有问题了,今后即使分类错误,这些样本都不可能采样到。
4楼2011-04-17 09:23:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

摘星者

铁杆木虫 (正式写手)

★ ★ ★ ★
小木虫(金币+0.5):给个红包,谢谢回帖交流
mze04532(金币+3): 精彩回帖~ 2011-04-17 11:38:13
mze04532: 回帖置顶 2012-02-21 08:37:54
这属于边界处理吧,难道训练错误率为0时取beta=0?那你最后如何对这个弱分类器的beta取倒数?

此时你可以根据数据集的具体情况设定错误率为一个很小的数值,例如0.001,计算beta。观察样本权重更新就可以知道,此时所有样本权重都需要乘以beta,beta取任何非0值都一样的,而且这样的边界处理也符合adaboost的原理:没有错分,自然不需要对权重进行进一步调整。反而是beta取0显得不合理,因为这样会使得所有样本等价(不要太执着权重为0,从权重更新的根本目的考虑,所有样本权重为0和所有样本权重为1在这里没有什么区别的)。样本权重相当于没有改变,而该弱分类器权重较大。但是因为算法并不因此停止,如果还有其他弱分类器也能达到训练错误率0,也同样会有较大的权重,从而避免由单个弱分类器完全决定强分类器的情况。
5楼2011-04-17 09:57:04
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

鼠用人标

铜虫 (初入文坛)

非常感谢摘星者!解答了我老长一段时间以来的困惑!!
6楼2011-04-17 10:15:33
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

fanxuehit

新虫 (初入文坛)

希望高手推荐Adaboost方面的文章,入门级的  多谢
7楼2012-02-20 16:05:23
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 鼠用人标 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见