24小时热门版块排行榜    

CyRhmU.jpeg
查看: 1637  |  回复: 11
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

AnYeah

木虫 (小有名气)

[交流] baggging算法问题已有1人参与

想用baggging算法进行分类/回归,有两点疑惑:
      1、随机采样的样本有重复,在送入基学习器学习之前重复样本要不要去掉?
      2、若原始样本尺寸为n,采样样本尺寸m,m是不是一定要等于n?如果可以自定,那具体有什么原则?
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

HRL_RS

金虫 (小有名气)

★ ★ ★ ★ ★ ★ ★
小木虫: 金币+0.5, 给个红包,谢谢回帖
AnYeah: 金币+3 2016-07-13 20:58:16
AnYeah: 金币+3 2016-07-16 16:21:54
1. 有重复样本不需要去掉;
2. m肯定不等于n,如果相等,每个基模型预测结果就相同了,再集成就没意义了;
3. m的取值可以按一定比例设定,比如取80%个n,一般试出结果较好的。
7楼2016-07-13 09:08:41
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 12 个回答
2楼2016-07-11 17:38:19
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

jbb0523

至尊木虫 (著名写手)

★ ★
小木虫: 金币+0.5, 给个红包,谢谢回帖
AnYeah: 金币+1 2016-07-12 23:04:16
可以在coursera上看看台大林轩田的机器学习技法课程,里面有讲,看过,但忘记了……

发自小木虫Android客户端
我不去想是否能够成功,既然选择了远方便只顾风雨兼程……
4楼2016-07-12 12:41:45
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

AnYeah

木虫 (小有名气)

引用回帖:
4楼: Originally posted by jbb0523 at 2016-07-12 12:41:45
可以在coursera上看看台大林轩田的机器学习技法课程,里面有讲,看过,但忘记了……

谢谢!
5楼2016-07-12 23:04:23
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复(可上传附件)
信息提示
请填处理意见