24小时热门版块排行榜    

Znn3bq.jpeg
查看: 1810  |  回复: 11

AnYeah

木虫 (小有名气)

[交流] baggging算法问题 已有1人参与

想用baggging算法进行分类/回归,有两点疑惑:
      1、随机采样的样本有重复,在送入基学习器学习之前重复样本要不要去掉?
      2、若原始样本尺寸为n,采样样本尺寸m,m是不是一定要等于n?如果可以自定,那具体有什么原则?
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
回帖支持 ( 显示支持度最高的前 50 名 )

HRL_RS

金虫 (小有名气)

★ ★ ★ ★ ★ ★ ★
小木虫: 金币+0.5, 给个红包,谢谢回帖
AnYeah: 金币+3 2016-07-13 20:58:16
AnYeah: 金币+3 2016-07-16 16:21:54
1. 有重复样本不需要去掉;
2. m肯定不等于n,如果相等,每个基模型预测结果就相同了,再集成就没意义了;
3. m的取值可以按一定比例设定,比如取80%个n,一般试出结果较好的。
7楼2016-07-13 09:08:41
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通回帖
2楼2016-07-11 17:38:19
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

AnYeah

木虫 (小有名气)

自己顶一下
3楼2016-07-12 10:18:51
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

jbb0523

至尊木虫 (著名写手)

★ ★
小木虫: 金币+0.5, 给个红包,谢谢回帖
AnYeah: 金币+1 2016-07-12 23:04:16
可以在coursera上看看台大林轩田的机器学习技法课程,里面有讲,看过,但忘记了……

发自小木虫Android客户端
我不去想是否能够成功,既然选择了远方便只顾风雨兼程……
4楼2016-07-12 12:41:45
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

AnYeah

木虫 (小有名气)

引用回帖:
4楼: Originally posted by jbb0523 at 2016-07-12 12:41:45
可以在coursera上看看台大林轩田的机器学习技法课程,里面有讲,看过,但忘记了……

谢谢!
5楼2016-07-12 23:04:23
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xiaol1123

金虫 (小有名气)

★ ★ ★ ★
小木虫: 金币+0.5, 给个红包,谢谢回帖
AnYeah: 金币+3 2016-07-13 20:57:59
不用
等于还叫随机吗? 至于比例可根据子模型个数及复杂度等调节。

可以参考周志华老师的这本书的有关章节
Z.-H. Zhou. Ensemble Methods: Foundations and Algorithms, Boca Raton, FL: Chapman & Hall/CRC, 2012. (ISBN 978-1-439-830031)  [TOC; Sample chapters: Chapter 2, Chaper 6]
Just do it!
6楼2016-07-13 08:57:49
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

AnYeah

木虫 (小有名气)

引用回帖:
6楼: Originally posted by xiaol1123 at 2016-07-13 08:57:49
不用
等于还叫随机吗? 至于比例可根据子模型个数及复杂度等调节。

可以参考周志华老师的这本书的有关章节
Z.-H. Zhou. Ensemble Methods: Foundations and Algorithms, Boca Raton, FL: Chapman & Hall/CR ...

谢谢
8楼2016-07-13 20:58:10
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

AnYeah

木虫 (小有名气)

引用回帖:
7楼: Originally posted by HRL_RS at 2016-07-13 09:08:41
1. 有重复样本不需要去掉;
2. m肯定不等于n,如果相等,每个基模型预测结果就相同了,再集成就没意义了;
3. m的取值可以按一定比例设定,比如取80%个n,一般试出结果较好的。

谢谢!
9楼2016-07-13 20:58:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

AnYeah

木虫 (小有名气)

引用回帖:
4楼: Originally posted by jbb0523 at 2016-07-12 12:41:45
可以在coursera上看看台大林轩田的机器学习技法课程,里面有讲,看过,但忘记了……

coursera没有明说
10楼2016-07-19 16:18:42
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 AnYeah 的主题更新
普通表情 高级回复 (可上传附件)
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[基金申请] 国自然面上和省基金B类撒花 +4 花田半亩~白 2026-04-21 4/200 2026-04-22 08:15 by kudofaye
[考博] 华师大读博 +3 xq83 2026-04-22 3/150 2026-04-22 03:56 by 啊哒哒哒叨
[论文投稿] 急需审稿人!!! +3 陆小果画大饼 2026-04-21 3/150 2026-04-21 23:54 by jzy_123456
[考研] 295分求调剂 +6 ?要上岸? 2026-04-17 6/300 2026-04-21 08:18 by Equinoxhua
[考研] 一志愿中科大材料与化工,353分还有调剂学校吗 +11 否极泰来2026 2026-04-15 13/650 2026-04-20 22:31 by Equinoxhua
[考研] 085600材料与化工调剂 5+3 孜孜不倦2002 2026-04-19 6/300 2026-04-20 21:25 by babero
[论文投稿] 期刊推荐 +3 材料研究生 2026-04-15 5/250 2026-04-20 16:02 by 豆豆7758
[教师之家] 又一批高校组建人工智能学院 师资行吗 不是骗人吗 +4 yexuqing 2026-04-19 4/200 2026-04-20 14:47 by brantleo
[考博] 申博 +3 Xyyx. 2026-04-18 3/150 2026-04-20 10:44 by YuY66
[考博] 湖南大学刘巧玲课题组2026年第二批次博士研究生招生信息 +3 南风观火 2026-04-18 5/250 2026-04-20 10:13 by 南风观火
[考研] 求计算机方向调剂 +3 Toffee2 2026-04-16 6/300 2026-04-19 22:37 by ll叶
[考研] 求调剂 +6 苦命人。。。 2026-04-18 7/350 2026-04-19 16:27 by 中豫男
[考研] 294求调剂 +15 淡然654321 2026-04-15 15/750 2026-04-19 08:20 by cuisz
[考研] 0854求调剂 +23 门路摸摸 2026-04-15 27/1350 2026-04-19 01:59 by 烟雨流涯
[考研] 300求调剂 +12 橙a777 2026-04-15 12/600 2026-04-18 23:51 by 路病情
[考研] 收到复试调剂但是去不了 +8 小蜗牛* 2026-04-16 8/400 2026-04-18 11:15 by zixin2025
[考研] 260求调剂 +4 Zyt1314520.. 2026-04-17 5/250 2026-04-18 08:28 by babysonlkd
[考研] 急需调剂 +9 绝不放弃22 2026-04-15 10/500 2026-04-18 08:09 by chixmc
[考研] 322求调剂 +6 tekuzu 2026-04-17 6/300 2026-04-17 13:48 by Espannnnnol
[考研] 一志愿沪9,生物学326求调剂 +9 刘墨墨 2026-04-15 9/450 2026-04-16 17:14 by 崔崔崔cccc
信息提示
请填处理意见