版块导航: 正在加载中...

登录注册

应《网络安全法》要求，自2017年10月1日起，未进行实名认证将不得使用互联网跟帖服务。为保障您的帐号能够正常使用，请尽快对帐号进行手机号验证，感谢您的理解与支持！

24小时热门版块排行榜

返回列表

当前只显示满足指定条件的回帖，点击这里查看本话题的所有回帖

jermerneyyin

新虫 (初入文坛)

应助: 0 (幼儿园)
金币: 107.8
帖子: 35
在线: 218.1小时
虫号: 2147914

[交流] 关于强化学习，自适应动态规划和在线学习

想跟各位牛人交流下，最近在做强化学习的算法应用，采用强化学习和在线学习的结合，可是结果仅仅是控制器的鲁棒性和适应性增强，关键的结果精度并没有比单纯的采用在线学习好很多，是因为算法的问题还是仿真模拟的问题？

回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐，对您同样有帮助:

有关于参数的自适应以及自适应观测器已经有7人回复

» 抢金币啦！回帖就可以得到:

查看全部散金贴

1楼 2013-04-11 09:46:46

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

nono2009

超级版主 (文学泰斗)

★
jermerneyyin(金币+1): 谢谢参与

1+1<2很正常，如果单纯的采用在线学习的效果已经够好了。

赞一下

回复此楼

3楼2013-04-11 15:18:36

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

查看全部 31 个回答

noirland

铁杆木虫 (正式写手)

应助: 10 (幼儿园)
金币: 11463.6
帖子: 439
在线: 277.7小时
虫号: 683684

★
jermerneyyin(金币+1): 谢谢参与

在线学习？LZ是想说监督学习么？
强化学习最大的优点是在与外界环境的交互过程中进行学习，而不依赖于系统的模型。
话说，强化学习在控制方面有很多研究内容啊，

赞一下

回复此楼

2楼2013-04-11 15:10:57

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

jermerneyyin

新虫 (初入文坛)

应助: 0 (幼儿园)
金币: 107.8
帖子: 35
在线: 218.1小时
虫号: 2147914

引用回帖:

3楼: Originally posted by nono2009 at 2013-04-11 15:18:36
1+1<2很正常，如果单纯的采用在线学习的效果已经够好了。

对，有时候确实有这个感觉，不过有强化学习系统适应性好了很多，现在有点迷茫要不要继续在强化学习方面做下去了

赞一下

回复此楼

11楼2013-04-11 16:51:12

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

jermerneyyin

新虫 (初入文坛)

应助: 0 (幼儿园)
金币: 107.8
帖子: 35
在线: 218.1小时
虫号: 2147914

引用回帖:

2楼: Originally posted by noirland at 2013-04-11 15:10:57
在线学习？LZ是想说监督学习么？
强化学习最大的优点是在与外界环境的交互过程中进行学习，而不依赖于系统的模型。
话说，强化学习在控制方面有很多研究内容啊，

对的啊，做了一个比较模糊的监督目标，但是主要还是靠TD的值函数，可是感觉结合在一起效果差强人意

赞一下

回复此楼

12楼2013-04-11 16:52:36

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

查看全部 31 个回答

最具人气热帖推荐 [查看全部]		作者	回/看	最后发表

[考研] 本人考085602 化学工程专硕 +21	不知道叫什么！ 2026-03-15	23/1150	2026-03-22 00:12 by BruceLiu320
[考研] 初试 317 +7	半拉月丙 2026-03-20	7/350	2026-03-21 22:26 by peike
[考研] 311求调剂 +13	冬十三 2026-03-15	14/700	2026-03-21 22:10 by peike
[考研] 0703化学调剂，六级已过，有科研经历 +14	曦熙兮 2026-03-15	14/700	2026-03-21 19:12 by ColorlessPI
[考研] 297求调剂 +3	喜欢还是不甘心 2026-03-20	3/150	2026-03-21 18:33 by 学员8dgXkO
[考研] 材料学硕333求调剂 +3	北道巷 2026-03-18	3/150	2026-03-21 18:17 by 学员8dgXkO
[考研] 268求调剂 +9	简单点0 2026-03-17	9/450	2026-03-21 15:37 by lature00
[考研] 求调剂 +3	白QF 2026-03-21	3/150	2026-03-21 13:12 by zhukairuo
[考研] 材料学学硕080502 337求调剂-一志愿华中科技大学 +4	顺顺顺mr 2026-03-18	5/250	2026-03-21 10:22 by luoyongfeng
[考研] 南昌大学材料专硕311分求调剂 +6	77chaselx 2026-03-20	6/300	2026-03-21 07:24 by JourneyLucky
[考研] 求调剂 +3	Ma_xt 2026-03-17	3/150	2026-03-21 02:05 by JourneyLucky
[考研] 一志愿西南交大，求调剂 +5	材化逐梦人 2026-03-18	5/250	2026-03-21 00:26 by JourneyLucky
[考研] 22408 344分求调剂一志愿华电计算机技术 +4	solanXXX 2026-03-20	4/200	2026-03-20 23:49 by alg094825
[考研] 304求调剂 +7	司空. 2026-03-18	7/350	2026-03-20 23:08 by JourneyLucky
[考研] 一志愿武汉理工材料工程专硕调剂 +9	Doleres 2026-03-19	9/450	2026-03-20 22:36 by JourneyLucky
[考研] 材料与化工 322求调剂 +4	然11 2026-03-19	4/200	2026-03-20 22:12 by luoyongfeng
[考研] 求调剂 +3	@taotao 2026-03-20	3/150	2026-03-20 19:35 by JourneyLucky
[考研] 材料与化工专硕调剂 +7	heming3743 2026-03-16	7/350	2026-03-20 19:31 by zhukairuo
[考研] 工科材料085601 279求调剂 +7	困于星晨 2026-03-17	9/450	2026-03-20 17:38 by 无懈可击111
[考研] 0703化学336分求调剂 +6	zbzihdhd 2026-03-15	7/350	2026-03-18 09:53 by zhukairuo

24小时热门版块排行榜

jermerneyyin

[交流] 关于强化学习，自适应动态规划和在线学习

» 猜你喜欢

» 本主题相关价值贴推荐，对您同样有帮助:

» 抢金币啦！回帖就可以得到: 查看全部散金贴

nono2009

noirland

jermerneyyin

jermerneyyin

» 抢金币啦！回帖就可以得到:

查看全部散金贴