版块导航: 正在加载中...

登录注册

应《网络安全法》要求，自2017年10月1日起，未进行实名认证将不得使用互联网跟帖服务。为保障您的帐号能够正常使用，请尽快对帐号进行手机号验证，感谢您的理解与支持！

24小时热门版块排行榜

北京石油化工学院2026年研究生招生接收调剂公告

返回列表

当前只显示满足指定条件的回帖，点击这里查看本话题的所有回帖

jermerneyyin

新虫 (初入文坛)

应助: 0 (幼儿园)
金币: 107.8
帖子: 35
在线: 218.1小时
虫号: 2147914

[交流] 关于强化学习，自适应动态规划和在线学习

想跟各位牛人交流下，最近在做强化学习的算法应用，采用强化学习和在线学习的结合，可是结果仅仅是控制器的鲁棒性和适应性增强，关键的结果精度并没有比单纯的采用在线学习好很多，是因为算法的问题还是仿真模拟的问题？

回复此楼

» 猜你喜欢

调剂已经有0人回复
【新加坡】纳米电子器件项目组有“联合培养博士生”名额已经有0人回复
物理学I论文润色/翻译怎么收费? 已经有141人回复
中德博士后2026项目5月30日截止- 国内博士后入站、德国两年全职已经有0人回复
面向全球申请人的中德博士后2026项目5月30日截止- 国内博后入站德国两年全职已经有0人回复
【新加坡】纳米电子器件项目组有“联合培养博士生”名额已经有2人回复
重庆交大材料学院26年硕士招生复试实施细则已出。欢迎加入光子学微结构与器件课题组。已经有0人回复
北工大宋晓艳教授团队招收2026年9月入学博士【学博和专博名额均有】！已经有1人回复
天津城建大学理学院化学、环境工程、材料物理等方向接收10人已经有0人回复
天津城建大学理学院化学、环境工程、材料物理等方向接收调剂，10人已经有0人回复

» 本主题相关价值贴推荐，对您同样有帮助:

有关于参数的自适应以及自适应观测器已经有7人回复

» 抢金币啦！回帖就可以得到:

查看全部散金贴

1楼 2013-04-11 09:46:46

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

jermerneyyin

新虫 (初入文坛)

应助: 0 (幼儿园)
金币: 107.8
帖子: 35
在线: 218.1小时
虫号: 2147914

引用回帖:

3楼: Originally posted by nono2009 at 2013-04-11 15:18:36
1+1<2很正常，如果单纯的采用在线学习的效果已经够好了。

对，有时候确实有这个感觉，不过有强化学习系统适应性好了很多，现在有点迷茫要不要继续在强化学习方面做下去了

赞一下

回复此楼

11楼2013-04-11 16:51:12

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

查看全部 31 个回答

noirland

铁杆木虫 (正式写手)

应助: 10 (幼儿园)
金币: 11463.6
帖子: 439
在线: 277.7小时
虫号: 683684

★
jermerneyyin(金币+1): 谢谢参与

在线学习？LZ是想说监督学习么？
强化学习最大的优点是在与外界环境的交互过程中进行学习，而不依赖于系统的模型。
话说，强化学习在控制方面有很多研究内容啊，

赞一下

回复此楼

2楼2013-04-11 15:10:57

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

nono2009

超级版主 (文学泰斗)

★
jermerneyyin(金币+1): 谢谢参与

1+1<2很正常，如果单纯的采用在线学习的效果已经够好了。

赞一下

回复此楼

3楼2013-04-11 15:18:36

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

jermerneyyin

新虫 (初入文坛)

应助: 0 (幼儿园)
金币: 107.8
帖子: 35
在线: 218.1小时
虫号: 2147914

引用回帖:

2楼: Originally posted by noirland at 2013-04-11 15:10:57
在线学习？LZ是想说监督学习么？
强化学习最大的优点是在与外界环境的交互过程中进行学习，而不依赖于系统的模型。
话说，强化学习在控制方面有很多研究内容啊，

对的啊，做了一个比较模糊的监督目标，但是主要还是靠TD的值函数，可是感觉结合在一起效果差强人意

赞一下

回复此楼

12楼2013-04-11 16:52:36

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

查看全部 31 个回答

最具人气热帖推荐 [查看全部]		作者	回/看	最后发表

[考研] 【求调剂】085601材料工程专硕 \| 总分272 \| +6	脚滑的守法公民 2026-03-27	6/300	2026-03-28 11:02 by gjlllb
[考研] 289求调剂 +10	新时代材料 2026-03-27	10/500	2026-03-28 09:53 by 无际的草原
[考研] 266求调剂 +11	阳阳哇塞 2026-03-27	12/600	2026-03-27 17:56 by yu221
[考研] 材料与化工（0856）304求B区调剂 +7	邱gl 2026-03-27	7/350	2026-03-27 15:27 by Joe率
[考研] 一志愿211，335分，0856，求调剂院校和导师 +4	倾____萧 2026-03-27	5/250	2026-03-27 11:52 by zhshch
[考研] 求调剂 +3	刘柯@ 2026-03-24	4/200	2026-03-27 11:28 by shangxh
[考研] 276求调剂。有半年电池和半年高分子实习经历 +10	材料学257求调剂 2026-03-23	11/550	2026-03-27 10:13 by YCIT- LHL
[考研] 329求调剂 +7	钮恩雪 2026-03-25	7/350	2026-03-27 04:28 by wxiongid
[考研] 341求调剂 +7	青柠檬1 2026-03-26	7/350	2026-03-27 00:19 by wxiongid
[考研] 327求调剂 +7	prayer13 2026-03-23	7/350	2026-03-26 20:48 by 不吃魚的貓
[考研] 一志愿211 初试270分求调剂 +6	谷雨上岸 2026-03-23	7/350	2026-03-26 18:55 by 不吃魚的貓
[考研] 289求调剂 +17	硕星赴 2026-03-23	17/850	2026-03-26 16:18 by 不吃魚的貓
[考研] 290分调剂求助 +3	吉祥止止陈 2026-03-25	3/150	2026-03-25 19:58 by barlinike
[考研] 考研一志愿苏州大学初始315（英一）求调剂 +3	sbdksD 2026-03-24	4/200	2026-03-25 18:16 by xcjcqu
[考研] 材料调剂 +3	iwinso 2026-03-23	3/150	2026-03-25 11:29 by greychen00
[考研] 340求调剂 +5	话梅糖111 2026-03-24	5/250	2026-03-25 06:53 by ilovexiaobin
[考研] 求调剂 +6	研研，接电话 2026-03-24	7/350	2026-03-24 17:01 by barlinike
[考研] 环境学硕288求调剂 +8	皮皮皮123456 2026-03-22	8/400	2026-03-23 23:47 by 热情沙漠
[考研] 336化工调剂 +4	王大坦1 2026-03-23	5/250	2026-03-23 18:32 by allen-yin
[考研] 275求调剂 +6	shansx 2026-03-22	8/400	2026-03-22 15:27 by barlinike

24小时热门版块排行榜

jermerneyyin

[交流] 关于强化学习，自适应动态规划和在线学习

» 猜你喜欢

» 本主题相关价值贴推荐，对您同样有帮助:

» 抢金币啦！回帖就可以得到: 查看全部散金贴

jermerneyyin

noirland

nono2009

jermerneyyin

» 抢金币啦！回帖就可以得到:

查看全部散金贴