版块导航
正在加载中...
客户端APP下载
论文辅导
调剂小程序
登录
注册
帖子
帖子
用户
本版
应《网络安全法》要求,自2017年10月1日起,未进行实名认证将不得使用互联网跟帖服务。为保障您的帐号能够正常使用,请尽快对帐号进行手机号验证,感谢您的理解与支持!
24小时热门版块排行榜
>
论坛更新日志
(3938)
>
虫友互识
(423)
>
文献求助
(421)
>
导师招生
(239)
>
休闲灌水
(157)
>
硕博家园
(135)
>
基金申请
(118)
>
考博
(113)
>
考研
(54)
>
博后之家
(52)
>
论文道贺祈福
(50)
>
招聘信息布告栏
(49)
>
论文投稿
(48)
>
海外博后
(30)
>
教师之家
(29)
>
绿色求助(高悬赏)
(28)
小木虫论坛-学术科研互动平台
»
计算模拟区
»
计算模拟
»
关于强化学习,自适应动态规划和在线学习
5
1/1
返回列表
查看: 3153 | 回复: 30
只看楼主
@他人
存档
新回复提醒
(忽略)
收藏
在APP中查看
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖
jermerneyyin
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 107.8
帖子: 35
在线: 218.1小时
虫号: 2147914
[交流]
关于强化学习,自适应动态规划和在线学习
想跟各位牛人交流下,最近在做强化学习的算法应用,采用强化学习和在线学习的结合,可是结果仅仅是控制器的鲁棒性和适应性增强,关键的结果精度并没有比单纯的采用在线学习好很多,是因为算法的问题还是仿真模拟的问题?
回复此楼
» 猜你喜欢
深圳大学2026年秋博士招生-物理学-活性胶体方向-高永祥课题组
已经有18人回复
论物质与能量的统一模型及物理现象解释
已经有0人回复
物理学I论文润色/翻译怎么收费?
已经有249人回复
基于基元I统一理论的数学相关应用推导
已经有0人回复
基元I统一理论:宇宙本质、层级演化与修炼文明的本源规律
已经有1人回复
基元I理论下三大核心空间现象精准推导与细节解析
已经有0人回复
基于基元 I 统一理论的反重力理论推导
已经有0人回复
基于基元I统一理论的量子力学本源推导
已经有1人回复
推荐一款可以AI辅助写作的Latex编辑器SmartLatexEditor,超级好用,AI润色,全免费
已经有20人回复
【EI|Scopus 双检索】第六届智能机器人系统国际会议(ISoIRS 2026)
已经有0人回复
2026年第四届电动车与车辆工程国际会议(CEVVE 2026)
已经有0人回复
高级回复
» 本主题相关价值贴推荐,对您同样有帮助:
有关于参数的自适应以及自适应观测器
已经有7人回复
» 抢金币啦!回帖就可以得到:
查看全部散金贴
西湖大学2026年秋季入学物理学、光学、电子信息方向博士生有名额速来!!!
+
2
/264
西湖大学拓扑光学、非厄米光学、太赫兹方向博士后招聘
+
2
/262
湖南大学材料院陶益杰老师招收2026年联合培养硕士学生一名
+
1
/180
澳洲西澳大学Dr Yiran Liu招全额奖学金和CSC奖学金博士生(3.8万澳币/年)
+
1
/106
广州大学“长江学者”教授团队2026年海内外高层次人才招聘(环境/化学/生物)
+
1
/77
2025难忘的时刻
+
1
/70
罗格斯大学纽瓦克校区(Rutgers-Newark) 招收 PHD,计算材料物理方向
+
1
/37
北京工业大学化生学院青年教师或“青年优秀人才”招聘启事
+
1
/35
同济大学脑机智能团队脑机接口方向招生招聘
+
1
/31
大叔征婚
+
1
/28
湘潭大学“过程强化与绿色化工”创新团队补招2026年秋入学博士生
+
2
/22
华南师范大学(211)- 光电科学与工程学院 - 申请审核制(2026年4-5月份面试考核)
+
2
/18
中国科学技术大学环境系招生
+
1
/11
中科院深圳先进技术研究院招联培学生 -- 多中心大队列数据已就绪,助你快车道产出成果
+
1
/11
澳科大药诚招2026年秋季药剂学/生物材料硕士研究生
+
1
/5
化学行业,研发出创新的东西是做成项目给公司吃提成,还是自己搞小作坊倒卖?
+
1
/5
澳科大招收2026年秋季药剂学/生物材料方向全奖博士研究生(春节不打烊)
+
1
/4
斯德哥尔摩 DigitalFuture 博士后奖学金机会!
+
1
/2
寻博导
+
1
/2
广东工业大学-化学工程专业博士生招生1-2名
+
1
/1
1楼
2013-04-11 09:46:46
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
sjlfeiying
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 9.3
帖子: 4
在线: 2.8小时
虫号: 3627093
引用回帖:
23楼
:
Originally posted by
漫游闲庭信步
at 2015-06-02 15:25:42
我也在学习强化学习的编程,因为前面没有师兄师姐做过,目前有点无从下手的感觉
同感!
回复此楼
高级回复
25楼
2015-06-07 16:29:39
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
查看全部 31 个回答
noirland
铁杆木虫
(正式写手)
应助: 10
(幼儿园)
金币: 11462.1
帖子: 439
在线: 277.7小时
虫号: 683684
★
jermerneyyin(金币+1): 谢谢参与
在线学习?LZ是想说监督学习么?
强化学习最大的优点是在与外界环境的交互过程中进行学习,而不依赖于系统的模型。
话说,强化学习在控制方面有很多研究内容啊,
赞
一下
回复此楼
2楼
2013-04-11 15:10:57
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
nono2009
超级版主
(文学泰斗)
专家经验: +21105
应助: 28684
(院士)
贵宾: 513.911
金币: 2555220
帖子: 1602255
在线: 65200.9小时
虫号: 827383
★
jermerneyyin(金币+1): 谢谢参与
1+1<2很正常,如果单纯的采用在线学习的效果已经够好了。
赞
一下
回复此楼
3楼
2013-04-11 15:18:36
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
jermerneyyin
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 107.8
帖子: 35
在线: 218.1小时
虫号: 2147914
引用回帖:
3楼
:
Originally posted by
nono2009
at 2013-04-11 15:18:36
1+1<2很正常,如果单纯的采用在线学习的效果已经够好了。
对,有时候确实有这个感觉,不过有强化学习系统适应性好了很多,现在有点迷茫要不要继续在强化学习方面做下去了
赞
一下
回复此楼
11楼
2013-04-11 16:51:12
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
查看全部 31 个回答
如果回帖内容含有宣传信息,请如实选中。否则帐号将被全论坛禁言
普通表情
龙
兔
虎
猫
高级回复
(可上传附件)
百度网盘
|
360云盘
|
千易网盘
|
华为网盘
在新窗口页面中打开自己喜欢的网盘网站,将文件上传后,然后将下载链接复制到帖子内容中就可以了。
信息提示
关闭
请填处理意见
关闭
确定