版块导航
正在加载中...
客户端APP下载
论文辅导
调剂小程序
登录
注册
帖子
帖子
用户
本版
应《网络安全法》要求,自2017年10月1日起,未进行实名认证将不得使用互联网跟帖服务。为保障您的帐号能够正常使用,请尽快对帐号进行手机号验证,感谢您的理解与支持!
24小时热门版块排行榜
>
论坛更新日志
(571)
>
虫友互识
(36)
>
休闲灌水
(19)
>
考博
(17)
>
论文投稿
(12)
>
导师招生
(9)
>
基金申请
(7)
>
硕博家园
(7)
>
教师之家
(6)
>
公派出国
(6)
>
考研
(6)
>
有机资源
(5)
>
论文道贺祈福
(5)
>
文献求助
(5)
>
博后之家
(3)
>
留学生活
(2)
小木虫论坛-学术科研互动平台
»
计算模拟区
»
计算模拟
»
关于强化学习,自适应动态规划和在线学习
5
1/1
返回列表
查看: 3156 | 回复: 30
只看楼主
@他人
存档
新回复提醒
(忽略)
收藏
在APP中查看
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖
jermerneyyin
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 107.8
帖子: 35
在线: 218.1小时
虫号: 2147914
[交流]
关于强化学习,自适应动态规划和在线学习
想跟各位牛人交流下,最近在做强化学习的算法应用,采用强化学习和在线学习的结合,可是结果仅仅是控制器的鲁棒性和适应性增强,关键的结果精度并没有比单纯的采用在线学习好很多,是因为算法的问题还是仿真模拟的问题?
回复此楼
» 猜你喜欢
深圳大学2026年秋博士招生-物理学-活性胶体方向-高永祥课题组
已经有18人回复
论物质与能量的统一模型及物理现象解释
已经有0人回复
物理学I论文润色/翻译怎么收费?
已经有284人回复
基于基元I统一理论的数学相关应用推导
已经有0人回复
基元I统一理论:宇宙本质、层级演化与修炼文明的本源规律
已经有1人回复
基元I理论下三大核心空间现象精准推导与细节解析
已经有0人回复
基于基元 I 统一理论的反重力理论推导
已经有0人回复
基于基元I统一理论的量子力学本源推导
已经有1人回复
推荐一款可以AI辅助写作的Latex编辑器SmartLatexEditor,超级好用,AI润色,全免费
已经有20人回复
【EI|Scopus 双检索】第六届智能机器人系统国际会议(ISoIRS 2026)
已经有0人回复
2026年第四届电动车与车辆工程国际会议(CEVVE 2026)
已经有0人回复
高级回复
» 本主题相关价值贴推荐,对您同样有帮助:
有关于参数的自适应以及自适应观测器
已经有7人回复
» 抢金币啦!回帖就可以得到:
查看全部散金贴
医学超声影像负责人招聘-中国科学院赣江创新研究院
+
1
/981
西湖大学拓扑光学、非厄米光学、太赫兹方向博士后招聘
+
2
/266
西湖大学拓扑光学、非厄米光学、太赫兹方向博士后招聘
+
2
/264
-大龄未婚男找女朋友结婚
+
1
/241
西南科技大学曹克课题组招收2026级申请考核制有机化学博士研究生
+
1
/176
华南师范大学(211)- 光电科学与工程学院 - 申请审核制(2026年4-5月份面试考核)
+
2
/106
香港科技大学(广州)黄加强课题组智能电池方向博士招聘
+
1
/79
哈工大医康学院材料模拟计算方向人才招聘
+
1
/78
广州大学“长江学者”教授团队2026年海内外高层次人才招聘(环境/化学/生物)
+
1
/77
上海交通大学大气环境科学课题组招收2026年入学博士生
+
1
/27
澳大利亚麦考瑞大学(Macquarie University)国际博士硕士全额奖学金-计算机-26年中开学
+
1
/16
澳门理工大学 2026 Fall 奖学金博士招生 (AI药物与蛋白质设计,干湿结合)
+
1
/9
广东省环境科学研究院招聘高分辨质谱方向博士一名
+
1
/7
武汉理工大学数学与统计学院张秀军教授课题组招收2026级秋季博士研究生
+
1
/6
香港中文大学(深圳)陈筱萌 课题组招生公告(博士 / 博后 / 硕士 / RA)
+
1
/5
【科研助理招聘-北京理工大学-集成电路与电子学院-国家杰青团队】
+
1
/3
26储能博士申请自荐
+
1
/3
太原理工大学集成电路学院院长团队招收2026年博士研究生
+
1
/2
美国密苏里大学“柔性电子”课题组诚聘博士研究生和博士后
+
1
/2
斯德哥尔摩 DigitalFuture 博士后奖学金机会!
+
1
/2
1楼
2013-04-11 09:46:46
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
Alfred_S
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 160.5
帖子: 18
在线: 2小时
虫号: 4156410
★
小木虫: 金币+0.5, 给个红包,谢谢回帖
引用回帖:
20楼
:
Originally posted by
jermerneyyin
at 2015-03-12 16:07:52
你好,你现在还在做这方面吗,我最近一直没有登录小木虫,不好意思。如果你需要,我可以发一些我的资料...
楼主你好,我最近也在做ADP这一块,有些不知道如何编程实现,能否发一些资料给我啊,特别是连续时间约束输入的非线性系统编程有些棘手,谢谢啦!
赞
一下
回复此楼
高级回复
31楼
2017-03-12 20:12:16
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
查看全部 31 个回答
noirland
铁杆木虫
(正式写手)
应助: 10
(幼儿园)
金币: 11462.1
帖子: 439
在线: 277.7小时
虫号: 683684
★
jermerneyyin(金币+1): 谢谢参与
在线学习?LZ是想说监督学习么?
强化学习最大的优点是在与外界环境的交互过程中进行学习,而不依赖于系统的模型。
话说,强化学习在控制方面有很多研究内容啊,
赞
一下
回复此楼
2楼
2013-04-11 15:10:57
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
nono2009
超级版主
(文学泰斗)
专家经验: +21105
应助: 28684
(院士)
贵宾: 513.911
金币: 2555220
帖子: 1602255
在线: 65200.9小时
虫号: 827383
★
jermerneyyin(金币+1): 谢谢参与
1+1<2很正常,如果单纯的采用在线学习的效果已经够好了。
赞
一下
回复此楼
3楼
2013-04-11 15:18:36
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
jermerneyyin
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 107.8
帖子: 35
在线: 218.1小时
虫号: 2147914
引用回帖:
3楼
:
Originally posted by
nono2009
at 2013-04-11 15:18:36
1+1<2很正常,如果单纯的采用在线学习的效果已经够好了。
对,有时候确实有这个感觉,不过有强化学习系统适应性好了很多,现在有点迷茫要不要继续在强化学习方面做下去了
赞
一下
回复此楼
11楼
2013-04-11 16:51:12
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
查看全部 31 个回答
如果回帖内容含有宣传信息,请如实选中。否则帐号将被全论坛禁言
普通表情
龙
兔
虎
猫
高级回复
(可上传附件)
百度网盘
|
360云盘
|
千易网盘
|
华为网盘
在新窗口页面中打开自己喜欢的网盘网站,将文件上传后,然后将下载链接复制到帖子内容中就可以了。
信息提示
关闭
请填处理意见
关闭
确定