版块导航
正在加载中...
客户端APP下载
论文辅导
调剂小程序
登录
注册
帖子
帖子
用户
本版
应《网络安全法》要求,自2017年10月1日起,未进行实名认证将不得使用互联网跟帖服务。为保障您的帐号能够正常使用,请尽快对帐号进行手机号验证,感谢您的理解与支持!
24小时热门版块排行榜
>
论坛更新日志
(2541)
>
虫友互识
(120)
>
文献求助
(108)
>
基金申请
(87)
>
导师招生
(54)
>
硕博家园
(42)
>
考博
(32)
>
休闲灌水
(28)
>
博后之家
(15)
>
论文投稿
(14)
>
教师之家
(13)
>
考研
(11)
>
标准与专利
(9)
>
标准求助
(8)
>
海外博后
(8)
>
招聘信息布告栏
(8)
小木虫论坛-学术科研互动平台
»
计算模拟区
»
计算模拟
»
关于强化学习,自适应动态规划和在线学习
5
1/1
返回列表
查看: 3130 | 回复: 30
只看楼主
@他人
存档
新回复提醒
(忽略)
收藏
在APP中查看
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖
jermerneyyin
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 107.8
帖子: 35
在线: 218.1小时
虫号: 2147914
[交流]
关于强化学习,自适应动态规划和在线学习
想跟各位牛人交流下,最近在做强化学习的算法应用,采用强化学习和在线学习的结合,可是结果仅仅是控制器的鲁棒性和适应性增强,关键的结果精度并没有比单纯的采用在线学习好很多,是因为算法的问题还是仿真模拟的问题?
回复此楼
» 猜你喜欢
深圳大学2026年秋博士招生-物理学-活性胶体方向-高永祥课题组
已经有18人回复
论物质与能量的统一模型及物理现象解释
已经有0人回复
物理学I论文润色/翻译怎么收费?
已经有125人回复
基于基元I统一理论的数学相关应用推导
已经有0人回复
基元I统一理论:宇宙本质、层级演化与修炼文明的本源规律
已经有1人回复
基元I理论下三大核心空间现象精准推导与细节解析
已经有0人回复
基于基元 I 统一理论的反重力理论推导
已经有0人回复
基于基元I统一理论的量子力学本源推导
已经有1人回复
推荐一款可以AI辅助写作的Latex编辑器SmartLatexEditor,超级好用,AI润色,全免费
已经有20人回复
【EI|Scopus 双检索】第六届智能机器人系统国际会议(ISoIRS 2026)
已经有0人回复
2026年第四届电动车与车辆工程国际会议(CEVVE 2026)
已经有0人回复
高级回复
» 本主题相关价值贴推荐,对您同样有帮助:
有关于参数的自适应以及自适应观测器
已经有7人回复
» 抢金币啦!回帖就可以得到:
查看全部散金贴
西南科技大学曹克课题组招收2026级申请考核制有机化学博士研究生
+
1
/176
澳洲西澳大学Dr Yiran Liu招全额奖学金和CSC奖学金博士生(3.8万澳币/年)
+
1
/107
哈工大医康学院材料模拟计算方向人才招聘
+
1
/79
感谢小木虫的缘分
+
1
/41
罗格斯大学纽瓦克校区(Rutgers-Newark) 招收 PHD,计算材料物理方向
+
1
/39
澳大利亚麦考瑞大学(Macquarie University)国际博士硕士全额奖学金-计算机-26年中开学
+
1
/38
湘潭大学“过程强化与绿色化工”创新团队补招2026年秋入学博士生
+
2
/28
上海交大药学院侯四化课题组招收2名2026年秋季入学申请-考核制博士生
+
1
/27
华南师范大学(211)- 光电科学与工程学院 - 申请审核制(2026年4-5月份面试考核)
+
2
/24
中科院深圳先进技术研究院招聘免疫及计算生物学方向博士后、科研助理或联培学生
+
1
/19
中国科学技术大学环境系招生
+
1
/11
上海工程技术大学张培磊教授团队招收博士生
+
1
/10
澳门大学生物医学影像实验室诚招博士生(2026秋季入学)
+
1
/10
26储能博士申请自荐
+
1
/5
北京信息科技大学仪器科学与光电工程学院【周哲海】教授团队招收博士研究生
+
1
/5
广东工业大学马琳教授课题组招收2026年博士(材料物理与化学、光学专业)
+
1
/4
2026年 陕西科技大学 环境学院 招收博士生(化学/材料/环境/生物 背景均可)
+
1
/4
美国密苏里大学“柔性电子”课题组诚招博士研究生
+
1
/3
【经验分享】CRISPR基因敲除细胞系构建全流程踩坑指南——从递送方式选择到克隆筛选
+
1
/2
求助化学专业科技论文写作的课件及电子版教材
+
1
/1
1楼
2013-04-11 09:46:46
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
jermerneyyin
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 107.8
帖子: 35
在线: 218.1小时
虫号: 2147914
引用回帖:
3楼
:
Originally posted by
nono2009
at 2013-04-11 15:18:36
1+1<2很正常,如果单纯的采用在线学习的效果已经够好了。
对,有时候确实有这个感觉,不过有强化学习系统适应性好了很多,现在有点迷茫要不要继续在强化学习方面做下去了
赞
一下
回复此楼
高级回复
11楼
2013-04-11 16:51:12
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
查看全部 31 个回答
noirland
铁杆木虫
(正式写手)
应助: 10
(幼儿园)
金币: 11462.1
帖子: 439
在线: 277.7小时
虫号: 683684
★
jermerneyyin(金币+1): 谢谢参与
在线学习?LZ是想说监督学习么?
强化学习最大的优点是在与外界环境的交互过程中进行学习,而不依赖于系统的模型。
话说,强化学习在控制方面有很多研究内容啊,
赞
一下
回复此楼
2楼
2013-04-11 15:10:57
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
nono2009
超级版主
(文学泰斗)
专家经验: +21105
应助: 28684
(院士)
贵宾: 513.911
金币: 2555220
帖子: 1602255
在线: 65200.9小时
虫号: 827383
★
jermerneyyin(金币+1): 谢谢参与
1+1<2很正常,如果单纯的采用在线学习的效果已经够好了。
赞
一下
回复此楼
3楼
2013-04-11 15:18:36
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
jermerneyyin
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 107.8
帖子: 35
在线: 218.1小时
虫号: 2147914
引用回帖:
2楼
:
Originally posted by
noirland
at 2013-04-11 15:10:57
在线学习?LZ是想说监督学习么?
强化学习最大的优点是在与外界环境的交互过程中进行学习,而不依赖于系统的模型。
话说,强化学习在控制方面有很多研究内容啊,
对的啊,做了一个比较模糊的监督目标,但是主要还是靠TD的值函数,可是感觉结合在一起效果差强人意
赞
一下
回复此楼
12楼
2013-04-11 16:52:36
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
查看全部 31 个回答
如果回帖内容含有宣传信息,请如实选中。否则帐号将被全论坛禁言
普通表情
龙
兔
虎
猫
高级回复
(可上传附件)
百度网盘
|
360云盘
|
千易网盘
|
华为网盘
在新窗口页面中打开自己喜欢的网盘网站,将文件上传后,然后将下载链接复制到帖子内容中就可以了。
信息提示
关闭
请填处理意见
关闭
确定