版块导航
正在加载中...
客户端APP下载
论文辅导
申博辅导
登录
注册
帖子
帖子
用户
本版
应《网络安全法》要求,自2017年10月1日起,未进行实名认证将不得使用互联网跟帖服务。为保障您的帐号能够正常使用,请尽快对帐号进行手机号验证,感谢您的理解与支持!
24小时热门版块排行榜
>
论坛更新日志
(673)
>
虫友互识
(110)
>
导师招生
(24)
>
休闲灌水
(11)
>
硕博家园
(10)
>
论文投稿
(8)
>
博后之家
(5)
>
基金申请
(5)
>
考博
(5)
>
文献求助
(5)
>
论文道贺祈福
(3)
>
催化
(3)
>
公派出国
(3)
>
考研
(3)
>
外文书籍求助
(2)
>
教师之家
(2)
小木虫论坛-学术科研互动平台
»
计算模拟区
»
计算模拟
»
关于强化学习,自适应动态规划和在线学习
5
1/1
返回列表
查看: 2994 | 回复: 30
只看楼主
@他人
存档
新回复提醒
(忽略)
收藏
在APP中查看
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖
jermerneyyin
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 107.8
帖子: 35
在线: 218.1小时
虫号: 2147914
[交流]
关于强化学习,自适应动态规划和在线学习
想跟各位牛人交流下,最近在做强化学习的算法应用,采用强化学习和在线学习的结合,可是结果仅仅是控制器的鲁棒性和适应性增强,关键的结果精度并没有比单纯的采用在线学习好很多,是因为算法的问题还是仿真模拟的问题?
回复此楼
» 猜你喜欢
反铁磁体中的磁性切换:两种不同的机制已成功可视化
已经有0人回复
求标准粉末衍射卡号 ICDD 01-076-1802
已经有0人回复
物理学I论文润色/翻译怎么收费?
已经有176人回复
新西兰Robinson研究所招收全奖PhD
已经有0人回复
石墨烯转移--二氧化硅衬底石墨烯
已经有0人回复
笼目材料中量子自旋液体基态的证据
已经有0人回复
数学教学论硕士可以读数学物理博士吗?
已经有0人回复
德国亥姆霍兹Hereon中心汉堡分部招镁合金腐蚀裂变SCC课题方向2026公派博士生
已经有4人回复
澳门大学 应用物理及材料工程研究院 潘晖教授课题组诚招博士后
已经有11人回复
高级回复
» 本主题相关价值贴推荐,对您同样有帮助:
有关于参数的自适应以及自适应观测器
已经有7人回复
» 抢金币啦!回帖就可以得到:
查看全部散金贴
求一个访问学者邀请函,非常非常感谢
+
1
/679
16年了,来看看大家
+
1
/198
留学导师避雷——望传播
+
1
/90
浙江师范大学国家杰青杨启华教授团队招收2026年博士研究生
+
1
/87
北京-89175-事业单位-诚征女友
+
1
/86
DNA甲基化位点定量试剂盒(qPCR版)-适合特定基因位点5mC定量检测
+
1
/84
上海师范大学生物医用材料方向招收2026级博士研究生
+
1
/84
澳门大学智慧城市物联网国重“结构智能感知、健康监测与无损检测”研究方向博士后招聘
+
1
/77
上海大学昝鹏教授、军事医学研究院伯晓晨研究员/倪铭副研究员 课题组招聘博士生
+
1
/77
依旧想念
+
4
/76
坐标济南,山东农科院招 有机合成 or 药物化学 联培硕士研究生
+
1
/37
深圳信息职业技术大学-博后招聘(优秀可留校)
+
1
/31
SCI,计算机相关可以写
+
1
/26
SCI,计算机相关可以写
+
1
/20
华中科技大学袁书珊教授团队招2026年申请审核制博士生1-2名
+
1
/19
【博士后/科研助理招聘-北京理工大学-集成电路与电子学院-国家杰青团队】
+
1
/9
[招募] 上海交通大学环境健康课题组科研实习生(环境健康与生物学大数据方向)
+
1
/9
美国麻省大学电子工程系招收全奖博士生和博士后
+
1
/7
求博导收留
+
1
/5
代算!材料学理论计算
+
1
/3
1楼
2013-04-11 09:46:46
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
nono2009
超级版主
(文学泰斗)
专家经验: +21105
应助: 28684
(院士)
贵宾: 513.911
金币: 2555220
帖子: 1602255
在线: 65200.9小时
虫号: 827383
★
jermerneyyin(金币+1): 谢谢参与
1+1<2很正常,如果单纯的采用在线学习的效果已经够好了。
赞
一下
回复此楼
高级回复
3楼
2013-04-11 15:18:36
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
查看全部 31 个回答
noirland
铁杆木虫
(正式写手)
应助: 10
(幼儿园)
金币: 11462.1
帖子: 439
在线: 277.7小时
虫号: 683684
★
jermerneyyin(金币+1): 谢谢参与
在线学习?LZ是想说监督学习么?
强化学习最大的优点是在与外界环境的交互过程中进行学习,而不依赖于系统的模型。
话说,强化学习在控制方面有很多研究内容啊,
赞
一下
回复此楼
2楼
2013-04-11 15:10:57
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
jermerneyyin
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 107.8
帖子: 35
在线: 218.1小时
虫号: 2147914
引用回帖:
3楼
:
Originally posted by
nono2009
at 2013-04-11 15:18:36
1+1<2很正常,如果单纯的采用在线学习的效果已经够好了。
对,有时候确实有这个感觉,不过有强化学习系统适应性好了很多,现在有点迷茫要不要继续在强化学习方面做下去了
赞
一下
回复此楼
11楼
2013-04-11 16:51:12
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
jermerneyyin
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 107.8
帖子: 35
在线: 218.1小时
虫号: 2147914
引用回帖:
2楼
:
Originally posted by
noirland
at 2013-04-11 15:10:57
在线学习?LZ是想说监督学习么?
强化学习最大的优点是在与外界环境的交互过程中进行学习,而不依赖于系统的模型。
话说,强化学习在控制方面有很多研究内容啊,
对的啊,做了一个比较模糊的监督目标,但是主要还是靠TD的值函数,可是感觉结合在一起效果差强人意
赞
一下
回复此楼
12楼
2013-04-11 16:52:36
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
查看全部 31 个回答
如果回帖内容含有宣传信息,请如实选中。否则帐号将被全论坛禁言
普通表情
龙
兔
虎
猫
高级回复
(可上传附件)
百度网盘
|
360云盘
|
千易网盘
|
华为网盘
在新窗口页面中打开自己喜欢的网盘网站,将文件上传后,然后将下载链接复制到帖子内容中就可以了。
信息提示
关闭
请填处理意见
关闭
确定