版块导航
正在加载中...
客户端APP下载
论文辅导
申博辅导
登录
注册
帖子
帖子
用户
本版
应《网络安全法》要求,自2017年10月1日起,未进行实名认证将不得使用互联网跟帖服务。为保障您的帐号能够正常使用,请尽快对帐号进行手机号验证,感谢您的理解与支持!
24小时热门版块排行榜
>
论坛更新日志
(3178)
>
虫友互识
(243)
>
导师招生
(213)
>
文献求助
(203)
>
论文投稿
(70)
>
休闲灌水
(60)
>
硕博家园
(56)
>
公派出国
(50)
>
考博
(46)
>
招聘信息布告栏
(41)
>
论文道贺祈福
(33)
>
教师之家
(30)
>
催化
(30)
>
找工作
(28)
>
博后之家
(26)
>
基金申请
(26)
小木虫论坛-学术科研互动平台
»
计算模拟区
»
计算模拟
»
关于强化学习,自适应动态规划和在线学习
31
1/1
返回列表
查看: 2992 | 回复: 30
只看楼主
@他人
存档
新回复提醒
(忽略)
收藏
在APP中查看
jermerneyyin
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 107.8
帖子: 35
在线: 218.1小时
虫号: 2147914
[交流]
关于强化学习,自适应动态规划和在线学习
想跟各位牛人交流下,最近在做强化学习的算法应用,采用强化学习和在线学习的结合,可是结果仅仅是控制器的鲁棒性和适应性增强,关键的结果精度并没有比单纯的采用在线学习好很多,是因为算法的问题还是仿真模拟的问题?
回复此楼
» 猜你喜欢
反铁磁体中的磁性切换:两种不同的机制已成功可视化
已经有0人回复
求标准粉末衍射卡号 ICDD 01-076-1802
已经有0人回复
物理学I论文润色/翻译怎么收费?
已经有160人回复
新西兰Robinson研究所招收全奖PhD
已经有0人回复
石墨烯转移--二氧化硅衬底石墨烯
已经有0人回复
笼目材料中量子自旋液体基态的证据
已经有0人回复
数学教学论硕士可以读数学物理博士吗?
已经有0人回复
德国亥姆霍兹Hereon中心汉堡分部招镁合金腐蚀裂变SCC课题方向2026公派博士生
已经有4人回复
澳门大学 应用物理及材料工程研究院 潘晖教授课题组诚招博士后
已经有11人回复
高级回复
» 本主题相关价值贴推荐,对您同样有帮助:
有关于参数的自适应以及自适应观测器
已经有7人回复
» 抢金币啦!回帖就可以得到:
查看全部散金贴
武汉纺织大学电子与电气工程学院------院长团队招聘光电、材料类博士,博士后
+
1
/486
博士去军队文职怎么样
+
5
/270
上海交通大学医学院王戈林课题组招聘博士后和助理研究员
+
1
/269
16年了,来看看大家
+
1
/198
中国科学院大学纳米科学与工程学院唐智勇(院长)-张银团队招聘启事
+
1
/169
原子层沉积(ALD)磁控溅射PECVD等微纳代工服务:18817872921
+
1
/93
上海大学昝鹏教授、军事医学研究院伯晓晨研究员/倪铭副研究员 课题组招聘博士生
+
1
/80
内蒙古大学能源材料化学研究院招聘2026年博士生
+
1
/75
87 年东北小哥定居苏州(沪杭亦可),诚寻携手余生的你
+
1
/55
国重点实验室双一流A类长江学者团队招2026年全日制博士1-2名/博后1-2名
+
2
/44
中国科学院大连化学物理研究所DNL0902研究组招聘博士后和职工
+
1
/32
厦门大学航空航天学院智能制造课题组招2026年申请审核制博士生1-2名
+
1
/31
西北工业大学无人飞行器技术全国重点实验室拟招收电机/自动化方向博士1~2名
+
1
/30
华中科技大学龚江研究员课题组诚招博士研究生、科研助理和博士后
+
3
/21
2026年黄河科技学院纳米功能材料研究所招聘
+
2
/16
北京工业大学材料学院吴玉锋教授、王长龙研究员招收博士研究生
+
1
/8
中科院深圳理工大学网络课题组招聘博后/RA/实习生
+
1
/7
2026 博士自荐-机器人机构学方向
+
1
/7
求博导收留
+
1
/5
深容SCI智能体四大模块:Method, Introduction, Discussion, Abstract
+
1
/3
1楼
2013-04-11 09:46:46
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
回帖支持 ( 显示支持度最高的前 50 名 )
jermerneyyin
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 107.8
帖子: 35
在线: 218.1小时
虫号: 2147914
引用回帖:
19楼
:
Originally posted by
微笑去坚持
at 2013-06-06 20:59:02
你好,我最近也在学习动态规划,想用动态规划求解一般动力学系统的最优控制律和最优轨线,但不知道该如何编程实现,麻烦指点一下我应该从哪几个方面考虑编程。...
你好,你现在还在做这方面吗,我最近一直没有登录小木虫,不好意思。如果你需要,我可以发一些我的资料
赞
一下
(3人)
回复此楼
20楼
2015-03-12 16:07:52
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
普通回帖
noirland
铁杆木虫
(正式写手)
应助: 10
(幼儿园)
金币: 11462.1
帖子: 439
在线: 277.7小时
虫号: 683684
★
jermerneyyin(金币+1): 谢谢参与
在线学习?LZ是想说监督学习么?
强化学习最大的优点是在与外界环境的交互过程中进行学习,而不依赖于系统的模型。
话说,强化学习在控制方面有很多研究内容啊,
赞
一下
回复此楼
2楼
2013-04-11 15:10:57
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
nono2009
超级版主
(文学泰斗)
专家经验: +21105
应助: 28684
(院士)
贵宾: 513.911
金币: 2555220
帖子: 1602255
在线: 65200.9小时
虫号: 827383
★
jermerneyyin(金币+1): 谢谢参与
1+1<2很正常,如果单纯的采用在线学习的效果已经够好了。
赞
一下
回复此楼
3楼
2013-04-11 15:18:36
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
vsscn
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 3.8
帖子: 3
在线: 9.2小时
虫号: 2152484
★
jermerneyyin(金币+1): 谢谢参与
xuexi
回复此楼
7楼
2013-04-11 15:29:37
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
jermerneyyin
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 107.8
帖子: 35
在线: 218.1小时
虫号: 2147914
引用回帖:
3楼
:
Originally posted by
nono2009
at 2013-04-11 15:18:36
1+1<2很正常,如果单纯的采用在线学习的效果已经够好了。
对,有时候确实有这个感觉,不过有强化学习系统适应性好了很多,现在有点迷茫要不要继续在强化学习方面做下去了
赞
一下
回复此楼
11楼
2013-04-11 16:51:12
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
jermerneyyin
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 107.8
帖子: 35
在线: 218.1小时
虫号: 2147914
引用回帖:
2楼
:
Originally posted by
noirland
at 2013-04-11 15:10:57
在线学习?LZ是想说监督学习么?
强化学习最大的优点是在与外界环境的交互过程中进行学习,而不依赖于系统的模型。
话说,强化学习在控制方面有很多研究内容啊,
对的啊,做了一个比较模糊的监督目标,但是主要还是靠TD的值函数,可是感觉结合在一起效果差强人意
赞
一下
回复此楼
12楼
2013-04-11 16:52:36
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
noirland
铁杆木虫
(正式写手)
应助: 10
(幼儿园)
金币: 11462.1
帖子: 439
在线: 277.7小时
虫号: 683684
★
csgt0: 金币+1, 欢迎交流
2013-04-12 14:29:37
引用回帖:
12楼
:
Originally posted by
jermerneyyin
at 2013-04-11 16:52:36
对的啊,做了一个比较模糊的监督目标,但是主要还是靠TD的值函数,可是感觉结合在一起效果差强人意...
话说,楼主可以尝试一下Q学习,将Q学习与模糊控制结合一下,通过模糊系统估计actor-state值函数,这样做下去,我觉得可以。
赞
一下
回复此楼
14楼
2013-04-11 18:56:19
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
jermerneyyin
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 107.8
帖子: 35
在线: 218.1小时
虫号: 2147914
引用回帖:
14楼
:
Originally posted by
noirland
at 2013-04-11 18:56:19
话说,楼主可以尝试一下Q学习,将Q学习与模糊控制结合一下,通过模糊系统估计actor-state值函数,这样做下去,我觉得可以。...
我在想要不要常使用自适应动态规划方面的知识解决这个问题
赞
一下
回复此楼
15楼
2013-04-11 21:16:35
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
dreamingcon
禁虫
(正式写手)
★
jermerneyyin(金币+1): 谢谢参与
本帖内容被屏蔽
16楼
2013-04-12 13:56:12
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
av470463442
金虫
(正式写手)
应助: 5
(幼儿园)
金币: 6172
帖子: 873
在线: 82.7小时
虫号: 2070117
★
jermerneyyin(金币+1): 谢谢参与
多项式神经网络
回复此楼
18楼
2013-05-10 09:06:28
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
微笑去坚持
金虫
(正式写手)
应助: 0
(幼儿园)
金币: 615.2
帖子: 460
在线: 146.4小时
虫号: 2331871
★
jermerneyyin(金币+1): 谢谢参与
引用回帖:
15楼
:
Originally posted by
jermerneyyin
at 2013-04-11 21:16:35
我在想要不要常使用自适应动态规划方面的知识解决这个问题...
你好,我最近也在学习动态规划,想用动态规划求解一般动力学系统的最优控制律和最优轨线,但不知道该如何编程实现,麻烦指点一下我应该从哪几个方面考虑编程。
赞
一下
回复此楼
19楼
2013-06-06 20:59:02
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
sjlfeiying
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 9.3
帖子: 4
在线: 2.8小时
虫号: 3627093
★
jermerneyyin(金币+1): 谢谢参与
我最近也在学习强化学习与动态规划,可不怎么会仿真啊
赞
一下
回复此楼
21楼
2015-03-31 15:02:03
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
cx1027
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 0.8
帖子: 5
在线: 1.8小时
虫号: 3847473
★
jermerneyyin(金币+1): 谢谢参与
我现在刚开始做强化学习和learning classifier system 另一个方向是scheduling 不知道怎么选 感觉做LCS和scheduling的人都很少 是因为没有什么前景嘛?
赞
一下
回复此楼
22楼
2015-05-06 05:05:25
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
漫游闲庭信步
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 51.3
帖子: 8
在线: 11.6小时
虫号: 3734337
★
jermerneyyin(金币+1): 谢谢参与
我也在学习强化学习的编程,因为前面没有师兄师姐做过,目前有点无从下手的感觉
赞
一下
回复此楼
23楼
2015-06-02 15:25:42
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
漫游闲庭信步
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 51.3
帖子: 8
在线: 11.6小时
虫号: 3734337
引用回帖:
20楼
:
Originally posted by
jermerneyyin
at 2015-03-12 16:07:52
你好,你现在还在做这方面吗,我最近一直没有登录小木虫,不好意思。如果你需要,我可以发一些我的资料...
我也在摸索如何编程实现,可以发些资料让我看看吗
赞
一下
回复此楼
24楼
2015-06-03 09:03:21
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
sjlfeiying
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 9.3
帖子: 4
在线: 2.8小时
虫号: 3627093
引用回帖:
23楼
:
Originally posted by
漫游闲庭信步
at 2015-06-02 15:25:42
我也在学习强化学习的编程,因为前面没有师兄师姐做过,目前有点无从下手的感觉
同感!
回复此楼
25楼
2015-06-07 16:29:39
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
ucihqtep
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 3.3
帖子: 8
在线: 4.2小时
虫号: 3453348
★
jermerneyyin(金币+1): 谢谢参与
请教楼主现在还在进行相关的研究吗?
想请教楼主些问题
赞
一下
回复此楼
26楼
2015-07-11 13:02:15
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
jermerneyyin
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 107.8
帖子: 35
在线: 218.1小时
虫号: 2147914
引用回帖:
26楼
:
Originally posted by
ucihqtep
at 2015-07-11 13:02:15
请教楼主现在还在进行相关的研究吗?
想请教楼主些问题
在的,私信我
回复此楼
27楼
2015-07-12 09:28:32
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
1132520084
新虫
(小有名气)
应助: 3
(幼儿园)
金币: 2224.6
帖子: 127
在线: 37.1小时
虫号: 3328646
★
jermerneyyin(金币+1): 谢谢参与
收藏了,回头找楼主请教问题~
赞
一下
回复此楼
28楼
2015-07-23 17:16:17
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
戴草帽的猴子
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 23.3
帖子: 2
在线: 2.5小时
虫号: 3647916
★
jermerneyyin(金币+1): 谢谢参与
需要这方面得材料啊!
赞
一下
回复此楼
29楼
2015-09-11 09:39:32
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
Y花影
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 428.4
帖子: 17
在线: 9.4小时
虫号: 4322072
★
小木虫: 金币+0.5, 给个红包,谢谢回帖
引用回帖:
20楼
:
Originally posted by
jermerneyyin
at 2015-03-12 16:07:52
你好,你现在还在做这方面吗,我最近一直没有登录小木虫,不好意思。如果你需要,我可以发一些我的资料...
您好,我也在学习 DP以及SDP可不可以发给我一些相关的资料和程序谢谢您
赞
一下
回复此楼
30楼
2016-04-12 17:22:13
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
Alfred_S
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 160.5
帖子: 18
在线: 2小时
虫号: 4156410
★
小木虫: 金币+0.5, 给个红包,谢谢回帖
引用回帖:
20楼
:
Originally posted by
jermerneyyin
at 2015-03-12 16:07:52
你好,你现在还在做这方面吗,我最近一直没有登录小木虫,不好意思。如果你需要,我可以发一些我的资料...
楼主你好,我最近也在做ADP这一块,有些不知道如何编程实现,能否发一些资料给我啊,特别是连续时间约束输入的非线性系统编程有些棘手,谢谢啦!
赞
一下
回复此楼
31楼
2017-03-12 20:12:16
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
简单回复
yaoyao145
4楼
2013-04-11 15:18
回复
jermerneyyin(金币+1): 谢谢参与
readytogo
5楼
2013-04-11 15:18
回复
jermerneyyin(金币+1): 谢谢参与
黄山松50
6楼
2013-04-11 15:23
回复
jermerneyyin(金币+1): 谢谢参与
失落的豇豆
8楼
2013-04-11 15:34
回复
jermerneyyin(金币+1): 谢谢参与
shinyzd
9楼
2013-04-11 16:01
回复
jermerneyyin(金币+1): 谢谢参与
樱木花道6
10楼
2013-04-11 16:33
回复
jermerneyyin(金币+1): 谢谢参与
flyxu
13楼
2013-04-11 16:57
回复
jermerneyyin(金币+1): 谢谢参与
haixiawu
17楼
2013-04-13 09:35
回复
jermerneyyin(金币+1): 谢谢参与
相关版块跳转
第一性原理
量子化学
计算模拟
分子模拟
仿真模拟
程序语言
我要订阅楼主
jermerneyyin
的主题更新
31
1/1
返回列表
如果回帖内容含有宣传信息,请如实选中。否则帐号将被全论坛禁言
普通表情
龙
兔
虎
猫
高级回复
(可上传附件)
百度网盘
|
360云盘
|
千易网盘
|
华为网盘
在新窗口页面中打开自己喜欢的网盘网站,将文件上传后,然后将下载链接复制到帖子内容中就可以了。
信息提示
关闭
请填处理意见
关闭
确定