24小时热门版块排行榜    

查看: 2992  |  回复: 30

jermerneyyin

新虫 (初入文坛)


[交流] 关于强化学习,自适应动态规划和在线学习

想跟各位牛人交流下,最近在做强化学习的算法应用,采用强化学习和在线学习的结合,可是结果仅仅是控制器的鲁棒性和适应性增强,关键的结果精度并没有比单纯的采用在线学习好很多,是因为算法的问题还是仿真模拟的问题?
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

» 抢金币啦!回帖就可以得到:

查看全部散金贴

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
回帖支持 ( 显示支持度最高的前 50 名 )

jermerneyyin

新虫 (初入文坛)


引用回帖:
19楼: Originally posted by 微笑去坚持 at 2013-06-06 20:59:02
你好,我最近也在学习动态规划,想用动态规划求解一般动力学系统的最优控制律和最优轨线,但不知道该如何编程实现,麻烦指点一下我应该从哪几个方面考虑编程。...

你好,你现在还在做这方面吗,我最近一直没有登录小木虫,不好意思。如果你需要,我可以发一些我的资料
20楼2015-03-12 16:07:52
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通回帖

noirland

铁杆木虫 (正式写手)



jermerneyyin(金币+1): 谢谢参与
在线学习?LZ是想说监督学习么?
强化学习最大的优点是在与外界环境的交互过程中进行学习,而不依赖于系统的模型。
话说,强化学习在控制方面有很多研究内容啊,
2楼2013-04-11 15:10:57
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

jermerneyyin(金币+1): 谢谢参与
1+1<2很正常,如果单纯的采用在线学习的效果已经够好了。
3楼2013-04-11 15:18:36
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

vsscn

新虫 (初入文坛)



jermerneyyin(金币+1): 谢谢参与
xuexi
7楼2013-04-11 15:29:37
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

jermerneyyin

新虫 (初入文坛)


引用回帖:
3楼: Originally posted by nono2009 at 2013-04-11 15:18:36
1+1<2很正常,如果单纯的采用在线学习的效果已经够好了。

对,有时候确实有这个感觉,不过有强化学习系统适应性好了很多,现在有点迷茫要不要继续在强化学习方面做下去了
11楼2013-04-11 16:51:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

jermerneyyin

新虫 (初入文坛)


引用回帖:
2楼: Originally posted by noirland at 2013-04-11 15:10:57
在线学习?LZ是想说监督学习么?
强化学习最大的优点是在与外界环境的交互过程中进行学习,而不依赖于系统的模型。
话说,强化学习在控制方面有很多研究内容啊,

对的啊,做了一个比较模糊的监督目标,但是主要还是靠TD的值函数,可是感觉结合在一起效果差强人意
12楼2013-04-11 16:52:36
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

noirland

铁杆木虫 (正式写手)



csgt0: 金币+1, 欢迎交流 2013-04-12 14:29:37
引用回帖:
12楼: Originally posted by jermerneyyin at 2013-04-11 16:52:36
对的啊,做了一个比较模糊的监督目标,但是主要还是靠TD的值函数,可是感觉结合在一起效果差强人意...

话说,楼主可以尝试一下Q学习,将Q学习与模糊控制结合一下,通过模糊系统估计actor-state值函数,这样做下去,我觉得可以。
14楼2013-04-11 18:56:19
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

jermerneyyin

新虫 (初入文坛)


引用回帖:
14楼: Originally posted by noirland at 2013-04-11 18:56:19
话说,楼主可以尝试一下Q学习,将Q学习与模糊控制结合一下,通过模糊系统估计actor-state值函数,这样做下去,我觉得可以。...

我在想要不要常使用自适应动态规划方面的知识解决这个问题
15楼2013-04-11 21:16:35
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

dreamingcon

禁虫 (正式写手)


jermerneyyin(金币+1): 谢谢参与
本帖内容被屏蔽

16楼2013-04-12 13:56:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

av470463442

金虫 (正式写手)



jermerneyyin(金币+1): 谢谢参与
多项式神经网络
18楼2013-05-10 09:06:28
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

微笑去坚持

金虫 (正式写手)



jermerneyyin(金币+1): 谢谢参与
引用回帖:
15楼: Originally posted by jermerneyyin at 2013-04-11 21:16:35
我在想要不要常使用自适应动态规划方面的知识解决这个问题...

你好,我最近也在学习动态规划,想用动态规划求解一般动力学系统的最优控制律和最优轨线,但不知道该如何编程实现,麻烦指点一下我应该从哪几个方面考虑编程。
19楼2013-06-06 20:59:02
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sjlfeiying

新虫 (初入文坛)



jermerneyyin(金币+1): 谢谢参与
我最近也在学习强化学习与动态规划,可不怎么会仿真啊
21楼2015-03-31 15:02:03
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

cx1027

新虫 (初入文坛)



jermerneyyin(金币+1): 谢谢参与
我现在刚开始做强化学习和learning classifier system 另一个方向是scheduling 不知道怎么选 感觉做LCS和scheduling的人都很少 是因为没有什么前景嘛?
22楼2015-05-06 05:05:25
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

漫游闲庭信步

新虫 (初入文坛)



jermerneyyin(金币+1): 谢谢参与
我也在学习强化学习的编程,因为前面没有师兄师姐做过,目前有点无从下手的感觉
23楼2015-06-02 15:25:42
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

漫游闲庭信步

新虫 (初入文坛)


引用回帖:
20楼: Originally posted by jermerneyyin at 2015-03-12 16:07:52
你好,你现在还在做这方面吗,我最近一直没有登录小木虫,不好意思。如果你需要,我可以发一些我的资料...

我也在摸索如何编程实现,可以发些资料让我看看吗
24楼2015-06-03 09:03:21
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

sjlfeiying

新虫 (初入文坛)


引用回帖:
23楼: Originally posted by 漫游闲庭信步 at 2015-06-02 15:25:42
我也在学习强化学习的编程,因为前面没有师兄师姐做过,目前有点无从下手的感觉

同感!
25楼2015-06-07 16:29:39
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ucihqtep

新虫 (初入文坛)



jermerneyyin(金币+1): 谢谢参与
请教楼主现在还在进行相关的研究吗?
想请教楼主些问题
26楼2015-07-11 13:02:15
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

jermerneyyin

新虫 (初入文坛)


引用回帖:
26楼: Originally posted by ucihqtep at 2015-07-11 13:02:15
请教楼主现在还在进行相关的研究吗?
想请教楼主些问题

在的,私信我
27楼2015-07-12 09:28:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

1132520084

新虫 (小有名气)



jermerneyyin(金币+1): 谢谢参与
收藏了,回头找楼主请教问题~
28楼2015-07-23 17:16:17
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

戴草帽的猴子

新虫 (初入文坛)



jermerneyyin(金币+1): 谢谢参与
需要这方面得材料啊!
29楼2015-09-11 09:39:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Y花影

新虫 (初入文坛)



小木虫: 金币+0.5, 给个红包,谢谢回帖
引用回帖:
20楼: Originally posted by jermerneyyin at 2015-03-12 16:07:52
你好,你现在还在做这方面吗,我最近一直没有登录小木虫,不好意思。如果你需要,我可以发一些我的资料...

您好,我也在学习 DP以及SDP可不可以发给我一些相关的资料和程序谢谢您
30楼2016-04-12 17:22:13
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Alfred_S

新虫 (初入文坛)



小木虫: 金币+0.5, 给个红包,谢谢回帖
引用回帖:
20楼: Originally posted by jermerneyyin at 2015-03-12 16:07:52
你好,你现在还在做这方面吗,我最近一直没有登录小木虫,不好意思。如果你需要,我可以发一些我的资料...

楼主你好,我最近也在做ADP这一块,有些不知道如何编程实现,能否发一些资料给我啊,特别是连续时间约束输入的非线性系统编程有些棘手,谢谢啦!
31楼2017-03-12 20:12:16
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
简单回复
yaoyao1454楼
2013-04-11 15:18   回复  
jermerneyyin(金币+1): 谢谢参与
readytogo5楼
2013-04-11 15:18   回复  
jermerneyyin(金币+1): 谢谢参与
2013-04-11 15:23   回复  
jermerneyyin(金币+1): 谢谢参与
2013-04-11 15:34   回复  
jermerneyyin(金币+1): 谢谢参与
shinyzd9楼
2013-04-11 16:01   回复  
jermerneyyin(金币+1): 谢谢参与
2013-04-11 16:33   回复  
jermerneyyin(金币+1): 谢谢参与
flyxu13楼
2013-04-11 16:57   回复  
jermerneyyin(金币+1): 谢谢参与
haixiawu17楼
2013-04-13 09:35   回复  
jermerneyyin(金币+1): 谢谢参与
相关版块跳转 我要订阅楼主 jermerneyyin 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见