24小时热门版块排行榜    

查看: 1260  |  回复: 4

Johnny_蔚

新虫 (初入文坛)

[求助] 自适应动态规划(ADP)方法处理化工对象,请教高手

以往做仿真时都给出具体模型,发现针对CSTR等对象采用自适应动态规划做仿真具体实现与以往不同,比如闭环数据采集和Q函数学习过程实现。求助各位高手,大牛啊~!!

在自适应动态规划(ADP)中问题大多描述为Markov决策过程,其基本思想是通过前向仿真和采样辨识出相关区域并应用Bellman迭代去构造近似值函数,在智能体路径规划和任务调度应用比较多,当新信息添加进来通过强化学习来应对不确定性。但是针对Markov决策过程的ADP不能直接用于过程对象,主要是由于连续过程对象空间离散化使其空间维数快速上升加剧了“维数灾”。而且工业过程不允许传统动态规划搜索整个可行解空间进行学习的过程,这可能会带来安全性方面的风险。自2005年来,Jay. H. Lee就该领域进行一些分析和研究,根据闭环仿真得到的数据进行离线值函数迭代,流程图参考附图,设计思想大致为
改进的ADP算法具体过程为:
1.        在已知控制策略下进行闭环仿真,储存遍历状态{x(1),…,x(N)}=X并将执行动作应用到状态点x(j)中;
2.        代价函数J0(x(k))的初始化,其中T足够大;
3.        执行集初始化
对于每个x,从x的m个最近邻点构建执行集合Ax
4.        数据分析进行降维
5.        值迭代过程

这种思路下实现如果通过Matlab应该如何完成呢?求教各位高手,谢谢自适应动态规划(ADP)方法处理化工对象,请教高手
s.png
回复此楼

» 本帖附件资源列表

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

1132520084

新虫 (小有名气)

楼主已经如此厉害了,我等还是膜拜吧!!
2楼2015-04-09 20:36:07
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ucihqtep

新虫 (初入文坛)

不知道楼主是不是已经毕业,有问题想请教
3楼2015-07-11 13:01:00
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Johnny_蔚

新虫 (初入文坛)

刚毕业不久,这一块内容与最优控制联系蛮紧密~

发自小木虫Android客户端
4楼2015-11-24 15:57:33
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

fenqubiao

新虫 (初入文坛)

引用回帖:
4楼: Originally posted by Johnny_蔚 at 2015-11-24 15:57:33
刚毕业不久,这一块内容与最优控制联系蛮紧密~

楼主,我想把动态规划用在电力系统方面,但不是特别了解,这个方法的具体到底怎么算的,是像遗传算法那些设初值,然后再改变参数,向最优方向变异;还是向分支定界那种比较启发式的算法,具体是个什么过程呢?想向楼主好好请教一下
5楼2016-04-05 17:47:00
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 学员58MgM9 的主题更新
信息提示
请填处理意见