| 查看: 806 | 回复: 0 | ||
| 【悬赏金币】回答本帖问题,作者薛西弗斯P将赠送您 20 个金币 | ||
| 当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖 | ||
[求助]
深度强化学习控制问题
|
||
最近尝试使用深度强化学习算法SAC简单实现系统跟踪问题:模型为线性定常的带有高斯白噪声的系统。想通过算法实现:给定一个固定状态,通过系统的状态反馈,由智能体产生控制量使得系统的状态稳定在这个状态。但几经修改奖励函数,agent学习到的策略并不能使系统稳定在特定的状态,而是跟踪了一个匀加速直线运动的形式。因此想请教一下大家,有没有遇到类似的情况,又该如何解决?![]() x' 和 y'的轨迹,不论奖励函数是什么,输出总是类似的形式,改变的只有斜率的大小。 |
» 猜你喜欢
博士读完未来一定会好吗
已经有22人回复
导师想让我从独立一作变成了共一第一
已经有7人回复
到新单位后,换了新的研究方向,没有团队,持续积累2区以上论文,能申请到面上吗
已经有11人回复
读博
已经有4人回复
JMPT 期刊投稿流程
已经有4人回复
心脉受损
已经有5人回复
Springer期刊投稿求助
已经有4人回复
小论文投稿
已经有3人回复
Bioresource Technology期刊,第一次返修的时候被退回好几次了
已经有9人回复
申请2026年博士
已经有6人回复














回复此楼