DQN的总结_dqn的状态空间是怎么来的-CSDN博客

网站介绍:文章浏览阅读9.2k次,点赞11次,收藏55次。转载一篇关于DQN解释非常好的文章转载自:https://zhuanlan.zhihu.com/p/46852675本人做了一些细微的改动,方便个人理解,原文请点这里DQN的由来和解释Q-Learning可以很好的解决迷宫问题,但这终究是个小问题,它的状态空间和动作空间都很小。而在实际的情况下,大部分问题都有巨大的状态空间或动作空间,建立Q表,内存是不允许的,而且数据量和时间开销也是个问题。我们可以使用神经网络来表示我们的 Q 函数,每层网络的权重就是对应的值函数,取 4 四帧游戏图像作为 sta_dqn的状态空间是怎么来的