DQN的总结_dqn的状态空间是怎么来的-CSDN博客blog.csdn.net

网站介绍：文章浏览阅读9.2k次，点赞11次，收藏55次。转载一篇关于DQN解释非常好的文章转载自:https://zhuanlan.zhihu.com/p/46852675本人做了一些细微的改动，方便个人理解，原文请点这里DQN的由来和解释Q-Learning可以很好的解决迷宫问题，但这终究是个小问题，它的状态空间和动作空间都很小。而在实际的情况下，大部分问题都有巨大的状态空间或动作空间，建立Q表，内存是不允许的，而且数据量和时间开销也是个问题。我们可以使用神经网络来表示我们的 Q 函数，每层网络的权重就是对应的值函数，取 4 四帧游戏图像作为 sta_dqn的状态空间是怎么来的

链接地址：https://blog.csdn.net/qq_41819729/article/details/106605682
链接标题：DQN的总结_dqn的状态空间是怎么来的-CSDN博客
所属网站：blog.csdn.net
被收藏次数：8824
网站标签：dqn的状态空间是怎么来的

分享到各大网站