【读书笔记】《深入浅出强化学习》思维导图(Reinforce Learning)及前两章节选_强化学习 思维导图-CSDN博客网友收藏

读书笔记】《深入浅出强化学习》思维导图(Reinforce Learning)及前两章节选_强化学习 思维导图-CSDN博客

文章浏览阅读2.1k次,点赞7次,收藏28次。从最基本的马尔科夫决策过程入手,问题最基本的方法——动态规划方法。解决强化学习问题的基本思路:交互迭代策略和策略改善。介绍了基于值函数的强化学习方法和基于直接策略......
阅读全文