网站介绍:文章浏览阅读1.2k次,点赞7次,收藏8次。文章目录SummaryThe Agent–Environment InterfaceGoals and RewardsReturns and EpisodesUnified Notation for Episodic and Continuing TasksPolicies and Value FunctionsOptimal Policies and Optimal Value Function..._强化学习第三章 有限
- 链接地址:https://blog.csdn.net/u013695457/article/details/88621869
- 链接标题:[归纳]强化学习导论 - 第三章:有限马尔可夫过程_强化学习第三章 有限-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:3346
- 网站标签:强化学习第三章 有限