强化学习系列(十二):Eligibility Traces-CSDN博客

网站介绍:文章浏览阅读8k次,点赞6次,收藏25次。一、前言Eligibility Traces是强化学习的基本原理之一。例如TD(λλ\lambda)算法,(λλ\lambda)表示eligibility traces的使用情况。几乎所有TD方法,如 Q-Learning或Sarsa,都可以和eligibility traces结合起来生成更高效通用的方法。Eligibility Traces可以用于泛化TD和MC方法。当用eligibi..._eligibility traces