《强化学习》-读书笔记-第一章 导论_强化学习四要素-CSDN博客

网站介绍:文章浏览阅读318次。一. 导论1.1 强化学习1.2 示例1.3 强化学习要素1.4 局限性和适用范围1.5 扩展实例:井字棋1.6 本章小结1.7 强化学习的早期历史一. 导论在交互中学习是几乎所有学习和智能理论的基本思想。本书研究在交互中学习的计算性方法,强化学习相比于其他机器学习方法,更加侧重于以交互目标为导向进行学习。1.1 强化学习强化学习就是学习“做什么才能使得数值化的收益信号最大化”强化学习最重要的两个特征:试错和延迟收益强化学习既不同于监督学习,又不同无监督学习,属于第三种机器学习范式._强化学习四要素