强化学习系列10:无模型的直接策略搜索_强化学习策略查询方法-CSDN博客

网站介绍:文章浏览阅读807次。1. 非参函数逼近法在非参函数逼近法中,不是提前确定好ϕ\phiϕ,而是每个样本会成为函数逼近的一部分,比如基于核的函数逼近公式是:ΣiαiyiK(x,xi)+b\Sigma_i\alpha_iy_iK(x,x_i)+bΣi​αi​yi​K(x,xi​)+b..._强化学习策略查询方法