网站介绍:文章浏览阅读807次。1. 非参函数逼近法在非参函数逼近法中,不是提前确定好ϕ\phiϕ,而是每个样本会成为函数逼近的一部分,比如基于核的函数逼近公式是:ΣiαiyiK(x,xi)+b\Sigma_i\alpha_iy_iK(x,x_i)+bΣiαiyiK(x,xi)+b..._强化学习策略查询方法
- 链接地址:https://blog.csdn.net/kittyzc/article/details/85921651
- 链接标题:强化学习系列10:无模型的直接策略搜索_强化学习策略查询方法-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:5912
- 网站标签:强化学习策略查询方法