强化学习第三四章-CSDN博客

网站介绍:1、梯度下降选择固定步长可能产生的情况:收敛、发散、重复的在两个数之间跳跃2、np.zeros_like(x) 生成一个shape和x一样的全为0的数组3、plt.counter画等高线图4、tensorflow的scope 变量命名空间(1)若tf.Variable(初始值,name=' ')这种方式,每一个scope都会对名字产生影响  若tf.variabl...