强化学习第三四章-CSDN博客网友收藏

强化学习第三四章-CSDN博客

1、梯度下降选择固定步长可能产生的情况:收敛、发散、重复的在两个数之间跳跃2、np.zeros_like(x) 生成一个shape和x一样的全为0的数组3、plt.counter画等高线图4、tensorflow的scope 变量命名空间(1)若tf.Variable(初始值,name=' ')这种方式......
阅读全文
强化学习精要第一二章-CSDN博客网友收藏

强化学习精要第一二章-CSDN博客

1、np.dot的用法,用于向量的时候是点积,用于矩阵的时候是矩阵的乘法,一个向量只有一行的时候,它的shape是(列数, )2、matplot画图,更改图中的字体,mpl.rcParams['font.sans-serif'] = ['WenQuanYi Micro Hei'] #指定默认字体WenQuanYi Micro Hei......
阅读全文