首页 > 试题广场 >

仍以该图输入,输出值Ground Truth为3。使用最小二

[填空题]
仍以该图输入,输出值Ground Truth3。使用最小二乘误差损失函数,学习率设为0.1,经过一次SGD权值更新后,w1的值为1

直接用链式法则的话,梯度传来传去还挺晕的,好在网络不深,直接复合函数求导吧
令误差为:E = (y - relu(X1*w1)w7)^2
则有误差相对于w1的梯度:g_w1 = dE/dw1 = 2(y - relu(X1*w1))*(-w7*relu'(X1*w1)*X1) = 2*(3-6)*(1*1*1) = -6       这里relu求导后为1
得到更新后的误差:w1 = w1 - lr*g_w1 = 2 - 0.1*(-6)=2.6
发表于 2020-10-19 15:25:39 回复(0)
根据链式法则,计算参数w1偏导
其中a=w_1*x1,所以有
因为激活函数为Relu,所以a'=relu(a)的导数为1.接下来
其中


综上,
梯度更新,w1 = w1 - a*g_w1 = 2 - 0.1*(-6)=2.6
发表于 2020-02-24 01:50:16 回复(0)