增加参数的数量,使得网络不会卡在局部最小值处
在开始时把学习率降低几倍,然后使用梯度下降加速算子(momentum)
抖动学习速率,即改变几个时期的学习速率
其他均不是
这道题你会答吗?花几分钟告诉大家答案吧!
扫描二维码,关注牛客网
下载牛客APP,随时随地刷题