L1不可导的时候该怎么办
当目标函数不可导时,loss不会再下降。使用的方法为坐标轴下降法,对于有m个特征的目标函数,可以先固定m-1个特征,只对其中一个特征求局部最优解,避免不可导的问题
L1不可导,说明不能使用梯度下降的方法,我们可以使用坐标下降法,假设有m个参数,先固定m-1个参数,然后优化最后一个参数到最优,再调整第二个参数
使用坐标轴下降法。假如有m个参数需要更新,那么固定m-1个参数,更新另外一个。
使用approximal algorithm
当损失函数不可导的时候,梯度无法下降,可采用坐标轴下降法。梯度下降法是沿着梯度负方向进行迭代更新,坐标轴下降法是沿着坐标轴进行的。
使用近端下降法
一般对于L1norm,其不可导在原点处,好像是取正半轴一样的梯度?固定其余参数,对单一变量优化,以此来优化其余参数
损失函数不可导,梯度不再下降,可以采用坐标轴下降法
参考回答:当损失函数不可导,梯度下降不再有效,可以使用坐标轴下降法,梯度下降是沿着 当前点的负梯度方向进行参数更新,而坐标轴下降法是沿着坐标轴的方向,假设有 m 个特征个数, 坐标轴下降法进参数更新的时候,先固定 m-1 个值,然后再求另外一个的局部最优解,从而避免损 失函数不可导问题。
使用 Proximal Algorithm 对 L1 进行求解,此方法是去优化损失函数上界结果。
这道题你会答吗?花几分钟告诉大家答案吧!
扫描二维码,关注牛客网
下载牛客APP,随时随地刷题