因为函数x^3单调递增,容易证明损失函数(x^3-n)^2有全局唯一最小值,该函数值对应x即为n的立方根。这就使得梯度下降收敛到立方根无需考虑x的初始值位置,因为不会陷入局部最优,同时也就使得1楼的退出条件可行,不至于陷入死循环。
点赞

相关推荐

牛客网
牛客网在线编程
牛客网题解
牛客企业服务