关注
首先,泰勒展开,负梯度方向是descent direction。 其次,梯度下降(其他的line search、trust region也一样)只有在原问题是凸问题的情况下,才能保证以任意精度(因为毕竟是数值方法)取得最优解。 非凸情况下,改进的GD(比如随机初始化,escape saddle等trick等等)也只能保证以概率无限接近于1取得局部最优。
查看原帖
点赞 评论
相关推荐
帮你内推|字节跳动 实习 点赞 评论 收藏
分享
点赞 评论 收藏
分享
牛客热帖
更多
正在热议
更多
# 26年哪些行业会变好/更差 #
5662次浏览 106人参与
# 实习,不懂就问 #
146825次浏览 1310人参与
# 有深度的简历长什么样? #
8019次浏览 166人参与
# 卷__卷不过你们,只能卷__了 #
2218次浏览 52人参与
# 去年的flag与今年的小目标 #
3295次浏览 101人参与
# 哪些公司在招寒假实习? #
2999次浏览 35人参与
# 你都用AI做什么 #
3022次浏览 79人参与
# 入职第一天 #
5058次浏览 79人参与
# 写论文的崩溃时刻 #
1745次浏览 46人参与
# 实习学到最有价值的工作习惯 #
54189次浏览 433人参与
# 你最满意的offer薪资是哪家公司? #
64157次浏览 319人参与
# 一人分享一道面试手撕题 #
10599次浏览 533人参与
# 你不能接受的企业文化有哪些 #
3659次浏览 70人参与
# 应届生应该先就业还是先择业 #
161487次浏览 814人参与
# uu们,春招你还来吗? #
39503次浏览 232人参与
# AI了,我在打一种很新的工 #
125735次浏览 1304人参与
# 滴滴求职进展汇总 #
292626次浏览 2411人参与
# 听到哪句话就代表面试稳了or挂了? #
240699次浏览 1681人参与
# 秋招你被哪家公司挂了? #
1001983次浏览 7700人参与
# 计算机有哪些岗位值得去? #
259214次浏览 1960人参与
查看10道真题和解析