牛客题解官

02-06 10:36 清华大学 Java 发布于北京

关注

题解|SGDM（带动量的随机梯度下降）

SGDM（带动量的随机梯度下降）

https://www.nowcoder.com/practice/c82a700515164af5867c11e09256aed3?tpId=377&tags=&title=&difficulty=0&judgeStatus=0&rp=0&sourceUrl=%2Fexam%2Foj

SGDM(带冲量的随机梯度下降)是SGD的一种改进，在SGD的基础上增加了冲量，可以加速收敛。简单点说，就是每次更新参数时，不仅考虑当前的梯度，还考虑之前的梯度。使用动量代替梯度。梯度下降以及批量梯度下降的原理不再赘述，这里只给出SGDM的公式：

\theta_{t 1} = \theta_t - \eta \cdot \nabla J(\theta_t) - \gamma \cdot \theta_t

其中， $\theta_t$ 是第 $t$ 次迭代时的参数， $\eta$ 是学习率， $\nabla J(\theta_t)$ 是第 $t$ 次迭代时的梯度， $\gamma$ 是冲量系数。

代码实现：

def sgdm_linear_regression(X, y, learning_rate, momentum_decay, epochs):
    m, n = X.shape
    theta = np.zeros((n, 1))
    v = np.zeros((n, 1))
    for _ in range(epochs):
        y_pred = np.dot(X, theta)  # 计算预测值
        error = y_pred - y  # 计算误差
        gradient = (1 / m) * np.dot(X.T, error)  # 计算梯度
        v = momentum_decay * v + learning_rate * gradient  # 更新动量
        theta -= v  # 更新参数
    return np.round(theta.flatten(), 2).tolist()

全部评论

推荐最新楼层

牛客631410044号

北京航空航天大学产品经理

该题解所给的theta更新公式不正确，会导致动量机制失效，没有历史梯度积累。应修证为以下：动量变量 v 用于累积过去的梯度方向，并在更新时加入当前梯度。更新公式： v_t=βv_{t−1}+η∇J(θ) θ=θ−v_t 其中，β 是动量衰减系数（momentum_decay），η 是学习率（learning_rate）。优点：动量能加速收敛，减少震荡。符合标准的 SGDM（Stochastic Gradient Descent with Momentum）算法。

点赞回复分享

发布于 07-21 22:40 北京

10-10 10:57

SHEIN_HR(准入职员工)

shein内推，shein内推码

实习了这么多公司下来，对SHEIN的感受就是 希音的培养体系非常系统和全面 有非常丰富的资源可以学习—— 新人入职时会召开新人会议，介绍公司制度和福利 有专门针对这个岗位新人的学习清单 部门团队介绍和业务梳理 帮助我快速了解业务框架和具体工作方法 还有SHEIN学院里的职场软技能提升课程和英语课程不可谓不丰富了 但是学到多少，就看你的主动性和学习能力了 扁平化组织让我有更多机会直接接触到mentor和leader 每天都能one on one沟通 部门全员E人的氛围让初来乍到的原本e人的我也变成了i人[呃R] 但是后面也很好地融入啦 团队伙伴都说舍不得我离开…mentor说感谢我为团队带来了新...

SHEIN希音公司福利 208人发布

点赞评论收藏

分享

10-12 17:53

四川大学 Java

秋招时间紧迫，请把握面试重点，别搞偏了！

很多同学都让我给他看看他的学习计划对不对，让我看看有没有问题。一般来说，有详细这个学习计划的同学基本上都学了很多东西了，常见的什么框架呀，MySQL啊，MQ其实都学过了，然后我一看学习计划要学什么docker呀，微服务，什么ES啊，Nacos啊，ZK啊，要么就是学什么spring security啊，xxl- job这种的。但是学这些东西它没有用，首先你得了解这些东西，它就不是面试的重点，你学了它意义又不大，因为本来就是我们面试官很少问的问题，而且所谓的很多学习就是浅尝辄止，就是会引入一个依赖，调用一下对应的API，然后就完了。那面试官该问啥呢？没啥可问的。所以它不是面试重点，而且你也没有深入...

12306项目面试话术逐...

点赞评论收藏

分享

09-17 22:16

美团_零食杂售_前端开发(实习员工)

咋回事，状态咋回去了？

昨天看录用评估✅今天咋是“综合录用评估中”

点赞评论收藏

分享

09-13 08:41

服装/纺织设计

这是让我在这上边面试吗

那一天的Java_J...：你第一次参加面试吗

点赞评论收藏

分享

10-08 19:16

曼迪匹艾_人力资源部_HRBP(准入职员工)

MDPI内推，MDPI内推码

常见问题：3.加班吗 目前我是加班的，一般➕0.5-1h，加不加班主要看自己的进度和效率，刚入职，操作慢，一般会加班。 4.加班有加班费吗？ NO，超过晚上七点🕖可以点一份工作餐（必须七点以后才可以点，需要5点之前点餐，如果你确定自己加班会超过七点，就可以点啦） 5.有KPI吗？ 有的，入职3个月（发文15篇）和6个月（发文60篇）都要发文量要求。转正后每个季度30篇，超过30每篇奖励300💰。 6入职后有人带吗？ 有的，入职后每个人都有师傅带，遇到的师傅就像读研选导一样，听天由命，幸运的遇到耐心负责的，运气差点的～，不过一般都还是很好的 7.公司环境如何？ 和你在其他分享中看到的一样，女...

MDPI公司福利 392人发布

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 找工作中的小确幸 #

11915次浏览 105人参与

# 实习在多还是在精 #

4190次浏览 49人参与

# 爱玛科技集团求职进展汇总 #

30552次浏览 210人参与

# 你觉得什么岗位会被AI替代 #

5676次浏览 90人参与

# 秋招踩过的“雷”，希望你别再踩 #

22811次浏览 260人参与

# 你见过哪些工贼行为 #

3855次浏览 25人参与

# 实习下班不想学习，正常吗？ #

4500次浏览 59人参与

# 校招谈薪一定要知道的事 #

3938次浏览 55人参与

# 面包vs爱情，怎么选？ #

18026次浏览 193人参与

# 贝壳求职进展汇总 #

36513次浏览 205人参与

# 新凯来求职进展汇总 #

53072次浏览 133人参与

# 选完offer后，你后悔学机械吗？ #

39654次浏览 243人参与

# 你秋招想去哪些公司 #

63592次浏览 1700人参与

# 招银网络求职进展汇总 #

174051次浏览 1004人参与

# 秋招结束之后的日子 #

89149次浏览 986人参与

# 浪潮求职进展汇总 #

18129次浏览 137人参与

# 节后第一天上班，我的精神状态 #

15775次浏览 133人参与

# 机械人，签完三方你在忙什么？ #

61984次浏览 235人参与

# 硬件/芯片公司岗位评价 #

8834次浏览 29人参与

# 面试被问“你的缺点是什么?”怎么答 #

156243次浏览 2218人参与

# 华为海思工作体验 #

29469次浏览 121人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务