首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
期待一个好结果吧
浙江大学附属中学 算法工程师
发布于上海
关注
已关注
取消关注
mark
@SweetBean:
算法岗常见面试题(六):优化器
学习资料(讲的很细很清楚):一个框架看懂优化算法之异同 SGD/AdaGrad/AdamAdam那么棒,为什么还对SGD念念不忘 (3)—— 优化算法的选择与使用策略(1条消息) 机器学习11种优化器推导过程详解(SGD,BGD,MBGD,Momentum,NAG,Adagrad,Adadelta,RMSprop,Adam,Nadma,Adamx)_日拱一两卒的博客-CSDN博客_机器学习优化器总结优化器的作用:更新和计算影响模型训练和模型输出的网络参数,使其逼近或达到最优值,从而最小化(或最大化)损失函数。发展路径:SGD -> SGDM -> NAG -> AdaGrad -> AdaDelta / RMSProp -> Adam -> Nadam -> AdamW发展阶段:没有动量:梯度下降<计算所有样本的梯度平均> / SGD<随机选择一个样本计算梯度> / 小批量随机梯度下降<每次处理一批样本>一阶动量(惯性):SGDM<梯度更新方向由历史梯度更新方向和当前梯度更新方向共同决定> / NAG<假设参数先按上一轮梯度更新方向变化,再计算当前梯度更新方向> 二阶动量(自适应学习率):AdaGrad<迄今为止所有梯度的平方和> / AdaDelta / RMSProp<只关注过去一段时间内的梯度更新频率> 一阶动量+二阶动量:Adam<SGDM+AdaDelta> / Nadam<NAG+AdaDelta> / AdamW<Adam+L2正则化>各种优化器如何选择刚入门选NAG或Adam如果模型非常稀疏,优先考虑自适应学习率的算法随机梯度下降算法的收敛速度和数据集大小的关系不大。因此,可以先用一个具有代表性的小数据集进行实验,测试一下最好的优化算法,然后通过参数搜索的方式寻找最优的训练参数。等等。BERT使用的优化器是什么?Adam相较于传统的SGD的优点是什么?(超参数一面)BERT使用的是Adam优化器。Adam结合SGDM和AdaDelta两种优化算法的优点。对梯度的一阶动量(惯性)和二阶动量(更新频率)进行综合考虑,计算出更新步长。一阶动量的优势在于他能够学习到历史梯度下降的惯性,避免受到单个样本分布的干扰,减少震荡,加快收敛;二阶动量的优势在于是自适应学习率,为参数的不同维分配不同的学习率,在模型稀疏的情况下效果很好。PS:Notion的笔记复制过来格式会变,这次就用截图吧,希望能看清楚。。。
点赞 16
评论 3
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
01-05 23:50
上海国际问题研究院
外企校招喂饭/咱们普通应届生不好容易到了群面终面 /该如何应付?
🎓学历背景:上海双非硕士天坑专业+6个月五百强外企快消品Sales实习经验、电商实习🏢已签offer:(快消)不凡帝范梅勒(PVM)Sales Trainee🕗校招流程:网申——测评——Ai面——群面——终面——offer call——offer letter🎁PVM校招全记录参阅第一篇帖子🔔本文分为简历+面试两个部分,面试直跳🤓emoji。😭博主属于是学历背景和实习经验都非常普通的25届应届生,冷门院校+天坑专业(国际关系),简历放在就业市场多次被HR当野鸡学校毕业的非全硕士/成人教育/自考😭 博主没有放弃,拿下了心心念念的外企管培生offer。如果你也和我一样:双非学历/天...
校招过来人的经验分享
点赞
评论
收藏
分享
01-04 14:08
门头沟学院 安全工程师
求帮忙看简历
点赞
评论
收藏
分享
2025-11-21 12:15
重庆大学 嵌入式工程师
催offer时,HR说“别急,我们比你还
终面完,HR打电话说“非常满意,你非常优秀,我们非常缺人,offer走流程很快的!”然后我就等了两周,音讯全无。鼓起勇气去问,HR回复:“别急,我们比你还急呢!”又过了一周,我发现自己流程灰了。不是,你们就是这么“急”的吗?是不是对“急”这个字有什么误解?
我要娶个什么名:
这不是经典话术稳住你,然后横向吗哈哈哈
那些年,我收到的‘奇葩’...
点赞
评论
收藏
分享
01-09 12:49
曼迪匹艾_人力资源部_HRBP(准入职员工)
MDPI内推,MDPI内推码
常见问题:3.加班吗 目前我是加班的,一般➕0.5-1h,加不加班主要看自己的进度和效率,刚入职,操作慢,一般会加班。 4.加班有加班费吗? NO,超过晚上七点🕖可以点一份工作餐(必须七点以后才可以点,需要5点之前点餐,如果你确定自己加班会超过七点,就可以点啦) 5.有KPI吗? 有的,入职3个月(发文15篇)和6个月(发文60篇)都要发文量要求。转正后每个季度30篇,超过30每篇奖励300💰。 6入职后有人带吗? 有的,入职后每个人都有师傅带,遇到的师傅就像读研选导一样,听天由命,幸运的遇到耐心负责的,运气差点的~,不过一般都还是很好的 7.公司环境如何? 和你在其他分享中看到的一样,女...
曼迪匹艾公司福利 132人发布
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
秋招50+场面试手撕算法汇总
1.2W
2
...
双非非科班2年时间的转码历程
9956
3
...
批判“上岸即胜利”的炫耀
9411
4
...
简历挂麻了?因为你的简历只有“宽度”没有“深度”!
5332
5
...
Caffeine 面经汇总
3902
6
...
小鹏汽车二面(没绷住)
2631
7
...
写论文麻了
2105
8
...
2025年牛客年度作者礼盒开箱(礼盒部分)
1860
9
...
产品自用的prompt
1454
10
...
测开劝退
1173
创作者周榜
更多
正在热议
更多
#
哪些公司在招寒假实习?
#
15458次浏览
195人参与
#
国企vs私企,你更想去?
#
305677次浏览
2491人参与
#
MiniMax求职进展汇总
#
752次浏览
23人参与
#
26年哪些行业会变好/更差
#
18694次浏览
256人参与
#
卷__卷不过你们,只能卷__了
#
11750次浏览
264人参与
#
有深度的简历长什么样?
#
16444次浏览
341人参与
#
写论文的崩溃时刻
#
6296次浏览
148人参与
#
去年的flag与今年的小目标
#
9863次浏览
196人参与
#
关于春招你都做了哪些准备?
#
122162次浏览
707人参与
#
机械人,你最希望上岸的公司是?
#
198080次浏览
1917人参与
#
现在还是0offer,延毕还是备考
#
1256378次浏览
7922人参与
#
你不能接受的企业文化有哪些
#
11707次浏览
169人参与
#
入职第一天
#
10040次浏览
219人参与
#
租房前辈的忠告
#
350458次浏览
7445人参与
#
你都用AI做什么
#
6766次浏览
156人参与
#
你怎么看待AI面试
#
133408次浏览
745人参与
#
发工资后,你做的第一件事是什么
#
93115次浏览
311人参与
#
最难的技术面是哪家公司?
#
62962次浏览
949人参与
#
腾讯音乐求职进展汇总
#
147904次浏览
1053人参与
#
华为池子有多大
#
159136次浏览
876人参与
#
一人分享一道面试手撕题
#
22628次浏览
799人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务