首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
期待一个好结果吧
浙江大学附属中学 算法工程师
发布于上海
关注
已关注
取消关注
mark
@SweetBean:
算法岗常见面试题(六):优化器
学习资料(讲的很细很清楚):一个框架看懂优化算法之异同 SGD/AdaGrad/AdamAdam那么棒,为什么还对SGD念念不忘 (3)—— 优化算法的选择与使用策略(1条消息) 机器学习11种优化器推导过程详解(SGD,BGD,MBGD,Momentum,NAG,Adagrad,Adadelta,RMSprop,Adam,Nadma,Adamx)_日拱一两卒的博客-CSDN博客_机器学习优化器总结优化器的作用:更新和计算影响模型训练和模型输出的网络参数,使其逼近或达到最优值,从而最小化(或最大化)损失函数。发展路径:SGD -> SGDM -> NAG -> AdaGrad -> AdaDelta / RMSProp -> Adam -> Nadam -> AdamW发展阶段:没有动量:梯度下降<计算所有样本的梯度平均> / SGD<随机选择一个样本计算梯度> / 小批量随机梯度下降<每次处理一批样本>一阶动量(惯性):SGDM<梯度更新方向由历史梯度更新方向和当前梯度更新方向共同决定> / NAG<假设参数先按上一轮梯度更新方向变化,再计算当前梯度更新方向> 二阶动量(自适应学习率):AdaGrad<迄今为止所有梯度的平方和> / AdaDelta / RMSProp<只关注过去一段时间内的梯度更新频率> 一阶动量+二阶动量:Adam<SGDM+AdaDelta> / Nadam<NAG+AdaDelta> / AdamW<Adam+L2正则化>各种优化器如何选择刚入门选NAG或Adam如果模型非常稀疏,优先考虑自适应学习率的算法随机梯度下降算法的收敛速度和数据集大小的关系不大。因此,可以先用一个具有代表性的小数据集进行实验,测试一下最好的优化算法,然后通过参数搜索的方式寻找最优的训练参数。等等。BERT使用的优化器是什么?Adam相较于传统的SGD的优点是什么?(超参数一面)BERT使用的是Adam优化器。Adam结合SGDM和AdaDelta两种优化算法的优点。对梯度的一阶动量(惯性)和二阶动量(更新频率)进行综合考虑,计算出更新步长。一阶动量的优势在于他能够学习到历史梯度下降的惯性,避免受到单个样本分布的干扰,减少震荡,加快收敛;二阶动量的优势在于是自适应学习率,为参数的不同维分配不同的学习率,在模型稀疏的情况下效果很好。PS:Notion的笔记复制过来格式会变,这次就用截图吧,希望能看清楚。。。
点赞 16
评论 3
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
今天 17:55
西安财经大学 数据分析师
只因多看了一眼,挽回近 10 万损失
帮客户做付款单时,他累到眼睛都睁不开,让我直接按他给的数据做,做完发他就行。因为使用数据前习惯性核对数据是否准确,数据不准确结果不会对,我就习惯性复核了一遍,发现小数点右移了一下,按这个数据付款会多付近十万。我立刻跟他确认,默默帮他修正所有错误,全程没提额外费用,只让他安心休息。他只说了声谢谢,我也没放在心上。直到后来看到直播间礼物刷屏,心里又暖又不好意思,这还是第一次帮了别人,别人不是口头意思一下就过了。其实很多时候多看一眼只是职业习惯罢了,不过是让自己多一份安心、别人多一份放心。这份被信任的踏实感,真的好暖,也让我坚信,靠谱和责任,才是走得远的底气。
点赞
评论
收藏
分享
04-20 09:33
蚌埠坦克学院 嵌入式软件开发
京东嵌入式软件开发 一面面经
1. 请你介绍一个最有技术含量的嵌入式项目,重点讲讲系统架构、你的职责和遇到的难点参考答案:我做过一个基于STM32/嵌入式Linux的控制系统,整体分为传感器采集层、控制逻辑层、通信层和上位机交互层。我的主要职责是驱动开发、通信协议设计,以及核心任务调度与性能优化。在架构上,我把高实时任务和低优先级任务拆开,用中断加RTOS任务的方式保证关键路径响应。项目难点主要在于多模块协同、通信稳定性和异常场景下的恢复机制。我通过优化任务优先级、引入状态机设计、增加超时重试和日志定位,解决了大部分稳定性问题。这个项目让我对驱动、任务调度、接口抽象和系统级问题定位都有更深入的理解。2. 为什么想做嵌入式开...
查看14道真题和解析
点赞
评论
收藏
分享
04-19 14:40
南京大学 人工智能
腾讯复试状态
三战鹅厂才走到这,这是在横向吗可以发邮件催一下吗
此在夜:
我之前也是这样,然后四五天之后进入HR面状态,发了测评,做完三十天后约了HR面
点赞
评论
收藏
分享
04-16 10:20
武汉大学 后端工程师
暑期实习嫡长offer终于降临😭感恩🥹
分享一个蚂蚁timeline3.25 一面3.30 二面4.2 HR面4.10 意向书
我的OC时间线
点赞
评论
收藏
分享
04-20 21:07
南京信息工程大学 Java
百度一面
4、RDB AOF区别是什么5、aof写入是在命令之前,还是命令之后6、aof能保证数据的完全不丢失吗7、怎么保证aof完全的一致这里其实是一个设计,直接2pc就好了9、为什么要用C++写的Redis,不用go/Java来写呢10、go-redis存储大批量数据的时候,gc会总是扫描这种大对象,该怎么减少这种无意义的扫描呢11、缓存击穿、穿透、雪崩,怎么处理12、如何实现高可用的13、java,go的优缺点14、GMP介绍一下15、什么时候GM16、切片与数组的区别17、切片作为形参的时候,在方法内部修改会不会影响外部18、如果只是append,会影响外部的呢19、map的底层结构20、1.2...
我的求职进度条
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
中国银行软件中心合肥编程测评
3.0W
2
...
和室友聊完我才知道自己输在信息差...
1.9W
3
...
放弃其他大厂,我为什么选择携程机票BU?
1.3W
4
...
腾讯云智二面(已挂)
8546
5
...
AI产品面试复盘
8154
6
...
招银网络科技春招
6433
7
...
终于pdd让我的暑实告一段落,力竭了
6433
8
...
同学去了腾讯、蔚来,而我去了一个小厂...
6259
9
...
腾讯光子游戏客户端开发实习二面主管面面经(已oc)
4991
10
...
今年是真的更难了吗,还是单纯我太菜了
4755
创作者周榜
更多
正在热议
更多
#
哪些AI项目值得做?
#
19654次浏览
501人参与
#
正在春招的你,也参与了去年秋招吗?
#
397043次浏览
2728人参与
#
华泰星战营,提前锁定校招offer
#
12225次浏览
382人参与
#
简历上如何体现你的“AI”能力?
#
10083次浏览
229人参与
#
你总挂在第__面?
#
7156次浏览
78人参与
#
找不到大厂实习可以去小厂吗?
#
15389次浏览
168人参与
#
实习时最怕听到的一句话
#
17469次浏览
160人参与
#
没有面试的日子里,你在做什么
#
10084次浏览
305人参与
#
你简历上最心虚的一句话
#
16467次浏览
200人参与
#
90后北漂现状
#
38893次浏览
225人参与
#
你知道最慷慨和最抠的公司分别是
#
8408次浏览
62人参与
#
非技术投递记录
#
726576次浏览
6948人参与
#
刚入职就____,这样正常吗?
#
141248次浏览
685人参与
#
25届嵌入式真的回暖了吗
#
52386次浏览
383人参与
#
联通求职进展汇总
#
10337次浏览
30人参与
#
拼多多工作体验
#
57692次浏览
417人参与
#
吉利求职进展汇总
#
109942次浏览
415人参与
#
机械人还在等华为开奖吗?
#
334270次浏览
1630人参与
#
机械人,说说你的烦心事
#
144274次浏览
1151人参与
#
荣耀笔试
#
84574次浏览
413人参与
#
24届硬件人与华为的爱恨情仇
#
159458次浏览
1011人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务