首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
牛客145335972号
北京邮电大学 算法工程师
发布于北京
关注
已关注
取消关注
@蒋豆芽:
payphone_lx-阿里妈妈-面经——解答
从今天起,豆芽有空也尽己所能,帮助一下大家。 面经来源:https://www.nowcoder.com/discuss/702074?source_id=discuss_experience_nctrack&channel=-1 1. 牛顿法和拟牛顿法介绍一下 牛顿法可由二阶泰勒展开求导可近似得到牛顿法迭代公式: 但是在实际应用过程中,我们会发现海塞矩阵的逆矩阵往往计算比较复杂,于是又有了拟牛顿法来简化这一过程。 在拟牛顿法中,考虑优化出一个n阶矩阵D来代替海塞矩阵的逆矩阵。可以发现海塞矩阵逆矩阵的近似矩阵D(x)的选择条件比较灵活,可以有多种具体的实现方法。比较常用的算法是DFP算法替代海塞矩阵逆矩阵的迭代公式 2. 有哪些优化方法使用了二阶动量? Adagrad法、Adadelta法、RMSProp法、Adam法 3. 描述一下过拟合现象 过拟合:训练集效果很好,测试集效果较差 欠拟合:训练集效果差,测试集效果也差。 4. 抑制过拟合的方法有哪些? 扩充数据集、l1、l2,dropout、BN、验证集、模型集成 5. 介绍一下BatchNorm。 BN(Batch Normolization)是Google提出的用于解决深度网络梯度消失和梯度爆炸的问题,可以起到一定的正则化作用。我们来说一下它的原理: 批规范化,即在模型每次随机梯度下降训练时,通过mini-batch来对每一层卷积的输出做规范化操作,使得结果(各个维度)的均值为0,方差为1。 BN操作共分为四步。输入为,第一步计算均值: 第二步计算数据方差: 第三步进行规范化: 第四步尺度变换和偏移: 表示mini-batch中的数据个数,可以看出,BN实际就是对网络的每一层都进行白化操作。白化操作是线性的,最后的“尺度变换和偏移”操作是为了让BN能够在线性和非线性之间做一个权衡,而这个偏移的参数和 是神经网络在训练时学出来的 经过BN操作,网络每一层的输出小值被“拉大”,大值被“缩小”,所以就有效避免了梯度消失和梯度爆炸。总而言之,BN是一个可学习、有参数(γ、β)的网络层。 6. BN在测试阶段使用的mean、var是如何获得的? 训练时,均值和方差针对一个Batch。 测试时,均值和方差针对整个数据集而言。因此,在训练过程中除了正常的前向传播和反向求导之外,我们还要记录每一个Batch的均值和方差,以便训练完成之后按照下式计算整体的均值和方差: 上面简单理解就是:测试模型中,对于均值来说直接计算所有batch 值的平均值;然后对于标准偏差采用每个batch 的无偏估计(无偏估计是用样本统计量来估计总体参数时的一种无偏推断)。 最后测试阶段,BN的使用公式就是: 以上所有题的答案其实都来源于我的博客面经,欢迎大家围观:https://blog.nowcoder.net/jiangwenbo
点赞 5
评论 6
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
07-28 18:50
苏州大学 集成电路IC设计
读研其实就是场巨大的祛魅
读研是对课题的祛魅。自读研后,不断深入钻研自己的课题,研究领域越来越小,研究内容越来越具体,才忽然觉悟读了上百篇文献懂得的本质几句话几个箭头就能讲清。而后再读他人文章,参加学术会议,多参加几次答辩观看,才发现呕心沥血的学术文章总有逻辑漏洞,年过半百的老教授也会被专家批得一无是处。读研是对人的祛魅。以为自己到了更高的平台能遇见更优秀的人,才知自己想象力过于丰富,没有人是ai,多数人的生活依旧是吃喝拉撒睡,做学术时同样抓耳挠腮烟一根又一根,绞尽脑汁无果后依旧要向别人请教。室友如此,同门如此,导师亦如此。读研是对未来祛魅。无论想要什么样的结果,真正实现时又觉不够好,无法实现时又总是美化得不到的东西。...
我对___祛魅了
点赞
评论
收藏
分享
07-27 08:53
蚌埠坦克学院 嵌入式软件开发
嵌入式应届生面试其实不难,关键在于基础与编程功底
每年毕业季,总有不少电子、通信、自动化、计算机专业的同学,开始走上找嵌入式岗位的面试之路。但说起“嵌入式面试”,不少人第一反应就是:难、抽象、偏底层、看运气。其实,这种恐惧大可不必。对于大多数公司来说,应届生的嵌入式面试考察内容,并没有大家想象得那么“玄学”,更多是看你有没有扎实的基本功和编程能力。全网最全面的嵌入式八股文:https://www.nowcoder.com/creation/manager/columnDetail/mPZ4kk一、基础知识是重中之重不要幻想自己能靠刷两天题就通过面试。嵌入式岗位对“基础”的依赖非常强,比如:C语言基础指针、数组、结构体、内存管理、函数指针、位运...
点赞
评论
收藏
分享
06-24 00:02
北京电子科技职业学院 活动运营
我叫谷兴阳,25年毕业,我的身体素质好,三观正,有良好的执行能力,绝对服从安排,性格稳重。
在卷行测的大卫很理性:
整个简历最有竞争力的就是北京籍贯
点赞
评论
收藏
分享
不愿透露姓名的神秘牛友
06-11 13:34
0实习双非进大厂,我做了什么
做梦
offe从四面八方来:
我真的没时间陪你闹了
点赞
评论
收藏
分享
07-30 11:27
门头沟学院 Java
我没有安排,我任人安排
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
百度提前批,三面被推迟一周,喜提秋招第一凉
9779
2
...
虾皮秋招一面
3324
3
...
他拿大厂SSP Offer打牌是什么概念啊?25届双非之光
3321
4
...
觉得研发高人一等的这辈子有了
2159
5
...
百度提前批 三面
1963
6
...
最强本科✌
1668
7
...
被猿辅导挂了简历,但我想说...
1419
8
...
也是逆天了
1369
9
...
虾皮一面凉经
1299
10
...
上班一周,工资还没拿,先欠公司两千
1263
创作者周榜
更多
正在热议
更多
#
工作中哪个瞬间让你想离职
#
65033次浏览
578人参与
#
找工作如何保持松弛感?
#
92064次浏览
1113人参与
#
中兴秋招
#
206684次浏览
2302人参与
#
如何快速融入团队?
#
18104次浏览
215人参与
#
秋招被确诊为……
#
165541次浏览
774人参与
#
和同事相处最忌讳的是__
#
25865次浏览
251人参与
#
投格力的你,拿到offer了吗?
#
87288次浏览
585人参与
#
虾皮求职进展汇总
#
250286次浏览
1875人参与
#
计算机专业还有必要去大厂卷吗
#
38654次浏览
183人参与
#
你最希望上岸的公司是?
#
135665次浏览
709人参与
#
26届的你,投了哪些公司?
#
48720次浏览
511人参与
#
Offer比较,你最看重什么?
#
194092次浏览
1315人参与
#
简历上的经历如何包装
#
31306次浏览
846人参与
#
我对___祛魅了
#
51086次浏览
458人参与
#
柠檬微趣工作体验
#
6853次浏览
40人参与
#
你遇到最难的面试题目是_
#
17290次浏览
205人参与
#
你跟室友的关系怎么样?
#
7860次浏览
121人参与
#
通信硬件岗投递时间线
#
18890次浏览
69人参与
#
我想象的实习vs现实的实习
#
290470次浏览
2246人参与
#
什么样的背景能拿SSP?
#
40715次浏览
233人参与
#
你最讨厌面试问你什么?
#
29492次浏览
323人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务