payphone_lx-阿里妈妈-面经——解答_牛客网

牛客145335972号

北京邮电大学算法工程师发布于北京

关注

@蒋豆芽： payphone_lx-阿里妈妈-面经——解答

从今天起，豆芽有空也尽己所能，帮助一下大家。面经来源：https://www.nowcoder.com/discuss/702074?source_id=discuss_experience_nctrack&channel=-1   1. 牛顿法和拟牛顿法介绍一下牛顿法可由二阶泰勒展开求导可近似得到牛顿法迭代公式：但是在实际应用过程中，我们会发现海塞矩阵的逆矩阵往往计算比较复杂，于是又有了拟牛顿法来简化这一过程。在拟牛顿法中，考虑优化出一个n阶矩阵D来代替海塞矩阵的逆矩阵。可以发现海塞矩阵逆矩阵的近似矩阵D(x)的选择条件比较灵活，可以有多种具体的实现方法。比较常用的算法是DFP算法替代海塞矩阵逆矩阵的迭代公式   2. 有哪些优化方法使用了二阶动量？ Adagrad法、Adadelta法、RMSProp法、Adam法   3. 描述一下过拟合现象过拟合：训练集效果很好，测试集效果较差欠拟合：训练集效果差，测试集效果也差。   4. 抑制过拟合的方法有哪些？扩充数据集、l1、l2，dropout、BN、验证集、模型集成   5. 介绍一下BatchNorm。 BN（Batch Normolization）是Google提出的用于解决深度网络梯度消失和梯度爆炸的问题，可以起到一定的正则化作用。我们来说一下它的原理：批规范化，即在模型每次随机梯度下降训练时，通过mini-batch来对每一层卷积的输出做规范化操作，使得结果（各个维度）的均值为0，方差为1。 BN操作共分为四步。输入为，第一步计算均值：第二步计算数据方差：第三步进行规范化：第四步尺度变换和偏移：表示mini-batch中的数据个数，可以看出，BN实际就是对网络的每一层都进行白化操作。白化操作是线性的，最后的“尺度变换和偏移”操作是为了让BN能够在线性和非线性之间做一个权衡，而这个偏移的参数和  是神经网络在训练时学出来的经过BN操作，网络每一层的输出小值被“拉大”，大值被“缩小”，所以就有效避免了梯度消失和梯度爆炸。总而言之，BN是一个可学习、有参数（γ、β）的网络层。   6. BN在测试阶段使用的mean、var是如何获得的？训练时，均值和方差针对一个Batch。测试时，均值和方差针对整个数据集而言。因此，在训练过程中除了正常的前向传播和反向求导之外，我们还要记录每一个Batch的均值和方差，以便训练完成之后按照下式计算整体的均值和方差：             上面简单理解就是：测试模型中，对于均值来说直接计算所有batch 值的平均值；然后对于标准偏差采用每个batch 的无偏估计（无偏估计是用样本统计量来估计总体参数时的一种无偏推断）。最后测试阶段，BN的使用公式就是：                 以上所有题的答案其实都来源于我的博客面经，欢迎大家围观：https://blog.nowcoder.net/jiangwenbo   

点赞 5

评论 6

全部评论

推荐最新楼层

07-28 18:50

苏州大学集成电路IC设计

读研其实就是场巨大的祛魅

读研是对课题的祛魅。自读研后，不断深入钻研自己的课题，研究领域越来越小，研究内容越来越具体，才忽然觉悟读了上百篇文献懂得的本质几句话几个箭头就能讲清。而后再读他人文章，参加学术会议，多参加几次答辩观看，才发现呕心沥血的学术文章总有逻辑漏洞，年过半百的老教授也会被专家批得一无是处。读研是对人的祛魅。以为自己到了更高的平台能遇见更优秀的人，才知自己想象力过于丰富，没有人是ai，多数人的生活依旧是吃喝拉撒睡，做学术时同样抓耳挠腮烟一根又一根，绞尽脑汁无果后依旧要向别人请教。室友如此，同门如此，导师亦如此。读研是对未来祛魅。无论想要什么样的结果，真正实现时又觉不够好，无法实现时又总是美化得不到的东西。...

我对___祛魅了

点赞评论收藏

分享

07-27 08:53

蚌埠坦克学院嵌入式软件开发

嵌入式应届生面试其实不难，关键在于基础与编程功底

每年毕业季，总有不少电子、通信、自动化、计算机专业的同学，开始走上找嵌入式岗位的面试之路。但说起“嵌入式面试”，不少人第一反应就是：难、抽象、偏底层、看运气。其实，这种恐惧大可不必。对于大多数公司来说，应届生的嵌入式面试考察内容，并没有大家想象得那么“玄学”，更多是看你有没有扎实的基本功和编程能力。全网最全面的嵌入式八股文：https://www.nowcoder.com/creation/manager/columnDetail/mPZ4kk一、基础知识是重中之重不要幻想自己能靠刷两天题就通过面试。嵌入式岗位对“基础”的依赖非常强，比如：C语言基础指针、数组、结构体、内存管理、函数指针、位运...

点赞评论收藏

分享

06-24 00:02

北京电子科技职业学院活动运营

我叫谷兴阳，25年毕业，我的身体素质好，三观正，有良好的执行能力，绝对服从安排，性格稳重。

在卷行测的大卫很理性：整个简历最有竞争力的就是北京籍贯

点赞评论收藏

分享

不愿透露姓名的神秘牛友

06-11 13:34

0实习双非进大厂，我做了什么

offe从四面八方来：我真的没时间陪你闹了

点赞评论收藏

分享

07-30 11:27

门头沟学院 Java

我没有安排，我任人安排

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 工作中哪个瞬间让你想离职 #

65033次浏览 578人参与

# 找工作如何保持松弛感？ #

92064次浏览 1113人参与

# 中兴秋招 #

206684次浏览 2302人参与

# 如何快速融入团队？ #

18104次浏览 215人参与

# 秋招被确诊为…… #

165541次浏览 774人参与

# 和同事相处最忌讳的是__ #

25865次浏览 251人参与

# 投格力的你，拿到offer了吗？ #

87288次浏览 585人参与

# 虾皮求职进展汇总 #

250286次浏览 1875人参与

# 计算机专业还有必要去大厂卷吗 #

38654次浏览 183人参与

# 你最希望上岸的公司是？ #

135665次浏览 709人参与

# 26届的你，投了哪些公司？ #

48720次浏览 511人参与

# Offer比较，你最看重什么？ #

194092次浏览 1315人参与

# 简历上的经历如何包装 #

31306次浏览 846人参与

# 我对___祛魅了 #

51086次浏览 458人参与

# 柠檬微趣工作体验 #

6853次浏览 40人参与

# 你遇到最难的面试题目是_ #

17290次浏览 205人参与

# 你跟室友的关系怎么样？ #

7860次浏览 121人参与

# 通信硬件岗投递时间线 #

18890次浏览 69人参与

# 我想象的实习vs现实的实习 #

290470次浏览 2246人参与

# 什么样的背景能拿SSP? #

40715次浏览 233人参与

# 你最讨厌面试问你什么？ #

29492次浏览 323人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务