2023-10-03 15:53 门头沟学院算法工程师

关注

双非美团一面

BN层作用：

BN层是对输入进行操作，具体是求得均值和方差以后，每个数减去均值除以标准差。

如果你对高斯分布还有印象，你会知道，我们在把高斯分布从某个分布转化为标准高斯分布的时候，用的也是这个公式。

大多数情况，我们也会假设我们的数据是服从高斯分布的。所以这样的操作，其实就是把分布尽可能转化为同一个分布。

那么为什么要把不同批次的输入，都转化为同一个分布呢？

因为你不能保证你的每个数据都是同一个分布的（有噪声），同时，在网络还没收敛的时候，网络的每一层变化，也无法让每个

数据都变成同一分布，（一个序列经过一个复杂函数变换以后，还能保证是同一个分布吗？）这里的每个数据指的是每一个batch。

而一旦数据不是同一个分布，那会非常麻烦。具体来说会有两个很明显的问题：

1.破坏分布后会破坏原有数据的信息。将导致训练过慢。

2.由于输入的值域发生了变化，将导致向量乘法相似度计算失效，导致拟合很难。

为了解决上述问题，采用归一化的方法。由于是每个batch都做了归一化，所以叫做BN。

具体回答：

1.加快训练

2.防止梯度衰减或爆炸

3.减少过拟合，提高泛化能力

介绍自注意力机制：

输入是一个向量序列，首先加入位置嵌入或其他东西，然后经过三个形状相同的矩阵，变成三个形状相同的向量序列，

其中kq相乘，得到一个n*n矩阵，代表注意力权重，然后与剩下那个v矩阵相乘，得到输出序列。

如果构造了多个头，那么把这些输出序列cat在一起，在经过一个矩阵乘法变回等大矩阵。

介绍SGD到Adam：

SGD是随机梯度下降，优化公式上，只利用了当前的梯度。有一个超参且一直不变。

这样会带来两个问题：

1.随着优化的加深，超参应该要设置得更小才行，否则就会一直震荡

2.每次优化不仅要考虑当前的梯度，还应该考虑已经积累的梯度

于是设置了动量这个概念，可以结合之前的梯度，防止陷入局部震荡。

也调整了学习率的设置，让学习率得以动态变化。

寻找两个有序数列的中位数：

这道题有两个做法，是力扣原题（好像是第5道）O（n+m）复杂度的方法就不讲了。

1.问题可以被放大为：寻找两个有序数列的第k位数。在这里，这个k是中位值。

对比他们的k/2位数时，若a的这位数大于b的这位数，则代表b中这位数之前的数必定不是

第k位数。这样就可以排除b中前面的这些数了。问题将变为在a和剩下的b中，找出第（k-k/2）的数。再次调用就行了。

2.利用中位数的性质，在a和b中某一个数列（比如a）中，找到一个数，满足aj>bi-1 and aj < bi,且j + i == (m+n)/2

注意奇偶的区别就行了。

全部评论

推荐最新楼层

10-22 12:16

途虎_数据产品经理(准入职员工)

途虎养车内推，途虎养车内推码

终于走完了全部面试流程，等结果ing二面还是专业面，依旧是深挖简历中的实习和项目经历，面试官很随和，在我详细介绍完项目和实践经历之后也一直给予积极回应和肯定，体验感很好～但汽车适配数据岗今年hc只有一个，所以竞争应该会蛮激烈。三面hr面，也是最后一轮面试，主要问了以下问题：1.自我介绍。2.当初为什么选择保研本校本专业？3.对公司和岗位的了解？4.针对实习经历展开提问5.在工作中，如何保证数据的准确性？6.工作中涉及到会给门店答疑做咨询，可能会打断手头的工作，如何在这种情况下保证工作质量（因为我前一个问题回答中提到在工作时要提高专注度）7.如果遭到门店投诉，说你匹配的数据错误，但事实上你根据指...

点赞评论收藏

昨天 12:13

Fibocom广和通_助理工程师

秋招作为过来人 | 给大家一些建议！

1. 大胆去找大环境下，找工作难似乎已成定局，几千人挤一个岗成了老生常谈。所以有很多人在找工作前就会胆怯，比如中大厂可能不会去投递，直接投递小公司。又或者投递了几十份简历被已读不回就想放弃。因为像BXXS这类招聘平台HR恢复求职者是需要收费的。HR每天又收到很多简历，优先肯定处理非常优秀的简历，所以不要因为这个否定自己！又比如有些同学在大学期间并没有很多项目，在学校学的也一般。所以认为专业对口的工作大概率不会落到自己头上，于是还没去投简历自己先生动投降。首先同时期找工作的人大部分没有 你想的那样优秀、当然除了那些顶尖学府出来的，毕竟是少数。所以你们大多都学的一样水平，你要做的是大胆去投简历，珍...

点赞评论收藏

10-27 10:13

成都理工大学 C++

秋招日常被hr震惊

难不成除了我人均四五段大厂吗，怎么问出来的

天门一键开：她的意思是问你有没有论文吧

点赞评论收藏

10-27 18:00

中山大学研发工程师

实习第一天就透底了

我的mentor就是面试我的人。我直接把找工作看作找对象，其实面试就像约会，在面试里我就先把自己说的什么都会，然后入职第一天刚准备运行个项目就露馅了（或者像是奔现现场的见光死），一个下午都没运行起项目，害的mentor教了我半个下午。后来就在公司老实沉淀了，马上开始看教程学，更离谱的是mentor直接给我甩来几个网盘压缩包，资源来咯。刚进公司时，我人生地不熟的程度，堪比在陌生的聚会但手机只剩1%的电。🤐而我本人的社交模式，属于慢热型，再慢也热不起来（bushi）。所以除了找我的mentor领任务，我基本处于“隐形人”状态。有时候我也在想，是不是该努努力，搞点向上社交，但观察后发现，大家有时候...

雾凇岛：还真是，一个好的实习mentor会是整个职业生涯的贵人

vivo公司福利 364人发布

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 如果上班像打游戏，你最想解锁什么技能 #

# 选完offer后，你后悔学机械吗？ #