2023-03-20 21:30 门头沟学院自然语言处理发布于江苏

关注

算法岗常见面试题（一）：归一化

第一次被问到归一化是超参数科技，之后五次面试三次都会问到归一化。。。

BN【深度学习】深入理解Batch Normalization批标准化

LN和BN的区别（超参数一面）

LN是根据一个样本的特征数进行归一化；BN是根据不同样本的同一特征归一化

为什么文本中用LN更好，而在图片中要跨batch做归一化？（超参数一面）

在文本中使用BN会遇到以下问题：

各个样本的长度都是不同的，但统计到比较靠后的时间片时，可能只有一个样本还有特征数据，这时基于这个样本的统计信息无法反映全局分布，这时的BN效果会不好。
如果在测试时遇到长度大于任何一个训练样本的测试样本，无法找到保存的归一化统计量，所以BN无法运行。
以上问题，都是由于计算归一化统计量时计算的样本数太少。 LN独立于batch-size，无论样本数多少都不会影响到参与LN计算的数据量。

LN的公式？（超参数一面）

先分别计算均值和标准差

均值
$\mu = \frac{1}{H} \sum_{i=1}^H a_i$
标准差
$\sigma = \sqrt {\frac{1}{H} \sum_{i=1}^H (a_i - \mu)^2}$

其中， $H$ 为一层中隐藏节点数目

通过均值和方差可以得到归一化后的值 $\hat a$ :

$\hat a = \frac{a-\mu}{\sqrt{\sigma^2+\epsilon}}$

其中， $\epsilon$ 是一个很小的数，为了防止除0再乘以增益 $g$ ，加上偏置 $b$

$h=f(g\bigodot\hat a +b)$ 这一操作的目的是保证归一化操作不会破坏之前的信息。

LN为什么要先把他映射为均值为0，方差为1，有做scale？（超参数一面）

直接变换为正态分布会导致网络表达能力下降，为了防止这一点，每个神经元增加两个调节参数（scale和shift），这两个参数是通过训练来学习到的，用来对变换后的激活反变换，使得网络表达能力增强，保证归一化操作不会破坏之前的信息，让归一化操作有可能还原最初的输入。

LN的优点

LN得到的模型更稳定
LN有正则化的作用，得到的模型更不容易拟合

#算法面经#

全部评论

推荐最新楼层

成熟的土拨鼠正在卷

北京邮电大学算法工程师

是标准化，不是归一化

点赞回复分享

发布于 2024-09-10 22:23 北京

勇敢熊猫不怕困难

广东医科大学自然语言处理

感谢大佬分享

点赞回复分享

发布于 2023-03-22 15:15 广东

还是想躺平的蚊不叮

佛山大学自然语言处理

感谢分享，学习一下

点赞回复分享

发布于 2023-03-22 15:06 广东

昨天 17:48

已编辑

用友网络_Java开发

Trae 项目规则篇

接上文，不知上文的同学，请自行查看专栏，按顺序阅读即可。环境变量配置好以后，这次我们可以打开Trae了，进入之后，首先去设置找到规则设置。如图所示：然后我们需要关注的是个人规则和项目规则。如图所示：个人规则：规则全局生效，不管你打开什么项目这个规则都是跟着你走的，所以不要写的太具体。写一些简明扼要的即可。请保持对话语言为中文我的系统为 Windows请在生成代码时添加函数级注释项目规则：只针对某一个项目来讲，对于实习生来说，最关键的几个规则我写一下，剩下的规则还得靠自己根据项目来编写。1.确保每次代码变更不会破坏现有功能，且尽可能保持最小的改动。2.以代码逻辑为主，行级、方法级注释只做参考。不...

用 Trae 上班：实习...

点赞评论收藏

01-14 15:33

卓越里程_中台运营(准入职员工)

卓越教育内推，卓越教育内推码

卓越助教面试经验分享参加卓越小学助教首先是要笔试（线上的），选语数英三科中的两到三科进行笔试，有80分就算过。题目很简单，就是小学六年级的知识点。然后你把成绩截图并且简历发给招聘负责人，等待面试。面试（线上微信视频通话）1.进行一个简单的自我介绍，并说出你做助教的个人优势。个人优势：担任过班委，班级管理经验。有家教经验，懂得如何和小朋友相处。2.情景问答题从2-9中选一个数字，回答对应的问题。1.到了上课时间老师还没来，你应该怎么办？先和老师联系，了解情况。然后告诉学生情况，安抚大家的情绪，带领学生拿出复习资料和课本进行学习，等待老师到达。2.如果上课过程中有孩子嬉笑打闹，你应该怎么办？分成三...

点赞评论收藏

2025-12-29 23:01

江西财经大学外贸业务员

求一个不把应届生当cs的城市

我真有点想骂人了

脑袋锈住了：你这算啥，哥们中科院中强所硕士，本科211，叫我去干分拣，时薪20

点赞评论收藏

昨天 13:06

门头沟学院 Java

写论文好用Prompt

其实大模型在论文写作这块的应用太多了，现在大部分论文有大模型帮忙的成分，尤其是毕业论文。我经常使用豆包帮我解决论文中研究现状的书写，首先你找一篇相关方向的综述文献，作为上传文献，要不然他容易自创文献然后提示词可以这样写：针对某某某（你要写的研究领域）并分类（根据内容，分成大概分类）每类形成一段话，一切以论文内容中为主，去掉小标题，形成放在论文中研究现状的描述，每部分内容稍微多一些，同时每段内容承接的更加自然，提到的相关内容要有引用标记，引用的文章要在末尾列出，具体引用的文章就是这个论文中的参考文献，你别瞎编文献，并且引用序号和末尾的文献要对应，不要废话空话，逻辑正确，内容通俗，不要AI的感觉，...

Prompt分享

点赞评论收藏

招聘动态

27届寒假/转正实习汇总

牛客网申助手重磅发布

全站热榜

创作者周榜

正在热议

# 被说“做题家”，你的反应是_____？ #

1290次浏览 49人参与

# 如果让你发明个APP，你会想做什么 #