2022-11-19 14:24 已编辑山东大学算法工程师发布于山东

关注

归一化

目的

不同规模的输入导致不同的权重更新和优化器的步骤向最小值的方向不均衡，这也使损失函数的形状不成比例。在这种情况下，就需要使用较低的学习速率来避免过冲，这就意味着较慢的学习过程。

解决办法是归一化。归一化处理后所有的值具有 0 均值和单位方差，这样可以提供更快的收敛和更稳定的训练。

对象

输入层和神经网络的中间层输出。

如果只是对输入数据做归一化，这样只能保证数据在输入层是一致的，并不能保证每层网络的输入数据分布是一致的，所以在神经网络模型的中间层也需要加入归一化处理。

Batchnormalization

将每个batch之间一一对应的每个channel相加,求均值和方差之后，做归一化处理，最后再加入缩放y和平移变量b。其中缩放y和平移变量b是可训练参数。在推理的时候，均值和方差是基于所有批次的期望计算所得。

归一化维度为[N, H, W]，每个通道需要学习缩放y和平移变量b。

优点：

BN后数据有固定的分布，所以可以提高学习率并加快收敛速度。
经过BN的归一化再输入激活函数，得到的值大部分会落入非线性函数的线性区，导数远离导数饱和区，避免了梯度消失，这样来加速训练收敛过程。
除了计算提升之外，BN 还可以作为一种正则化技术。数据集统计数据的近似产生的噪声消除了对 Dropout 的需要。

缺点：

对于批处理的依赖。这种估计仅适用于较大的批次。当批次数量较少时，性能会急剧下降。
BN不适合RNN、transformer等序列网络，不适合文本长度不定和batchsize较小的情况，适合于CV中的CNN等网络

LayerNormalization

在一个样本里面,对所有channel求均值和方差。

归一化维度为[C, H, W]，缩放和平移变量的参数数目视网络类型而定。

优点：

与 BN 一样，它可以加速和稳定训练，并且不受批次的限制。此方法可用于批量为 1 的在线学习任务。
LN适合用于NLP中的RNN、transformer等网络，因为sequence的长度可能是不一致的。

InstanceNormalization

Instance Normalization是针对于图像像素做归一化，最初用于图像的风格迁移任务中。在图像风格化中，生成结果主要依赖于某个图像实例，所以对整个batch归一化不适合。

归一化维度为[H, W]，每个通道需要学习缩放y和平移变量b。

优点：

可以加速模型收敛，并且保持每个图像实例之间的独立。

GroupNormalization

GN介于LN和IN之间，把channel分成多组，对每一组做归一化。

归一化维度为[C/G, H, W]

优点：

可以解决BN对较小的mini-batch size效果差的问题。GN适用于占用显存比较大的任务，例如图像分割。对这类任务，可能 batch size 只能是个位数，再大显存就不够用了。而当 batch size比较小的时候，BN 的表现很差，因为没办法通过几个样本的数据量，来近似总体的均值和标准差。

参考链接：

https://blog.csdn.net/wuchaohuo724/article/details/126607216

https://zhuanlan.zhihu.com/p/505803979

https://blog.csdn.net/qq_35812205/article/details/122330669

全部评论

推荐最新楼层

不愿透露姓名的神秘牛友

06-24 14:26

美团优选不做了，打工人上哪里买菜……

用了三年了，说没就没了美团优选已经改变了我的生活方式，忽然没了就跟城市里忽然撤掉路灯一样，一下子迷茫起来，都不知道该怎么活下去了。像我这种十八线小县城，菜市场全是欺生的死人，超市的商品能比正常城市的同款贵出两三倍去，本来就没有假期，一周休息一天还要为了买到正常的，没有烂掉的货品起早去购入一周的菜……眼前一黑又一黑，根本看不到光亮。

点赞评论收藏

分享

昨天 18:32

门头沟学院运营

现在实习生这么低廉吗？

连简历都没给他，就直接给我来这么一句😏还好我经历的少，顶的住

KarlAllen：你不攻击ta，我就要攻击你了

你都遇到过哪些离谱的求职经历

点赞评论收藏

分享

04-28 10:23

山西大学网络工程师

牛爱网，启动！

我宣布，牛客网即刻改名牛爱网，鼠鼠每天都能刷到pljj

西撒158：pljj是什么岗位

点赞评论收藏

分享

05-22 09:23

门头沟学院 Java

收到了自称是字节的邮件，是不是真的

如图。有类似情况的大佬吗，怕是钓鱼邮件还没敢点开发件人显示为字节跳动招聘 • **********     

我是晴仔呀：看邮件结尾，如果整个邮件是某某@bytedance.com 就是真的，如果其他大概率是假的

字节跳动工作体验字节求职进展汇总

点赞评论收藏

分享

今天 17:06

已编辑

门头沟学院业务管理

今年提前批的公司都好低调啊！

已经准备all in秋招了有牛友和我一起咩？

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 26届校招投递进展 #

4368次浏览 67人参与

# 2023届毁约公司名单 #

197874次浏览 954人参与

# 为了找工作你花了哪些钱？ #

16349次浏览 141人参与

# 选完offer后，你后悔学机械吗？ #

30460次浏览 172人参与

# 第一份工作能做外包吗？ #

16134次浏览 194人参与

# 你秋招想去哪些公司 #

6223次浏览 375人参与

# 你今年的平均薪资是多少？ #

128668次浏览 670人参与

# 你都遇到过哪些离谱的求职经历 #

11050次浏览 35人参与

# 电信求职进展汇总 #

10078次浏览 85人参与

# 分享一个让你热爱工作的瞬间 #

28853次浏览 307人参与

# 制造业的秋招小结 #

90307次浏览 1628人参与

# 你见过最离谱的招聘要求是什么？ #

195435次浏览 1456人参与

# 作业帮求职进展汇总 #

53842次浏览 362人参与

# 为什么那么多公司毁约 #

175314次浏览 1327人参与

# 应届生进小公司有什么影响吗 #

74774次浏览 1018人参与

# 应届生应该先就业还是先择业 #

110525次浏览 643人参与

# 如果实习可以转正，你会不会放弃秋招 #

520580次浏览 4526人参与

# 实习期间如何提升留用概率？ #

94035次浏览 1145人参与

# 非技术岗薪资爆料 #

369150次浏览 2771人参与

# 参加完秋招的机械人，还参加春招吗？ #

50842次浏览 553人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务