首页
题库
面试
求职
学习
竞赛
More+
所有博客
搜索面经/职位/试题/公司
搜索
我要招人
去企业版
登录 / 注册
首页
>
试题广场
>
把 BN 讲透:原理是什么;训练期和推理期用的统计量有何不同
[问答题]
把 BN 讲透:原理是什么;训练期和推理期用的统计量有何不同;跟 LN、GN 比,分别什么时候用、怎么取舍。
添加笔记
求解答(0)
邀请回答
收藏(30)
分享
纠错
9个回答
添加回答
1
Raymond_030927
BN在前馈传播中,深层网络的输入会随着上层的输入而漂移,此时就需要不断调整参数。BN就是强制让每层输入在Batch里就保持稳定分布,归一化。 LN是跨层独立,无依赖,适合语言推理 GN是每组独立,适合目标检测等
发表于 2026-03-14 02:50:16
回复(0)
1
在考古的三文鱼很糊涂
BN Batch Normalization,是为了缓解模型的内部协变量偏移问题,即上层网络给下层网络的输入一直在变化,导致下层网络难以学习的问题。训练时使用当前batch的均值方差做标准化,再进行缩放和平移;推理时用全部样本累计的滑动平均进行
发表于 2025-09-21 17:15:17
回复(0)
1
牛客936040679号
BN的原理是由于数据的分布成正态分布,bn先用均值为0,方差为1的正态分布函数将一批次的数据控制到0-1之间,避免的数据的连续性被破坏,BN是在图像处理中使用,LN一般是在自然语言处理中使用
发表于 2025-09-11 17:07:42
回复(0)
0
Jerryyyytse
let the current batch to do the normalization, (x - mean) / sd BN的原理是由于数据的分布成正态分布,bn先用均值为0,方差为1的正态分布函数将一批次的数据控制到0-1之间,避免的数据的连续性被破坏,BN是在图像处理中使用,LN一般是在自然语言处理中使用
发表于 2026-04-12 10:50:09
回复(1)
0
牛客499956214号
BN的原理就是在一个batch内对数据进行,标准化,首先计算均值和方差,再进行归一化,主要是为了解决内部协变量偏移问题。训练时运用当前batch的均值与方差,预测时运用全局的。BN适合于图像分类使用一般是大Batch。LN一般在自然语言处理或者时序数据、序列数据中使用;GN一般每组独立,适合目标检测一般是小Batch 。
发表于 2026-03-18 21:26:53
回复(0)
0
牛哥不相信眼泪1
发表于 2026-03-03 16:09:07
回复(0)
0
Crystal_93
发表于 2025-12-28 21:08:18
回复(0)
0
懵懵的萌新
BN(Batch Normalization)对批次内的所有样本进行均值为0,标准差为1的标准化,缓解下层网络难以学习的问题。训练时是以当前批次为参考,推理是整个样本。BN一般用在图像分类中,LN是在NLP中。GN在检测中
发表于 2025-10-24 00:04:50
回复(0)
0
聪明的放鸽子能手allin实习
1.bn是batchnormalization,对某一个批次内所有样本进行均值为0,标准差为1的标准化,在训练时参考的是当前批次的样本,但是在推理时期,参考的是训练集所有样本的均值和标准差,ln一般用在nlp中,可以处理不同长度的向量
发表于 2025-09-19 16:15:25
回复(0)
这道题你会答吗?花几分钟告诉大家答案吧!
提交观点
问题信息
来自:
机器学习应用-牛客面经八股
难度:
9条回答
30收藏
1241浏览
热门推荐
相关试题
挑一次你觉得最有价值的“特征/损失...
评论
(0)
来自
机器学习应用-牛客面经八股
L1 和 L2 正则你怎么选?它们...
评论
(7)
来自
机器学习应用-牛客面经八股
Dropout 训练和推理阶段分别...
评论
(2)
来自
机器学习应用-牛客面经八股
你做 CTR/CVR/CTCVR ...
评论
(0)
来自
机器学习应用-牛客面经八股
扫描二维码,关注牛客网
意见反馈
下载牛客APP,随时随地刷题