首页 > 试题广场 >

BN层的作用，为什么要在后面加伽马和贝塔，不加可以吗

[问答题]

BN层的作用，为什么要在后面加伽马和贝塔，不加可以吗

nbucaicai头像

nbucaicai

BN可以认为是在每一层的输入和上一层的输出之间加入一个计算层，对数据的分布进行额外的约束，从而增强模型的泛化能力。但是BN同时也降低了模型的拟合能力，BN之后的输入分布被强制为均值为0标准差为1。以Sigmoid激活函数为例，BN之后的输入分布整体处于函数的非饱和区域，只包含线性变换，破坏了之前学习到的特征分布。为了恢复原始数据分布，所以引入了缩放和平移参数。仅用这两个参数就可以恢复最优的输入数据分布，与之前的网络层解耦，从而更加有利于优化的过程，提高模型的泛化能力。

发表于 2020-01-14 22:22:38 回复(0)

Leong_Logan头像

Leong_Logan

进行尺度缩放和偏移操作，这样可以换回原始的分布，实现恒等变换，这样的目的是为了补偿网络的非线性表达能力，因为经过标准化后，偏移量丢失。

发表于 2020-05-22 20:48:28 回复(0)

呼卡呼卡头像

呼卡呼卡

这个问题困扰了好久，如果说加beta和gamma是为了还原最初分布，那BN层加和不加不就完全一样了吗？我的理解是减均值除方差让每一层的均值方差都变成了0/1，加入beta和gamma为了增加非线性性。个人理解，可能是错的。

发表于 2020-01-03 10:10:19 回复(3)

糖水橘子头像

糖水橘子

使用beta（移位）和gamma（缩放）因子，将数据尽可能还原为最初的输入分布，提高模型的容纳能力。

发表于 2019-09-07 12:01:55 回复(0)

超超越越_头像

超超越越_

不加beta和gamma两个参数的话，那就破坏了数据的一些特征表达了。。。

发表于 2019-07-18 15:08:46 回复(0)

提交观点

问题信息

上传者：小小

难度：

5条回答 86收藏 7610浏览

热门推荐

相关试题

扫描二维码，关注牛客网
意见反馈
下载牛客APP，随时随地刷题

扫一扫，把题目装进口袋

求职之前，先上牛客: 扫描二维码，进入QQ群



扫描二维码，关注牛客公众号

公司地址：北京市朝阳区北苑路北美国际商务中心K1座一层-北京牛客科技有限公司
联系方式：010-60728802 投诉举报电话：010-57596212（朝阳人力社保局）
牛客科技© All rights reserved admin@nowcoder.com
京ICP备14055008号-4 增值电信业务经营许可证营业执照人力资源服务许可证
京公网安备 11010502036488号