normalization的均值方差计算是基于全部训练数据的
normalization的均值方差只基于当前的minibatch
normalization对输入层的每一维单独计算均值方差,
normalization的输出分布服从均值为0,方差为1的高斯分布
D选项认为有问题,BN的输出本来就是normalized之后的,只有BN层的输出为了可学习才加入线性参数
这道题你会答吗?花几分钟告诉大家答案吧!
扫描二维码,关注牛客网
下载牛客APP,随时随地刷题