小 batch 时效果变差
与 Dropout 同时开可能导致方差不匹配
推理时使用滑动平均的均值与方差
训练时用当前 batch 统计均值与方差
这道题你会答吗?花几分钟告诉大家答案吧!
扫描二维码,关注牛客网
下载牛客APP,随时随地刷题