首页 > 试题广场 >

Dropout 训练和推理阶段分别怎么用、为什么这么用?跟

[问答题]
Dropout 训练和推理阶段分别怎么用、为什么这么用?跟 BN/LN 放一起会有哪些相互影响,怎么摆放更稳。 给出一句话总结和详细解
Dropout在训练时随机丢弃神经元(按概率p)以增强泛化,推理时则关闭并乘以补偿系数(1-p)以保持期望输出稳定;与BN/LN共存时,优先将Dropout置于归一化层之后(如LN→Dropout),避免破坏归一化带来的分布稳定性,在Transformer等现代架构中甚至可省略Dropout
发表于 2026-05-18 12:49:26 回复(1)