首页 > 试题广场 >

考虑以下问题:假设我们有一个5层的神经网络,这个神经网络在使

[单选题]

考虑以下问题:假设我们有一个5层的神经网络,这个神经网络在使用一个4GB显存显卡时需要花费3个小时来完成训练。而在测试过程中,单个数据需要花费2秒的时间。 如果我们现在把架构变换一下,当评分是0.2和0.3时,分别在第2层和第4层添加Dropout,那么新架构的测试所用时间会变为多少?

  • 少于2s
  • 大于2s
  • 仍是2s
  • 说不准
在架构中添加Dropout这一改动仅会影响训练过程,而并不影响测试过程。
发表于 2020-03-15 18:05:27 回复(1)
Batch Normalization(BN),就是在深度神经网络训练过程中使得每一层神经网络的输入保持相近的分布。
对于BN,在训练时,是对每一批的训练数据进行归一化,也即用每一批数据的均值和方差。而在测试时,比如进行一个样本的预测,就并没有batch的概念,因此,这个时候用的均值和方差是全量训练数据的均值和方差,这个可以通过移动平均法求得。
对于BN,当一个模型训练完成之后,它的所有参数都确定了,包括均值和方差,gamma和bata。因为用全量训练集的均值和方差容易过拟合,对于BN,其实就是对每一批数据进行归一化到一个相同的分布,而每一批数据的均值和方差会有一定的差别,而不是用固定的值,这个差别实际上能够增加模型的鲁棒性,也会在一定程度上减少过拟合。因此BN一般要求将训练集完全打乱,并用一个较大的batch值,否则,一个batch的数据无法较好得代表训练集的分布,会影响模型训练的效果。

Dropout是在训练过程中以一定的概率的使神经元失活,即输出为0,以提高模型的泛化能力,减少过拟合。Dropout 在训练时采用,是为了减少神经元对部分上层神经元的依赖,类似将多个不同网络结构的模型集成起来,减少过拟合的风险。而在测试时,应该用整个训练好的模型,因此不需要dropout。
BN和Dropout单独使用都能减少过拟合并加速训练速度,但如果一起使用的话并不会产生1+1>2的效果,相反可能会得到比单独使用更差的效果。
发表于 2020-03-05 11:25:29 回复(3)
写了一堆迷惑文字,其实就是考dropout不影响测试过程
发表于 2020-07-02 11:29:19 回复(0)
Dropout 在训练时采用,是为了减少神经元对部分上层神经元的依赖,类似将多个不同网络结构的模型集成起来,减少过拟合的风险。而在测试时,应该用整个训练好的模型,因此不需要dropout。
发表于 2020-07-16 06:18:01 回复(0)
测试过程中Dropout和BN都不起作用
发表于 2022-03-29 20:05:38 回复(0)
Dropout是指在深度学习网络的训练过程中,对于神经网络单元,按照一定的概率将其暂时从网络中丢弃。
作用是预防CNN过拟合的正则化方法,直接作用是减少中间特征的数量,从而减少冗余,即增加每层各个特征之间的正交性;
只会对网络训练有影响,对网络测试没有影响。
发表于 2020-08-14 10:56:09 回复(0)
那如果问的是训练时间会变成多少的话 意思就会少于2秒吗?
发表于 2022-09-01 05:51:57 回复(1)
Dropout只会对网络训练有影响,对网络测试没有影响
发表于 2021-04-06 09:39:13 回复(0)
看错了是测试过程,而非训练过程 测试过程中dropout是不起作用的
发表于 2021-07-13 02:07:14 回复(0)
在架构中添加Dropout仅会影响训练过程(为了减少过拟合)。而在测试时,应该用整个训练好的模型,因此不影响测试过程。
发表于 2023-08-21 19:12:56 回复(0)
玩文字游戏是吧。。。。
发表于 2023-08-20 22:22:08 回复(0)
测试过程中不是要多乘个概率吗。。
发表于 2023-04-20 11:06:52 回复(0)
Dropout仅在训练时随机删减神经元,在测试时所有神经元均参与计算。
发表于 2022-09-05 19:59:09 回复(0)
Dropout 有两点缓解过拟合问题: 1)在训练阶段,其通过在每次迭代时随机丢弃一些神经元来改变网络结构,实现训练不同结构神经网络的目的,在测试阶段会使用全部神经元,相当于对之前训练的的不同结构的网络都参与了对最终结果的投票,(不同网络之间共享了参数)2)能够减少神经元之间复杂的共适应关系。

发表于 2022-08-23 10:47:58 回复(0)
评分是什么鬼?1-drop率?
发表于 2020-10-20 20:11:26 回复(1)
inverted dropout - untouched in test time - activations are divided by prob in train time dropout - multiply prob in test time
发表于 2020-04-25 00:33:25 回复(0)