首页 > 试题广场 >

当你使用20轮的梯度下降选取α=0.3,并且每轮计算J(θ)

[单选题]
当你使用20轮的梯度下降选取 α=0.3, 并且每轮计算 J(θ) ,当你发现J(θ)一直上涨时,下面哪些结论看起来靠谱?()
  • α=0.3 是一个非常好的参数 
  • 你可以考虑用一个更大的 α=1.0
  • 你可以考虑用一个更小的 α=0.1
学习率过大会造成震荡
发表于 2020-06-12 19:58:47 回复(1)
这道题答案不是很能理解。实验中我得到的结论是,学习率越大-->学习速度越快-->达到平稳状态的历时越少。题目说一直在上涨,说明学习率不够,难道不应该加大学习率,让系统在有限轮次(20)中达到平稳状态吗?
发表于 2023-04-23 02:42:54 回复(0)