首页
题库
面试
求职
学习
竞赛
More+
所有博客
搜索面经/职位/试题/公司
搜索
我要招人
去企业版
登录 / 注册
首页
>
试题广场
>
什么是梯度爆炸和梯度消失?它们的原因是什么?
[问答题]
什么是梯度爆炸和梯度消失?它们的原因是什么?
添加笔记
求解答(0)
邀请回答
收藏(10)
分享
纠错
2个回答
添加回答
1
gelanpoint
一个数据输入到模型中再到输出会经过多个线性层、非线性层。在对模型进行梯度更新的时候就会反向计算其梯度然后进行更新。这一更新遵循求导的链式法则,如果接连的数值都很大,那么就会造成梯度爆炸,反之则会造成梯度消失。比如1.2连续乘以10次就会爆炸性的增长,0.1连续乘以10次也会爆炸性的减少。那么模型的权重就无法得到好的更改
发表于 2026-02-10 11:39:49
回复(0)
0
大A什么时候创造奇迹
梯度消失指的是在多层迭代中传输数据会越来越小导致最终输出为0的结果,权重无法更新;而梯度爆炸指的是初始化权重过大导致前面层训练更新的速度要快于后面层,导致网络权重的大幅更新,影响最终训练效果。
发表于 2025-12-23 15:19:35
回复(0)
这道题你会答吗?花几分钟告诉大家答案吧!
提交观点
问题信息
来自:
2025年-华为-AI...
难度:
2条回答
10收藏
493浏览
热门推荐
相关试题
你在项目里具体怎么用过贝叶斯概率?...
评论
(0)
来自
2025年-华为-AI算...
不借助深度学习框架,直接用 num...
评论
(0)
来自
2025年-华为-AI算...
把 Transformer / D...
评论
(4)
来自
2025年-华为-AI算...
你怎么把 Transformer ...
评论
(1)
来自
2025年-华为-AI算...
扫描二维码,关注牛客网
意见反馈
下载牛客APP,随时随地刷题