首页
题库
面试
求职
学习
竞赛
More+
所有博客
搜索面经/职位/试题/公司
搜索
我要招人
去企业版
登录 / 注册
首页
>
试题广场
>
L1和L2正则化的区别
[问答题]
请你简要讲一下,L1和L2正则化有什么区别?
添加笔记
求解答(0)
邀请回答
收藏(2)
分享
纠错
2个回答
添加回答
0
bettermin
L1和L2是正则化项,为了限制模型的参数,防止模型过拟合而加在损失函数后面的一项。
L1是模型各个参数的绝对值之和,通常表示为||w||。趋向于产生少量的特征,而其他特征都是0,因为最优的参数值很大概率出现在坐标轴上,这样就会导致某一维的权重为0,产生稀疏权重矩阵。
L2是模型各个参数的平方和然后求平方根,会选择更多的参数,这些特征都会接近于0,最优的参数值很小概率出现在坐标轴上,因此每一维的参数都不会是0,最小化||w||时,就会使每一项趋近于0.
发表于 2020-08-09 15:24:48
回复(0)
0
子初子望
L1正则化具有稀疏性,L2正则化具有鲁棒性;
例如:J = arg min X1*X2
L1
正则化
:
X1 +X2 = 1
解上述目标,可知当X1= 1,X2=0(或者反过来)时 J最小,这时就突出稀疏性,即将某一个变量解置为0,另外一个变量的解就是1。拓展到n个变量时,L1正则化让大部分变量解为0,这就让有效的变量的解减少,从而达到一种稀疏的目的。
L2正则化:X1
2
+X2
2
= 1 情况下
解上述目标,由詹森不等式可知,当X1=
X2
时 J最小
,此时为什么可以突出鲁棒性呢,我们可以理解为这就是相关于给每个变量相同的权值,不强调某一个(些)变量,考虑每个变量(即考虑全局特性),当然比较有鲁棒性。比如你L1正则化时,没有把噪点值置为0,此时由于比较稀疏,噪点对模型影响会比较大,但是L2正则化考虑每个点,对于会将噪点影响减弱(想一下求平均值),让模型“光滑化”,比较
鲁棒
。
发表于 2019-01-11 21:33:26
回复(0)
这道题你会答吗?花几分钟告诉大家答案吧!
提交观点
问题信息
算法工程师
上传者:
小小
难度:
2条回答
2收藏
1730浏览
热门推荐
相关试题
下面描述中,符合结构化程序设计风格...
北京搜狐互联网信息服务有限公司
Java工程师
C++工程师
iOS工程师
安卓工程师
运维工程师
前端工程师
算法工程师
PHP工程师
2018
评论
(1)
在评估大语言模型的生成输出时,BL...
大模型概念
评论
(1)
使用 Vue Router 时,如...
Vue
评论
(1)
以下代码使用ForkJoinPoo...
Java
评论
(1)
"Let's think step...
提示词工程
评论
(1)
扫描二维码,关注牛客网
意见反馈
下载牛客APP,随时随地刷题