首页
题库
面试
求职
学习
竞赛
More+
所有博客
搜索面经/职位/试题/公司
搜索
我要招人
去企业版
登录 / 注册
首页
>
试题广场
>
L1和L2正则化的区别
[问答题]
请你简要讲一下,L1和L2正则化有什么区别?
添加笔记
求解答(0)
邀请回答
收藏(2)
分享
纠错
2个回答
添加回答
0
bettermin
L1和L2是正则化项,为了限制模型的参数,防止模型过拟合而加在损失函数后面的一项。
L1是模型各个参数的绝对值之和,通常表示为||w||。趋向于产生少量的特征,而其他特征都是0,因为最优的参数值很大概率出现在坐标轴上,这样就会导致某一维的权重为0,产生稀疏权重矩阵。
L2是模型各个参数的平方和然后求平方根,会选择更多的参数,这些特征都会接近于0,最优的参数值很小概率出现在坐标轴上,因此每一维的参数都不会是0,最小化||w||时,就会使每一项趋近于0.
发表于 2020-08-09 15:24:48
回复(0)
0
惊鹿
L1正则化具有稀疏性,L2正则化具有鲁棒性;
例如:J = arg min X1*X2
L1
正则化
:
X1 +X2 = 1
解上述目标,可知当X1= 1,X2=0(或者反过来)时 J最小,这时就突出稀疏性,即将某一个变量解置为0,另外一个变量的解就是1。拓展到n个变量时,L1正则化让大部分变量解为0,这就让有效的变量的解减少,从而达到一种稀疏的目的。
L2正则化:X1
2
+X2
2
= 1 情况下
解上述目标,由詹森不等式可知,当X1=
X2
时 J最小
,此时为什么可以突出鲁棒性呢,我们可以理解为这就是相关于给每个变量相同的权值,不强调某一个(些)变量,考虑每个变量(即考虑全局特性),当然比较有鲁棒性。比如你L1正则化时,没有把噪点值置为0,此时由于比较稀疏,噪点对模型影响会比较大,但是L2正则化考虑每个点,对于会将噪点影响减弱(想一下求平均值),让模型“光滑化”,比较
鲁棒
。
发表于 2019-01-11 21:33:26
回复(0)
这道题你会答吗?花几分钟告诉大家答案吧!
提交观点
问题信息
算法工程师
上传者:
小小
难度:
2条回答
2收藏
1536浏览
热门推荐
相关试题
下面描述中,符合结构化程序设计风格...
搜狐
Java工程师
C++工程师
iOS工程师
安卓工程师
运维工程师
前端工程师
算法工程师
PHP工程师
2018
评论
(1)
假定一个待哈希存储的线性表为(32...
哈希
评论
(1)
5.下列判断正确的是( )
资料分析
言语理解与表达
资料分析
评论
(1)
《拳皇97》最后BOSS是谁?
游戏常识
评论
(1)
《魔兽世界》中,下列不属于玩家可以...
游戏常识
评论
(1)
扫描二维码,关注牛客网
意见反馈
下载牛客APP,随时随地刷题