首页 > 试题广场 >

机器学习中几乎都可以看到损失函数后面会添加一个额外项,一般选

[问答题]
机器学习中几乎都可以看到损失函数后面会添加一个额外项,一般选用L1正则化和L2正则化,请简述他们的原理与之间的区别。
L1会趋向于产生少量的特征,而其他的特征都是0,而L2会选择更多的特征,但这些特征都会接近于0。在所有特征中只有少数特征起重要作用的情况下,选择L1比较合适,因为它能自动选择特征。而如果所有特征中,大部分特征都能起作用,而且起的作用很平均,那么使用L2也许更合适。L1不仅可以作为正则化手段,其在特征选择时候非常有用,而L2就只是一种规则化而已。
编辑于 2021-01-15 11:06:21 回复(0)
L1会趋向于产生少量的特征,而其他的特征都是0,而L2会选择更多的特征,但这些特征都会接近于0。在所有特征中只有少数特征起重要作用的情况下,选择L1比较合适,因为它能自动选择特征。而如果所有特征中,大部分特征都能起作用,而且起的作用很平均,那么使用L2也许更合适。L1不仅可以作为正则化手段,其在特征选择时候非常有用,而L2就只是一种规则化而已
编辑于 2022-02-28 17:10:44 回复(0)
正则化的不同其实就是范数的不同,L1正则化对所有参数的·惩罚力度都是一样,减少的是一个常量,可以让一部分权重变为0,因此产生稀疏模型能够去除某些特征,减少储存空间。L2正则化减少了权重的固定比例,使得权重平滑,L2正则化不会使得权重变为0,不会产生稀疏模型,可以选择更多的特,实现简单,能够起到正则化的作用。
发表于 2022-02-28 10:26:14 回复(0)
L1会趋向于产生少量的特征,而其他的特征都是0,而L2会选择更多的特征,但这些特征都会接近于0。在所有特征中只有少数特征起重要作用的情况下,选择L1比较合适,因为它能自动选择特征。而如果所有特征中,大部分特征都能起作用,而且起的作用很平均,那么使用L2也许更合适。L1不仅可以作为正则化手段,其在特征选择时候非常有用,而L2就只是一种规则化而已。
发表于 2021-08-23 14:34:18 回复(0)