首页 > 试题广场 >

机器学习中几乎都可以看到损失函数后面会添加一个额外项，一般选

[问答题]

机器学习中几乎都可以看到损失函数后面会添加一个额外项，一般选用L1正则化和L2正则化，请简述他们的原理与之间的区别。

查看答案及解析

pein531头像

pein531

L1会趋向于产生少量的特征，而其他的特征都是0，而L2会选择更多的特征，但这些特征都会接近于0。在所有特征中只有少数特征起重要作用的情况下，选择L1比较合适，因为它能自动选择特征。而如果所有特征中，大部分特征都能起作用，而且起的作用很平均，那么使用L2也许更合适。L1不仅可以作为正则化手段，其在特征选择时候非常有用，而L2就只是一种规则化而已。

编辑于 2021-01-15 11:06:21 回复(0)

牛客874133995号头像

牛客874133995号

L1会趋向于产生少量的特征，而其他的特征都是0，而L2会选择更多的特征，但这些特征都会接近于0。在所有特征中只有少数特征起重要作用的情况下，选择L1比较合适，因为它能自动选择特征。而如果所有特征中，大部分特征都能起作用，而且起的作用很平均，那么使用L2也许更合适。L1不仅可以作为正则化手段，其在特征选择时候非常有用，而L2就只是一种规则化而已

编辑于 2022-02-28 17:10:44 回复(0)

在开会的加菲猫很超脱头像

在开会的加菲猫很超脱

正则化的不同其实就是范数的不同，L1正则化对所有参数的·惩罚力度都是一样，减少的是一个常量，可以让一部分权重变为0，因此产生稀疏模型能够去除某些特征，减少储存空间。L2正则化减少了权重的固定比例，使得权重平滑，L2正则化不会使得权重变为0，不会产生稀疏模型，可以选择更多的特，实现简单，能够起到正则化的作用。

发表于 2022-02-28 10:26:14 回复(0)

牛客220033171号头像

牛客220033171号

L1会趋向于产生少量的特征，而其他的特征都是0，而L2会选择更多的特征，但这些特征都会接近于0。在所有特征中只有少数特征起重要作用的情况下，选择L1比较合适，因为它能自动选择特征。而如果所有特征中，大部分特征都能起作用，而且起的作用很平均，那么使用L2也许更合适。L1不仅可以作为正则化手段，其在特征选择时候非常有用，而L2就只是一种规则化而已。

发表于 2021-08-23 14:34:18 回复(0)

提交观点

问题信息

算法工程师阅文集团 2021

来自：2023届阅文机器学习...

上传者：小小

难度：

4条回答 20收藏 2405浏览

热门推荐

相关试题

扫描二维码，关注牛客网
意见反馈
下载牛客APP，随时随地刷题

扫一扫，把题目装进口袋

求职之前，先上牛客: 扫描二维码，进入QQ群



扫描二维码，关注牛客公众号

公司地址：北京市朝阳区北苑路北美国际商务中心K1座一层-北京牛客科技有限公司
联系方式：010-60728802 投诉举报电话：010-57596212（朝阳人力社保局）
牛客科技© All rights reserved admin@nowcoder.com
京ICP备14055008号-4 增值电信业务经营许可证营业执照人力资源服务许可证
京公网安备 11010502036488号