首页
题库
面试
求职
学习
竞赛
More+
所有博客
搜索面经/职位/试题/公司
搜索
我要招人
去企业版
登录 / 注册
首页
>
试题广场
>
比较LR和GBDT,什么情景下GBDT不如LR
[问答题]
比较
LR
和
GBDT
,什么情景下
GBDT
不如
LR
查看答案及解析
添加笔记
求解答(0)
邀请回答
收藏(23)
分享
纠错
3个回答
添加回答
7
pein531
1.比较LR和GBDT:
(1) LR是一种线性模型,而GBDT是一种非线性的树模型,因此通常为了增强模型的非线性表达能力,使用LR模型之前会有非常繁重的特征工程任务;
(2) LR是单模,而GBDT是集成模型,通常来说,在数据低噪的情况下,GBDT的效果都会优于LR;
(3) LR采用梯度下降方法进行训练,需要对特征进行归一化操作,而GBDT在训练的过程中基于gini系数选择特征,计算最优的特征值切分点,可以不用做特征归一化。
2.GBDT不如LR的地方:
一方面,当需要对模型进行解释的时候,GBDT显然会比LR更加“黑盒”,因为我们不可能去解释每一棵树。相比之下,LR的特征权重能够很直观地反映出特征对不同类样本的贡献程度,也正因为如此好理解,很多时候我们可以根据LR模型得到的分析结论做出更有说服力的营销和运营策略;
另一方面,LR模型的大规模并行训练已经非常成熟,模型迭代速度很快,业务人员可以很快得到模型的反馈,并对模型进行针对性的修正。而GBDT这样的串行集成方式让它的并行十分困难,在大数据规模下训练速度十分缓慢;
最后,对于高维的稀疏数据,GBDT往往很容易过拟合,将这些无用信息学习到模型,得到很深的树;而LR这样的线性模型可以通过加入正则化,来对特征进行筛选,降低弱特征的权重(L2正则)甚至过滤掉弱特征(L1正则),从而削弱模型的复杂度,防止过拟合。
编辑于 2021-02-25 11:30:43
回复(0)
0
食堂在逃干饭王
LR是线性模型,模型简单,可解释性强,对异常特征不敏感
GBDT是非线性模型,属于集成学习中的boosting方法,基学习器是树模型,且树模型间相互依赖,无法并行训练,其特征组合和表达能力更强,且更容易过拟合
高维稀疏特征时,LR会比GBDT更好,因为LR加正则化不容易过拟合,而GBDT在高维稀疏特征下会生成很深的树,容易过拟合。
发表于 2021-02-04 12:17:58
回复(0)
0
水上漂
<p>模样</p>
发表于 2021-01-17 23:38:24
回复(0)
这道题你会答吗?花几分钟告诉大家答案吧!
提交观点
问题信息
算法工程师
阅文集团
2021
来自:
2023届阅文机器学习...
上传者:
小小
难度:
3条回答
23收藏
2137浏览
热门推荐
相关试题
五月份的商品销售额为60万元,该月...
数据分析师
途虎
2021
评论
(2)
来自
途虎养车2023秋招数据...
下列哪两个变量之间的相关程度高
数据分析师
途虎
2021
评论
(4)
来自
途虎养车2023秋招数据...
下面描述中,符合结构化程序设计风格...
北京搜狐互联网信息服务有限公司
Java工程师
C++工程师
iOS工程师
安卓工程师
运维工程师
前端工程师
算法工程师
PHP工程师
2018
评论
(1)
两只队伍分物资
算法工程师
阅文集团
2021
评论
(7)
来自
2023届阅文机器学习方...
逻辑回归,相比于线性回归,有何异同...
算法工程师
阅文集团
2021
评论
(3)
来自
2023届阅文机器学习方...
扫描二维码,关注牛客网
意见反馈
下载牛客APP,随时随地刷题