三七是只小学鸡

2020-07-14 22:55 The University of Melbourne 算法工程师

关注

随机森林与GDBT

【Ensemble集成思想】

1.Boosting：将弱学习器提升为强学习器，从而提高预测精度
典型如：AdaBoost / GBDT

2.Bagging：自助采样，生成众多并行分类器，通过投票决定最终结果
典型如：Random Forest随机森林

本节主要介绍决策树的两种Ensemble方法：随机森林和GBDT

【随机森林】

1.使用了Bagging思想
多棵决策树解决了单棵泛化能力差的缺点

2.随机体现在：
随机选择样本
随机选择特征

每一棵树选取固定数量的样本集，固定数量的特征集
即总样本集和总特征集的子集构建的决策树
注意有放回抽取

3.集成学习
投票决定

【GBDT梯度上升决策树】

1.GBDT属于回归树而非分类树，思想就是不断迭代拟合前一轮的残差

2.核心在于累加所有树的结果作为最后的结果

3.利用损失函数的负梯度代替/模拟残差，对于一般的损失函数，一阶即可
Xgboost使用二阶

举个例子：
GBDT例子
首先从左图开始，
第一步选择一个特征——购物金额，作为分类标准
第二步，分类之后可以得到两个分支，对每个分支求一个平均值
第三步，每个样本根据这个值得到一个残差{ A: -1; B: 1; C:-1; D:1 }
之后来到右图，
右边就是用第一棵树残差{-1,-1,1,1}构建的一棵树
平均值为0其实就不需要计算了…
这里A/C的平均值为-1，B/D平均值为1

几种Boosting的对比

1.Adaboost：提高分类错误样本的权重，降低正确分类样本的权重
Boosting Tree：Adaboost的一般方法

2.GBDT：利用损失函数的负梯度去模拟/代替残差
对于一般的损失函数，只要一阶导数即可

残差为(真实-预测)，但真实并不一定是最优的解，可能会有一些扰动。
只是经验风险最小化的话非常容易过拟合，所以加正则项，减少过拟合。
所以我们需要计算损失函数的梯度，而不能直接使用分模型来拟合残差。

使用负梯度代替残差，可以拟合任何的损失函数。
拟合残差只是考虑到损失函数为平方损失的特殊情况，
负梯度是更加广义上的拟合项，更具普适性。

3.XGBoost：对代价函数用到了二阶泰勒展开
同时用到了一阶函数和二阶函数
因此➡️XGBoost函数可以自定义，但是要求一阶和二阶可导

全部评论

推荐最新楼层

昨天 10:10

拼多多_技术主管

【提前批】拼多多2026届秋招, 可以多面一次，超高通过率

拼多多集团-PDD校园招聘】内推链接：https://careers.pddglobalhr.com/campus/grad?t=UXtB5uESdy，内推码：UXtB5uESdy。期待你的加入！我们一起，无拼不青春！（通过此链接投递计入内推，内推简历优先筛选~）   职位介绍  1）服务端研发工程师： 内推链接：https://careers.pddglobalhr.com/campus/grad/detail?t=SmJ72uTDTD，内推码：SmJ72uTDTD 2）算法工程师：内推链接：https://careers.pddglobalhr.com/campus/grad/detail...

投递拼多多集团-PDD等公司10个岗位

点赞评论收藏

分享

今天 11:28

成都理工大学测试工程师

芯原bg卡这么严

卡bg这么严，不是92真是太难了

投递芯原微电子（上海）股份有限公司等公司10个岗位

点赞评论收藏

分享

08-05 14:31

吉林大学产品经理

搜狐畅游真有这么急嘛？

看到30号校招放出来的岗位，还是急招我投了看看这么个事

投递搜狐畅游等公司10个岗位

点赞评论收藏

分享

评论

点赞

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 实习的内耗时刻 #

2660次浏览 47人参与

# 找工作有哪些冷知识 #

137428次浏览 2336人参与

# 去哪儿旅行秋招 #

218827次浏览 3145人参与

# 你上一次给父母打电话是什么时候 #

1710次浏览 29人参与

# 你们公司哪个部门最累？ #

29599次浏览 212人参与

# 工作上你捅过哪些篓子？ #

2549次浏览 21人参与

# 腾讯大前端岗位热招中 #

12340次浏览 120人参与

# 国央企笔面经互助 #

140856次浏览 1107人参与

# 得物求职进展汇总 #

103280次浏览 821人参与

# 你觉得专业和学校哪个对薪资影响最大 #

67113次浏览 513人参与

# 牛友们的论文几号送审 #

49685次浏览 796人参与

# 我的职场心眼子段位 #

39877次浏览 695人参与

# 选完offer后，你后悔学本专业吗 #

50061次浏览 246人参与

# 你认为工作的意义是什么 #

164842次浏览 1072人参与

# 这些公司卡简历很严格 #

45082次浏览 213人参与

# Tplink求职进展汇总 #

165421次浏览 855人参与

# 重来一次，我还会选择这个专业吗 #

335339次浏览 3740人参与

# 你觉得通信/硬件有必要实习吗？ #

129561次浏览 1041人参与

# 央国企投递记录 #

97641次浏览 1405人参与

# 秋招笔面试记录 #

77312次浏览 1528人参与

# 美团秋招笔试 #

58497次浏览 389人参与

# 你觉得机械有必要实习吗？ #

12087次浏览 87人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务