Ade201903072040415

2021-08-30 11:56 已编辑香港大学大数据开发工程师

关注

秋招知识点记录（二）——XGBoost,GBDT与RF

Random Forest和GBDT区别如下：

RF的基分类器可以是分类树也可以是回归树，GBDT只能是回归树。
RF不同基分类器可以并行，GBDT只能串行。
RF最终结果采用的策略是多数投票、一票否决、加权投票等，而GBDT是将所有结果（加权）累加起来。
RF对异常值不敏感，GBDT对异常值敏感
RF对训练集一视同仁，GBDT基于Boosting思想，基于权值，分类器越弱，权值越小
RF主要减少模型方差，所以在噪声较大的数据上容易过拟合，而GBDT主要较少模型偏差。
RF随机选择样本，GBDT使用所有样本。

Xgboost就是GBDT的一种，所以Xgboost和RF的区别和GBDT一样。

GBDT和Xgboost的区别如下：

基分类器的选择：传统GBDT以CART作为基分类器，XGBoost还支持线性分类器，这个时候XGBoost相当于带L1和L2正则化项的逻辑斯蒂回归（分类问题）或者线性回归（回归问题）。
梯度信息：传统GBDT只引入了一阶导数信息，Xgboost引入了一阶导数和二阶导数信息，其对目标函数引入了二阶近似，求得解析解, 用解析解作为Gain来建立决策树, 使得目标函数最优（Gain求到的是解析解）。另外，XGBoost工具支持自定义损失函数，只要函数可一阶和二阶求导。
正则项： Xgboost引入了正则项部分，这是传统GBDT中没有的。加入正则项可以控制模型的复杂度，防止过拟合。
特征采样： Xgboost引入了特征子采样，像随机森林那样，既可以降低过拟合，也可以减少计算。
节点分裂方式：GBDT是用的基尼系数，XGBoost是经过优化推导后的。
并行化：传统GBDT由于树之间的强依赖关系是无法实现并行处理的，但是Xgboost支持并行处理，XGBoost的并行不是在模型上的并行，而是在特征上的并行，将特征列排序后以block的形式存储在内存中，在后面的迭代中重复使用这个结构。这个block也使得并行化成为了可能，其次在进行节点分裂时，计算每个特征的增益，最终选择增益最大的那个特征去做分割，那么各个特征的增益计算就可以开多线程进行。
除此之外，Xgboost实现了分裂点寻找近似算法、缺失值处理、列抽样（降低过拟合，还能减少计算）等包括一些工程上的优化，LightGBM是Xgboost的更高效实现。

Reference:
[1]原文链接：https://blog.csdn.net/quiet_girl/article/details/88756843

全部评论

推荐最新楼层

昨天 15:40

已编辑

太原理工大学 Java

字节跳动（番茄小说）前端一面挂

面试官很和善，引导的很好，技术理解的题答不出来会讲解然后跳过，感谢1.主要拷打项目和实习工作时的主观能动性，比如为了解决什么样的问题或者需求做的，工作时对项目的整体架构探索和需求背景的了解；2.提问hook和工具函数的区别，只从复用角度为什么还要用的自定义hook而不是封装成工具函数；3.前端框架的意义；4.diff和如何降低多叉树复杂度；5.找出无序数组的连续区间（思路有但没写出来，刷题刷傻了，想复杂了）；6.如何使用ai工具，使用哪些编译器，项目编译前后分别是什么；7.vite，webpack如何配置；总之考察思维和开放题为主。收获：提升了自信，以及还是要提升解决问题的能力，不能一味刷八股...

查看7道真题和解析

点赞评论收藏

分享

04-17 09:29

门头沟学院 Java

父母一问工作就炸毛,其实是对自己无能的生气

刷到太多牛友吐槽，一被父母问工作就烦躁、就炸毛、就吵架，甚至不敢接家里的电话、不敢回微信。但我今天想跟大家说一句很清醒的话：你烦的从来不是父母的那句提问，而是被这句话戳中的、对自己现状无力的自己。 而父母问这句话的本质，从来不是催你立刻拿到offer，而是在确认「你过得好不好」。先搞懂：父母到底在问什么？他们不懂什么是金三银四，不懂什么是hc锁了、池子排序、审批挂了，不懂互联网校招的千军万马过独木桥。他们甚至不懂你学的Java、Python、大模型、AI Agent，到底是做什么的。他们这辈子的认知里，工作=饭碗=安稳=你能在这个社会上立足，不用吃苦、不用受委屈。所以他们反复问「工作找得怎么样...

一超多强1：父母觉得现在的就业还跟他们那时候一样

，认知不同才是产生矛盾的关键。你可以多跟家人说说现在就业环境，大家都加油吧，现在真是不容易。

父母问你工作找得怎么样，...

点赞评论收藏

分享

03-07 20:50

中国科学技术大学 Java

今年字节实习来了波大的

刚刷到字节跳动官方发的消息，确实被这波阵仗吓了一跳。在大家还在纠结今年行情是不是又“寒冬”的时候，字节直接甩出了史上规模最大的转正实习计划——ByteIntern。咱们直接看几个最硬的数，别被花里胡哨的宣传词绕晕了。首先是“量大”。全球招7000多人是什么概念？这几乎是把很多中型互联网公司的总人数都给招进来了。最关键的是，这次的资源分配非常精准：研发岗给了4800多个Offer，占比直接超过六成。说白了，字节今年还是要死磕技术，尤其是产品和AI领域，这对于咱们写代码的同学来说，绝对是今年最厚的一块肥肉。其次是大家最关心的“转正率”。官方直接白纸黑字写了：整体转正率超过50%。这意味着只要你进去了，不划水、正常干，每两个人里就有一个能直接拿校招Offer。对于2027届（2026年9月到2027年8月毕业）的同学来说，这不仅是实习，这简直就是通往大厂的快捷通道。不过，我也得泼盆冷水。坑位多，不代表门槛低。字节的实习面试出了名的爱考算法和工程实操，尤其是今年重点倾斜AI方向，如果你简历里有和AI相关的项目，优势还是有的。而且，转正率50%也意味着剩下那50%的人是陪跑的，进去之后的考核压力肯定不小。一句话总结： 27届的兄弟们，别犹豫了。今年字节这是铁了心要抢提前批的人才，现在投递就是占坑。与其等到明年秋招去千军万马挤独木桥，不如现在进去先占个工位，把转正名额攥在手里。

喵_coding：别逗了 50%转正率仔细想想就是转正与不转正

字节7000实习来了，你...

点赞评论收藏

分享

04-08 12:21

门头沟学院 iOS开发

鼠鼠体检有以下异常，请问下各位佬需要复检吗，还是说会直接pass掉呀😴

咕咕噶：问一下hr呗，看看hr怎么说

点赞评论收藏

分享

04-21 09:40

门头沟学院 Java

从S到A,从夯到拉,ai项目盘点

结合我自己春招的面经，以及牛客上百篇AI岗上岸学长学姐的真实反馈，给大家做了一份2026春招AI项目分档盘点，精确到项目名称、适配岗位、核心亮点、面试加分点、避雷提示，帮大家精准避坑，知道哪些项目闭眼做，哪些项目千万别碰。先给核心分类标准，完全贴合校招面试的考察逻辑：【S级 高含金量】：垂直落地+技术前沿+工程化完整，面试差异化拉满，90%的面试官都会感兴趣，闭眼冲【A级 有亮点】：场景明确+有优化深度+易上手，面试有加分，适合补项目经历，放心做【B级 烂大街慎做】：同质化严重+无差异化+demo级，10个应届生9个做，没亮点慎做【C级 纯浪费时间】：无核心工作量+面试必减分+hold不住，绝...

哪些AI项目值得做？

点赞评论收藏

分享

评论

点赞

2

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 哪些AI项目值得做？ #

7822次浏览 252人参与

# 市场营销人求职交流聚集地 #

208011次浏览 1271人参与

# 华泰星战营，提前锁定校招offer #

10248次浏览 337人参与

# 实习时最怕听到的一句话 #

7261次浏览 98人参与

# 机械人还在等华为开奖吗？ #

333030次浏览 1618人参与

# 找不到大厂实习可以去小厂吗？ #

7718次浏览 59人参与

# 没有面试的日子里，你在做什么 #

5916次浏览 142人参与

# 拼多多工作体验 #

57375次浏览 399人参与

# 简历上如何体现你的“AI”能力？ #

4476次浏览 101人参与

# 你总挂在第__面？ #

3069次浏览 37人参与

# 你知道最慷慨和最抠的公司分别是 #

5708次浏览 49人参与

# 你简历上最心虚的一句话 #

11415次浏览 74人参与

# 26届的你们有几段实习？ #

178617次浏览 1110人参与

# 机械笔面试考察这些知识点 #

18437次浏览 142人参与

# 嵌入式岗知多少 #

73025次浏览 580人参与

# 产品每日一题 #

96581次浏览 711人参与

# 快消秋招求职进展汇总 #

11854次浏览 43人参与

# 实习最晚的一次下班是几点 #

34628次浏览 169人参与

# 我们是不是被“优绩主义”绑架了？ #

46551次浏览 543人参与

# 找工作的破防时刻 #

291086次浏览 2070人参与

# 锐捷网络求职进展汇总 #

9372次浏览 29人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务