首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
巴啦啦能量
四川大学 算法工程师
发布于四川
关注
已关注
取消关注
有用的知识,马住~
@码农鬼仔:
《机器学习高频面试题详解》1.10:随机森林
点击上方卡片链接就可以进入专栏,专栏右上角有订阅选项,欢迎大家订阅~ 前言 大家好,我是鬼仔,今天带来《机器学习高频面试题详解》专栏的第1.10节:随机森林。这是鬼仔第一次开设专栏,每篇文章鬼仔都会用心认真编写,希望能将每个知识点讲透、讲深,帮助同学们系统性地学习和掌握机器学习中的基础知识,希望大家能多多支持鬼仔的专栏~ 目前这篇是试读,后续的文章需要订阅才能查看哦,专栏预计更新30+篇文章(只增不减),具体内容可以看专栏介绍,大家的支持是鬼仔更新的动力! 本文大纲 一、原理 1. 集成学习 2. 随机森林 二、面试真题 1. 简要介绍下集成学习? 2. 集成学习中bagging和boosting的区别? 3. 随机森林的随机性体现在哪里? 4. 随机森林为什么不能用全样本取训练m棵决策树? 5. 随机森林的优缺点? 一、原理 1. 集成学习 在实际应用中,单个模型可能无法满足要求,因此需要将多个基础模型组合起来,以提高模型的准确性和稳定性,这就是集成学习。集成学习不仅可以提高模型性能,还可以有效地减少过拟合的风险。同时,集成算法也存在一些缺点,由于集成算法需要将多个基础模型的结果组合起来,因此计算成本会比单个模型更高,导致运行时间变长。 集成算法可以分为两类:基于bagging(投票)的集成算法和基于boosting(加权)的集成算法。基于投票的集成算法是将多个基础模型的结果进行投票,以确定最终的结果;基于加权的集成算法是将多个基础模型的结果进行加权,以确定最终的结果。 集成学习的示意图如下: 1)Bagging算法 Bagging算法流程图如下: 在Bagging算法中,基学习器的训练集是通过随机采样得到的,随机采样常使用自助采样法(Bootstrap sampling),即有放回的采样:对于m个样本的训练数据集合,每次随机采集一个样本放入采样集,接着把该样本放回,下次采样时该样本仍有可能被采集到,这样采集m次,最终可以得到m个样本的采样集。以上操作重复N次,可以得到N个不同的采样集。对于这N个采样集,我们可以分别独立训练出N个弱学习器,最后通过集成策略(投票法/平均法)得到一个强学习器。 可以看到,Bagging算法中,基模型之间不存在强依赖关系,一系列基模型可以并行生成。因为采样与投票/平均过程的复杂度很小,所以Bagging算法的复杂度与直接使用基模型的复杂度同阶,算法高效。 2)Boosting算法 Boosting算法流程图如下: Boosting算法的基本思想是,将多个弱学习器组合成一个强学习器,从而提高学习性能。它的基本原理是,每个弱学习器都会从上一个弱学习器的错误中学习,从而提高学习性能。具体可以分为两种操作:重赋权法和重采样法。 重赋权法要求基学习器能对特定的数据分布进行学习,即在训练过程的每一轮中,根据样本分布为每个训练样本重新赋予一个权重。具体步骤如下:首先从训练集用初始权重训练出一个弱的基学习器1,根据基学习器的学习误差率来更新训练样本的权重,使得之前弱学习器1学习误差率高的训练样本的权重变高,使得这些误差率高的样本在后面的
点赞 22
评论 3
全部评论
推荐
最新
楼层
饭炒锅盖
门头沟学院 数字IC前端设计
楼主去哪里了
点赞
回复
分享
发布于 2023-04-10 01:00
山东
暂无评论,快来抢首评~
相关推荐
昨天 12:13
重庆市九龙坡区职业教育中心 Java
求求大家帮忙选offer
楼主四川人,很多朋友亲人都在成都,但是成都工资确实低
offer帮选
点赞
评论
收藏
分享
05-08 16:28
上海电机学院 无线通信工程师
百度又放大招了:实习生薪资全面提升,最高涨110%
昨天晚上和一个百度的HR朋友吃了个饭,她给我透了个劲爆消息:百度实习生薪资全面上调,平均涨30%以上,AI类岗位最高涨了110%。说实话,我第一反应是:百度又开始用最质朴的方式抢人了——给钱。但回家路上越想越不对劲,这事没那么简单。涨薪的本质,从来不是福利升级。如果你也在看暑期实习,建议多想一层:薪酬变化,本质是供需关系的晴雨表。AI人才,正在被重新定价。涨薪这件事,是公司对未来投入产出的判断——只有当AI开始产生真实业务价值,企业才有底气提高人力投入。这两年大模型火得一塌糊涂,但真正能把AI从论文里跑成产品、从产品里跑出收入的公司,全国一只手数得过来。当需求远大于供给的时候,价格必然上涨。所...
点赞
评论
收藏
分享
昨天 19:32
昆明理工大学 Java
AI 时代,我为什么还在苦练 SQL?|一次线上紧急问题把我点醒
大家好,我是杭州某大厂中台后端研发。最近一次线上紧急排障,让我彻底想明白了一件事:AI 再强,程序员的 SQL 基本功永远不能丢。背景:周末深夜被线上问题叫醒某个周末晚上,我接到上游部门研发同事的电话:需要紧急查询一份线上数据。数据源跨不同实例业务表拆分出 8 张分表需要统计总数 + 关联两张表字段线上问题响应不能拖,我一边远程配合,一边凭脑子里的业务表结构手写 SQL。结果第二个组合查询第一次没跑通,同事 Review 后又改了一轮才真正可用。事后复盘,我很清楚:极限压力下,手写 SQL 的能力依然不够稳。灵魂一问:AI 都能写 SQL,我为什么还要练?现在确实是 AI 时代,只要描述需求、...
AI替代不了什么?
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
26届0offer0面试,准备送外卖😄
6572
2
...
27双非本暑期实习终于结束,分享一下timeline吧
5903
3
...
招了一年实习生,撑过三个月的一只手数得清
4785
4
...
春招没进大厂,我的人生会完蛋吗
4286
5
...
腾讯云智暑期timeline
4195
6
...
得物暑期golang
4024
7
...
工作5年重回牛客
3570
8
...
字节实习结束
3435
9
...
破防了,腾讯技术实习月薪涨了近50%…
3149
10
...
现在的实习生都是不学就进来实习的吗?
2978
创作者周榜
更多
正在热议
更多
#
你的实习产出是真实的还是包装的?
#
89552次浏览
640人参与
#
百度工作体验
#
334003次浏览
2264人参与
#
在爱玛,骑向未来
#
45524次浏览
440人参与
#
打工人的精神状态
#
154771次浏览
1556人参与
#
职场新人体验
#
193060次浏览
1246人参与
#
工作后,你落下了哪些病根
#
42542次浏览
299人参与
#
简历当中有水分算不算造假?
#
176660次浏览
2330人参与
#
机械人,说说你的烦心事
#
149015次浏览
1172人参与
#
你收到了哪些公司的笔试?
#
69453次浏览
446人参与
#
毕业季,给职场新人一些建议
#
221606次浏览
2608人参与
#
工作压力大,你会干什么?
#
82724次浏览
713人参与
#
你以为的实习VS真实的实习
#
142916次浏览
758人参与
#
招聘要求与实际实习内容不符怎么办
#
222876次浏览
1063人参与
#
稳定和高薪机械人更看重哪个?
#
594173次浏览
5583人参与
#
硬件/芯片公司工作体验
#
177755次浏览
1030人参与
#
备战春招/暑实,现在应该做什么?
#
70380次浏览
557人参与
#
距离春招还有一个月,你现在是什么开局?
#
62936次浏览
320人参与
#
米哈游求职进展汇总
#
691260次浏览
3358人参与
#
什么专业适合考公
#
69770次浏览
353人参与
#
银行笔面经互助
#
198648次浏览
1326人参与
#
百度求职进展汇总
#
729892次浏览
6436人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务