2023-11-19 15:47 已编辑腾讯_微信_算法

关注

《机器学习高频面试题详解》4.5：模型融合：迭代法（一）

点击上方卡片链接就可以进入专栏，专栏右上角有订阅选项，欢迎大家订阅～

前言

大家好，我是鬼仔，今天带来《机器学习高频面试题详解》专栏的第四章中模型融合第三部分的内容：迭代法，基于迭代的经典方法有三种：boosting、stacking和blending，今天先讲第一种boosting算法。这是鬼仔第一次开设专栏，每篇文章鬼仔都会用心认真编写，希望能将每个知识点讲透、讲深，帮助同学们系统性地学习和掌握机器学习中的基础知识，希望大家能多多支持鬼仔的专栏～

目前这篇是试读，后续的文章需要订阅才能查看哦，专栏预计更新30+篇文章（只增不减），具体内容可以看专栏介绍，大家的支持是鬼仔更新的动力！

本文大纲
一、原理	1. 核心思想
	2. 基本流程
二、面试真题	1. Boosting方法的优缺点？
	2. 常见的Boosting方法？
	3. Boosting算法需要关注哪些超参数？请简要说明它们的作用及如何影响模型性能？
	4. 在实际应用中如何克服Boosting算法的一些局限性？
	5. 请详细介绍 AdaBoost 算法的工作原理，并解释其如何实现模型融合以提升分类器性能？

一、原理

1. 核心思想

Boosting的核心思想是通过串行训练一系列基模型，每个模型都试图纠正前一个模型的预测误差。这样，后续的模型会更加关注在前一个模型中预测错误的样本，从而在整个训练过程中逐步提高整体模型的预测性能。也就是说，Boosting方法主要通过降低模型的偏差来提高预测性能。

2. 基本流程

1）初始化：首先为训练数据集中的每个样本分配相同的权重： $w_i = 1/N$ ，其中N是训练数据集的大小。

2）基模型训练：对于每个基模型（如决策树、支持向量机等），按照以下步骤进行训练：

使用带权重的训练数据集训练模型；
计算模型在训练数据集上的预测误差；
计算模型的权重（通常使用预测误差来计算模型权重，例如，权重可以是预测误差的函数）；
根据模型的预测误差调整训练数据集中每个样本的权重，使得预测错误的样本在后续模型中具有更大的权重。

3）模型融合：在训练完所有基模型后，需要将它们的预测结果进行融合。Boosting方法通常使用加权平均或加权投票的方式进行融合，其中模型的权重由预测误差计算得出。

二、面试真题

1. Boosting方法的优缺点？

1）优点：

高预测性能：Boosting方法可以显著提高预测性能，尤其是当基模型的性能较差时；
降低偏差：Boosting方法主要通过降低模型的偏差来提高预测性能，因此对于偏差较大的基模型（如浅层决策树）非常有效；
自适应：Boosting方法可以自适应地调整训练数据集的权重，使得后续模型更关注预测错误的样本。

2）缺点：

计算复杂度：Boosting方法需要串行训练基模型，因此计算复杂度较高，尤其是在大数据集上。
容易过拟合：Boosting方法在降低模型偏差的同时可能增加模型的方差，因此在某些情况下可能导致过拟合。
对噪声敏感：Boosting 方法通过

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

机器学习高频面试题详解文章被收录于专栏

专栏作者曾在校招期间拿到包括字节、微信和华为等多家大厂的SSP offer，该专栏主要是为了帮助同学们系统性地学习和掌握机器学习中的基础知识。专栏详细地整理了各大厂的算法岗面经，力争深入浅出地讲解重要知识点，适合人群为准备校招或者实习，且目标岗位为算法岗、数据挖掘岗或者数据分析岗的同学。

全部评论

推荐最新楼层

05-27 11:44

已编辑

华为_高级工程师

【急招】华为视频会议部门急招实习生

【我们是谁】视讯与协作行业领导者，领跑中国市场，连续八年市场份额第一，去年利润增长60%+，现业务发展，急招多名实习生，有转正名额招聘岗位：通用软件工程师、音频算法工程师 【岗位职责】投入视频会议领域音频、AI等算法、软件等创新技术的预研、算法开发及技术原型设计，助力技术点实际落地到具体的业务场景，构筑产品竞争力！ 【岗位要求】1、了解机器学习、深度学习、信号处理等一个或多个技术领域; 2、计算机、软件或者电子通信等相关专业; 3、熟悉C/C++/JAVA/Python至少一种开发语言，熟悉Linux操作系统;4、985、211本科或以上学历5、实习时间3个月以上（重点）【实习地点】东莞（首选...

投递华为等公司10个岗位 >

点赞评论收藏

转发

05-22 14:36

门头沟学院计算机类

小马智行c++一面凉经

最尴尬的一次面试，自己项目都没整明白。一直说不了解。手撕也没写出来。看前面面经说算法题没a基本凉了。 c++部分1.c++11特性记得哪些（auto，lamda，范围for，智能指针，右值引用）。2.c++14,17特性。（这个没答上来，就直接手撕环节了）。算法题1.除法模拟。int 范围内，写一个整除模拟。3个例子如下：sample1: 3 1 输出3sample2：1 2 输出 0.5sample3:1 3 输出0.（3） 写了大概30分钟，写不出来，换题了,小丑了。2.将一个数组改造为(1-n)全排列最少的变化次数是多少。 sample：[1,2,3,4,6] 答案为1。6...

小马智行一面3人在聊

查看4道真题和解析

点赞评论收藏

转发

昨天 11:09

已编辑

门头沟学院计算机类

26届找java后端/测开日常实习，求狠

想投后端但是感觉不太可能非常听劝且非常抗骂

点赞评论收藏

转发

洒脱的熊熊在炒股

05-24 15:17

海南热带海洋学院计算机类

还以为有实习能好点呢

还是一样已读不回嘛😓

点赞评论收藏

转发

爱吃老白薯

05-23 11:53

北京体育大学体育学类

58同城测试实习一面

http和https的区别get和post的区别对一个信息流的推送进行相关的测试实习中遇到的测试中的一些问题有哪些？遇到的bug，可能会是什么原因？如何去定位这里指出了我的问题，是不是单台设备的问题，兼容性考虑一下，是偶现还是必现，是前端还是后端的问题，做一个定位编写测试用例是根据什么去编写的你了解还有哪些专项测试，根据这些专项测试还可以对你设计的用例进行补充吗如何去看推送的信息与你个人的用户画像是否是匹配的反问：具体的业务场景（面试通过再分配到具体的组）会有专项测试和开发的工作吗（基于公司内部完善的测试平台进行测试，都比较成熟了，你愿意进行功能的修修补补啥的也可以）是在东五环的总部吗（是的，...

查看9道真题和解析

点赞评论收藏

转发

点赞 2 评论

招聘动态

博士生招聘专场开启啦

全站热榜

正在热议

# 和牛牛一起刷题打卡 #

3876次浏览 384人参与

# 机械制造薪资爆料 #

340067次浏览 4037人参与

# 牛客帮帮团来啦！有问必答 #

975618次浏览 14940人参与

# 2022毕业生求职现身说法 #

20080次浏览 304人参与

# 你的简历改到第几版了 #

322669次浏览 4844人参与

# 通信硬件薪资爆料 #

241028次浏览 2273人参与

# 腾讯工作体验 #

145861次浏览 1404人参与

# 如何写一份好简历 #

299632次浏览 4317人参与

# 晒一晒我的offer #

3644231次浏览 56862人参与

# 产品人专业大盘点 #

15012次浏览 120人参与

# 金融银行面经 #

11552次浏览 187人参与

# 在国企工作的人，躺平了吗？ #

105159次浏览 1331人参与

# 你觉得机械有必要实习吗 #

9953次浏览 130人参与

# 2023届毁约公司名单 #

97922次浏览 413人参与

# 运营人的第一份offer应该如何选 #

38216次浏览 664人参与

# 数据人的面试交流地 #

200953次浏览 4181人参与

# 23届的你们都什么时候入职？ #

91185次浏览 778人参与

# 为什么国企只招应届生 #

55578次浏览 404人参与

# 浅聊一下我实习的辛苦费 #

92850次浏览 911人参与

# 2022毕业的你对23届的寄语 #

16154次浏览 346人参与

牛客网
牛客企业服务