码农鬼仔

2022-11-01 15:17 已编辑腾讯_微信_算法

发布于广东

关注

《机器学习高频面试题详解》1.2：逻辑回归（上）

前言

大家好，我是鬼仔。今天带来《机器学习高频面试题详解》专栏第1.2节：逻辑回归，因为内容比较多，所以本节分为了上下两篇。鬼仔希望写的每篇专栏文章能够将一个知识点讲透、讲深，也希望读者能从鬼仔的文章中有所收获。

欢迎大家订阅该专栏，目前这篇是试读，后续的文章需要订阅才能查看哦（每周一更/两更），专栏预计更新30篇文章（只增不减），具体内容可以看专栏介绍，大家的支持是鬼仔更新的动力！

一、原理

1. 线性回归模型

（1）讲到逻辑回归，我们首先要先了解线性回归模型。

线性回归模型假设输入特征和输出结果满足线性关系：，此时的是连续值，所以是回归模型。如果想要转化为分类模型，那么需要将做一次函数变换，令的值在某个特定区间的时候属于特定类别即可，逻辑回归模型的出发点即来源于此。

（2）线性回归模型经过最⼤似然估计推导出来的待优化⽬标函数与平⽅损失函数是等价的。

（3）为了解决过拟合问题，线性回归模型可以引入正则化的方法：

岭回归

加入L2正则项，等价于对参数w引入协方差为a的零均值高斯先验，不能做variable selection。

LASSO回归

加入L1正则项，等价于对参数w引入拉普拉斯先验，可以做variable selection。

2. 逻辑回归模型

逻辑回归是一种常见的用于分类的模型，虽然是分类模型，但原理上还是和回归紧密相关。

一句话总结逻辑回归模型：先把特征线性组合，然后使用sigmoid函数（单调可微）将结果约束到0~1之间，结果用于二分类预测。

模型参数估计：最大似然估计法估计模型参数，使用梯度下降或者拟牛顿法进行学习。

损失函数：最小化交叉熵误差（等价于最大似然估计）。

防止过拟合：L1正则化和L2正则化。
处理非线性数据：加核函数或特征变换，显式地把特征映射到高维空间。

二、面试真题

1. 逻辑回归怎么实现多分类？

传统的逻辑回归是二分类模型，但很容易推广到多分类任务上，具体有两大类做法：

修改逻辑回归的损失函数：sigmoid->softmax；
不妨把这个问题抽象为：二分类模型怎么实现多分类任务？将多分类任务分解为多个二分类任务即可！

下面稍微展开讲解下：

（1）修改逻辑回归的损失函数

sigmoid函数只能输出两种类别的概率，要想输出多种类别的预测概率，我们需要将损失函数修改为softmax，具体公式如下：

sigmoid中的参数θ是一个向量，而softmax将参数θ拓展成了一个矩阵，矩阵中每一行向量为对应类别的参数，输出的数表示该类别的预测概率，总和为1。也即，将一个样本输入到softmax回归模型中，会输出不同类别对应的预测概率，最后取概率最高的类别作为预测结果。

（2）将多分类任务分解为多个二分类任务

具体的分解方法有以下三类：

OvR（One vs Rest）

每次将一个类别样本作为正类，其他类别样本统一作为负类，这样 N 个类别可以生成 N 个二分类器，输入一个测试数据会

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

机器学习高频面试题详解文章被收录于专栏

专栏作者曾在校招期间拿到包括字节、微信和华为等多家大厂的SSP offer，该专栏主要是为了帮助同学们系统性地学习和掌握机器学习中的基础知识。专栏详细地整理了各大厂的算法岗面经，力争深入浅出地讲解重要知识点，适合人群为准备校招或者实习，且目标岗位为算法岗、数据挖掘岗或者数据分析岗的同学。

全部评论

推荐最新楼层

10086.

门头沟学院后端工程师

最后一个问题, 是不是等价于 "对特征作离散化的好处?"

点赞回复分享

发布于 2023-09-12 16:49 福建

unixxxxxx

门头沟学院机器学习

最后一个的意思是逻辑回归只能处理离散特征？

点赞回复分享

发布于 2022-10-31 13:42 北京

01-26 10:03

哈尔滨工业大学游戏后端

实习产出怎么包装

本篇文章提前先写出来，还没有确定去实习的可以先存着，可能等到你真正拿到实习offer，入职那一天看会更有帮助，对27届实习秋招时间线有疑惑的，认真去读我上一篇帖子，目前都在准备阶段，不知道准备什么的就在龙哥群里找你想去厂的往届真题看看，三年高考，五年模拟先把“包装”这件事的边界讲明白包装不是编故事，更不是把小需求硬吹成架构升级。面试官真正想听的是你有没有工程思维，能不能把一件事讲成闭环。闭环就三句话：你为了解决什么业务问题，做了哪些技术动作，最后拿到了什么可信的结果或证据。把这三句话写扎实，哪怕做的事不“酷”，也会显得很“真”。业务是产出的根，先把“我们在干嘛”搞透实习产出写得空，很多时候不是...

实习如何「偷」产出？

点赞评论收藏

01-23 19:43

门头沟学院 golang

25届鼠鼠无法忍耐的现代生活：回望磨炼心性的2025以及初次社招

前言写于26届春招前（或许已经开始），这是一篇迟到的总结：并不是什么经验贴，只是对过去自我经历的碎碎念。要用什么去形容我的2025年以及校招经历呢？磨炼心性我觉得是最合适的。校招阶段折磨（2024.9 - 2025.4）兜兜转转又一年，距离我上次校招已经快过去一年了，然而2025届毕业的我已经开始进入社招流程了，社招结束后又回到牛客上刷了好久帖子，感觉目前的反思帖子多起来了，氛围也是越来越好了。遥想一年前的我在校招经历了几十场互联网面试后心气全无，一心想要回到鹅厂，但也不知道喜欢什么岗位，只是因为我参与了比较多的后端实习所以就一直被各种后端业务岗捞起，而我并不了解那些所谓的业务，拿到的offe...

点赞评论收藏

01-22 23:39

北华航天工业学院 C++

大家都是刷了多少题才oc的

力扣刷了130多道了，还是没感觉。春招又开始了愁死了愁死了虽然做了一百多题了但是很少有题目是我做出来的，要么是看了评论区的思路要么就是自己的思路但测试总有不通过的例子，真和智商没关系吗

双非后端失败第N人：力扣总共刷了快五百道吧，但是现在只反复刷codetop的经典题了

点赞评论收藏

01-16 23:54

广西职业师范学院嵌入式工程师

末流公办二本简历求拷打

随便讲，不玻璃心。目前在广西南宁找到2000的嵌入式，准备去面试

点赞评论收藏

01-26 21:41

清华大学机械设计/制造

机械专业有这么不堪吗？

大家好，今天给大家分享一些对机械专业的观点。下面是不同机械人的经历及观点：网友1：玩意学的杂，老师的话就是机械里边啥也学点，学不精，但是好处是能搞机械控制嵌入式，能搞方向不少。网友2：二本机械真不行，我有个学长考研失败调剂回二本本校机械，现在毕业都找不到工作。网友3：计算机不是985.211硕士很难找工作，机械工很多，你可以看看校园招聘会，很多找机械的。网友4：现在还有机械不带电的，现在什么机械不往自动化上发展。整条生产线没有一个人，都是全自动化的。原来人的岗位都换机械臂和机器人了。网友5：劝退机械？谁有资格劝退工科之王，工科我只服电气在机械之上，其它都靠边。网友6：在国内一直是制造业大国机器...

点赞评论收藏

124

招聘动态

27届寒假/转正实习汇总

全站热榜

创作者周榜

正在热议

# AI时代的工作 VS 传统时代的工作，有哪些不同？ #

# 当你问AI“你会取代我的工作吗”，它说_？ #

6109次浏览 181人参与

# 你的landing期是如何度过的？ #