首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
想吃烤肉的长颈鹿风度翩翩
关注
已关注
取消关注
mark
@林小白zii:
机器学习面经-LR
一、简介 LR(Logistic Regression,逻辑回归)虽然名字中带有"回归",但实际上是一种用于分类问题的统计学习方法,而不是传统的回归问题。它是一种广泛应用于机器学习和统计分析的算法,特别适用于二分类问题,也可以扩展到多分类问题。LR的基本思想是,通过一个线性函数的组合,将特征和类别之间的关系建模为一个概率。然后,通过一个逻辑函数(通常是sigmoid函数)将这个概率转化为一个落在0到1之间的数,表示某样本属于某一类别的概率。在训练过程中,LR会调整模型参数,使得模型预测的概率与实际类别标签尽可能一致。 二、面经 1、写一下LR的公式,它的损失函数是什么,推导一下? 参考回答:它的公式就是里面一个线性的函数,然后通过一个sigmoid激活函数组成,能够将所有的输入映射到[0,1]这个一个区间中。逻辑回归假设数据服从伯努利分布,通过极大化似然函数的方法,运用梯度下降来求解参数,来达到将数据二分类的目的。 LR的公式如下: LR的损失函数如下: 损失函数的推导如下: 2、介绍一下逻辑回归和线性回归的关系? 参考回答:逻辑回归和线性回归虽然在名称上很相似,但实际上是两个不同的算法,用于解决不同类型的问题。以下是它们之间的关系和区别: 1、逻辑回归用于解决分类问题,线性回归用于解决预测回归问题; 2、逻辑回归的输出是一个概率值,表示属于某一类别的概率,范围在0到1之间;线性回归的输出是一个连续的数值,可以是任意实数; 3、逻辑回归使用交叉熵损失函数,衡量模型预测概率与实际标签之间的差距;线性回归通常使用均方误差(MSE)等损失函数,衡量预测值与真实值之间的差距。 4、逻辑回归通过最小化损失函数来估计参数,通常使用梯度下降法或其他优化算法。线性回归也通过最小化损失函数来估计模型参数,通常使用最小二乘法或梯度下降法。 3、LR的损失函数以及逻辑回归和最大似然的关系? 参考回答:LR的损失函数为交叉熵损失,也可以叫做logloss对数损失,它的具体公式也在面经1中已经介绍了,可以返回详细看下。简单来说,它就是假设样本服从伯努利分布(0-1),我们就能求的单个样本的极大似然函数,然后扩散到整个样本集,就能得到整个样本的似然函数,我们的目的就是要求得这个似然函数的最大值,也就是极大似然。 4、LR为什么用sigmoid函数? 参考回答:1、Sigmoid函数将任意实数映射到区间(0, 1),在逻辑回归中,这个区间可以被解释为概率。这样,模型的输出可以被理解为样本属于正类的概率,符合逻辑回归的目标。2. Sigmoid函数的导数可以用Sigmoid函数本身表示,这使得梯度计算相对容易。在梯度下降等优化算法中,梯度的计算是很关键的,而Sigmoid函数的导数可以用数学上的简单形式来表示。3. Sigmoid函数的公式相对简单,便于处理和计算。 5、逻辑回归是一个分类算法,可以用来解决回归问题吗? 参考回答:逻辑回归是一个分类算法,通常用于解决分类问题,而不是回归问题。虽然名称中包含了"回归"一词,但实际上是因为它在数学形式上与线性回归有些相似,但用途和应用是不同的。逻辑回归的目标是预测一个样本属于某个类别的概率,输出结果是一个介于0和1之间的概率值。这样的输出适用于分类问题,例如判断电子邮件是否为垃圾邮件、疾病是否发生等。对于回归问题,目标是预测一个连续的数值输出。典型的回归算法包括线性回归、决策树回归、神经网络回归等。这些算法用于预测房价、销售额、温度等连续数值。虽然逻辑回归主要用于分类问题,但它也可以用于处理多类别分类问题,或者在一些情况下可以进行变种以适应回归问题,例如在逻辑回归的基础上进行拓展,但通常在解决回归问题时会选择专门的回归算法来获得更好的性能。 6、逻辑回归怎么做多分类? 参考回答:多分类问题一般将二分类推广到多分类的方式有三种,一对一,一对多,多对多。一对一:将N个类别两两配对,产生N(N-1)/2个二分类任务,测试阶段新样本同时交给所有的分类器,最终结果通过投票产生。一对多:每一次将一个例作为正例,其他的作为反例,训练N个分类器,测试时如果只有一个分类器预测为正类,则对应类别为最终结果,如果有多个,则一般选择置信度最大的。多对多:若干各类作为正类,若干个类作为反类。注意正反类必须特殊的设计。 7、线性回归用平方和损失、逻辑回归用logloss,为什么逻辑回归不用平方和损失? 参考回答:逻辑回归使用交叉熵损失(Log Loss)而不是平方和损失,主要是因为逻辑回归的目标函数和输出特性与平方和损失不太匹配。以下是一些原因解释为什么逻辑回归通常不使用平方和损失: 不适合概率预测: 逻辑回归的输出是一个介于0和1之间的概率值,而平方和损失在计算误差时会对较大的误差更加敏感。由于逻辑回归的输出范围限制在0到1之间,使用平方和损失可能会导致训练过程不稳定,不适合对概率预测进行建模。 非凸优化问题: 使用平方和损失的线性回归问题是一个凸优化问题,但将其应用于逻辑回归时,由于逻辑函数的非线性变换,损失函数会变成非凸的。这样的非凸优化问题可能会导致训练过程陷入局部最小值,并影响模型的性能。 不平衡类别: 在分类问题中,类别不平衡(即正负样本数量差异较大)是常见情况。平方和损失在这种情况下可能会导致模型偏向于预测数量较多的类别,而忽略数量较少的类别。 概率交叉熵的信息论解释: 交叉熵损失在信息论中有着明确的解释,与概率分布之间的差异有关,适用于逻辑回归的概率预测问题。 8、LR的使用场景,怎么引入的非线性?为什么要特征离散化? 参考回答:我们在使用逻辑回归的时候很少会把数据直接丢给LR来训练,我们一般会对特征进行离散化处理。离散后稀疏向量内积乘法运算速度更快,计算结果也方便存储,容易扩展。离散后的特征对异常值更具鲁棒性,如age>30为1否则为0,对于年龄为200的也不会对模型造成很大的干扰。其次LR属于广义线性模型,表达能力有限,经过离散化后,每个变量有单独的权重,这相当于引入了非线性,能够提升模型的表达能力,加大拟合。离散后特征可以进行特征交叉,提升表达能
点赞 9
评论 8
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
03-09 15:15
吉林农业大学 算法工程师
AI-Agent 面试题汇总 - 机器学习篇
1. 机器学习中特征的理解特征(Feature)是样本可量化的属性,是模型输入。特征质量通常决定模型效果上限。常见有数值、类别、文本、时间、统计聚合、交叉特征等。2. 机器学习中有哪些特征工程方法?常见方法:缺失值处理、异常值处理、编码、标准化/归一化、特征构造、特征选择、降维。 from sklearn.preprocessing import StandardScaler, OneHotEncoder from sklearn.compose import ColumnTransformer from sklearn.pipeline import Pipeline from sklear...
AI-Agent面试实战...
点赞
评论
收藏
分享
03-09 15:13
吉林农业大学 算法工程师
AI-Agent 面试题汇总 - 大模型篇
一、大语言模型基础1. 目前主流的开源模型体系有哪些?主流开源模型体系包括:LLaMA 系、Qwen 系、GLM/ChatGLM 系、Mistral/Mixtral 系、Baichuan 系、DeepSeek 系、InternLM、Yi 等。面试里建议从以下维度比较:参数规模(7B/13B/70B…)上下文长度(8K/32K/128K…)多语言能力工具调用能力(function calling / agent)推理成本与部署难度开源协议(是否可商用)2. Prefix LM 和 Causal LM 区别是什么?Causal LM:严格自回归,token 只能看左侧历史(下三角 mask)。Pr...
AI-Agent面试实战...
点赞
评论
收藏
分享
02-23 09:22
山东科技大学 golang
暑期实习求指导
双非一本,八股刚开始,这个简历能找到实习吗。。。
零零幺零零幺:
至少再做一个项目,然后猛投小厂,不然有点难
点赞
评论
收藏
分享
02-18 10:21
门头沟学院 嵌入式软件开发
27简历求拷打,我真没招了😭
竞赛聊胜于无,实习也没学到东西
点赞
评论
收藏
分享
03-09 15:49
已编辑
东南大学 Java
快手主站用增二面
1、自我介绍2、介绍实习3、问为什么研究生方向是LLM,选择做开发,以及到岗时间4、详细介绍其中一段实习,完整的业务流程、业务背景、系统设计5、具体围绕的我实习展开大概40mins (一致性、并发、分库分表)6、hashMap相关问题 (一个线程写,其他多个线程读出现什么问题)7、redis实现分布式锁 (自己实现redis分布式锁考虑什么)8、redis的技术选型问题,给你一个新的业务场景,多大并发要引入redis,为什么引入redis9、tcp的三次握手,如果每次第二次服务端发完syn+ack 客户端都不回复,且客户端多次尝试,会出现什么问题10、XSS问题11、https代理人劫持12、...
查看12道真题和解析
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
滴滴一面
4474
2
...
6个AI实操技巧,帮你在简历+面试中拉开差距
4397
3
...
春招以来最舒服的一场试
3769
4
...
百度日常一天速通一二面
3640
拼多多笔试
热聊中
5
...
滴滴一面面经
3601
6
...
快手前端实习一面
3559
7
...
字节一面、二面(横向挂)
3098
8
...
美团笔试+ai面+米哈游笔试
2866
9
...
小红书一面(已挂)
2487
10
...
美团 后端日常实习(OC)
2381
创作者周榜
更多
正在热议
更多
#
三月的小目标
#
59086次浏览
862人参与
#
你上一次加班是什么时候?
#
137947次浏览
763人参与
#
滴滴笔试
#
35086次浏览
200人参与
#
2025秋招体验点评
#
99954次浏览
754人参与
#
美团笔试
#
702829次浏览
4674人参与
#
你遇到过哪些神仙同事
#
133933次浏览
763人参与
#
AI岗位暴涨12倍,你会转AI赛道吗?
#
6230次浏览
115人参与
#
米哈游笔试
#
557747次浏览
1109人参与
#
金三银四,你的春招进行到哪个阶段了?
#
18821次浏览
255人参与
#
今天你投了哪些公司?
#
174621次浏览
3012人参与
#
27届实习投递记录
#
1172次浏览
24人参与
#
vivo笔试
#
13260次浏览
123人参与
#
小米编程考试
#
32291次浏览
152人参与
#
你感受到金三银四了嘛?
#
81218次浏览
670人参与
#
字节7000实习来了,你投了吗?
#
5433次浏览
26人参与
#
虽然0面试,但今天___,夸夸自己
#
10599次浏览
193人参与
#
文科生还参加今年的春招吗
#
13791次浏览
100人参与
#
职场上哪些行为很加分?
#
337392次浏览
3728人参与
#
AI项目实战
#
7791次浏览
378人参与
#
实习学不到东西正常吗?
#
9120次浏览
199人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务