首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
喵201810152348584
大连海事大学 数据分析师
发布于山东
关注
已关注
取消关注
@林小白zii:
机器学习面经-LR
一、简介 LR(Logistic Regression,逻辑回归)虽然名字中带有"回归",但实际上是一种用于分类问题的统计学习方法,而不是传统的回归问题。它是一种广泛应用于机器学习和统计分析的算法,特别适用于二分类问题,也可以扩展到多分类问题。LR的基本思想是,通过一个线性函数的组合,将特征和类别之间的关系建模为一个概率。然后,通过一个逻辑函数(通常是sigmoid函数)将这个概率转化为一个落在0到1之间的数,表示某样本属于某一类别的概率。在训练过程中,LR会调整模型参数,使得模型预测的概率与实际类别标签尽可能一致。 二、面经 1、写一下LR的公式,它的损失函数是什么,推导一下? 参考回答:它的公式就是里面一个线性的函数,然后通过一个sigmoid激活函数组成,能够将所有的输入映射到[0,1]这个一个区间中。逻辑回归假设数据服从伯努利分布,通过极大化似然函数的方法,运用梯度下降来求解参数,来达到将数据二分类的目的。 LR的公式如下: LR的损失函数如下: 损失函数的推导如下: 2、介绍一下逻辑回归和线性回归的关系? 参考回答:逻辑回归和线性回归虽然在名称上很相似,但实际上是两个不同的算法,用于解决不同类型的问题。以下是它们之间的关系和区别: 1、逻辑回归用于解决分类问题,线性回归用于解决预测回归问题; 2、逻辑回归的输出是一个概率值,表示属于某一类别的概率,范围在0到1之间;线性回归的输出是一个连续的数值,可以是任意实数; 3、逻辑回归使用交叉熵损失函数,衡量模型预测概率与实际标签之间的差距;线性回归通常使用均方误差(MSE)等损失函数,衡量预测值与真实值之间的差距。 4、逻辑回归通过最小化损失函数来估计参数,通常使用梯度下降法或其他优化算法。线性回归也通过最小化损失函数来估计模型参数,通常使用最小二乘法或梯度下降法。 3、LR的损失函数以及逻辑回归和最大似然的关系? 参考回答:LR的损失函数为交叉熵损失,也可以叫做logloss对数损失,它的具体公式也在面经1中已经介绍了,可以返回详细看下。简单来说,它就是假设样本服从伯努利分布(0-1),我们就能求的单个样本的极大似然函数,然后扩散到整个样本集,就能得到整个样本的似然函数,我们的目的就是要求得这个似然函数的最大值,也就是极大似然。 4、LR为什么用sigmoid函数? 参考回答:1、Sigmoid函数将任意实数映射到区间(0, 1),在逻辑回归中,这个区间可以被解释为概率。这样,模型的输出可以被理解为样本属于正类的概率,符合逻辑回归的目标。2. Sigmoid函数的导数可以用Sigmoid函数本身表示,这使得梯度计算相对容易。在梯度下降等优化算法中,梯度的计算是很关键的,而Sigmoid函数的导数可以用数学上的简单形式来表示。3. Sigmoid函数的公式相对简单,便于处理和计算。 5、逻辑回归是一个分类算法,可以用来解决回归问题吗? 参考回答:逻辑回归是一个分类算法,通常用于解决分类问题,而不是回归问题。虽然名称中包含了"回归"一词,但实际上是因为它在数学形式上与线性回归有些相似,但用途和应用是不同的。逻辑回归的目标是预测一个样本属于某个类别的概率,输出结果是一个介于0和1之间的概率值。这样的输出适用于分类问题,例如判断电子邮件是否为垃圾邮件、疾病是否发生等。对于回归问题,目标是预测一个连续的数值输出。典型的回归算法包括线性回归、决策树回归、神经网络回归等。这些算法用于预测房价、销售额、温度等连续数值。虽然逻辑回归主要用于分类问题,但它也可以用于处理多类别分类问题,或者在一些情况下可以进行变种以适应回归问题,例如在逻辑回归的基础上进行拓展,但通常在解决回归问题时会选择专门的回归算法来获得更好的性能。 6、逻辑回归怎么做多分类? 参考回答:多分类问题一般将二分类推广到多分类的方式有三种,一对一,一对多,多对多。一对一:将N个类别两两配对,产生N(N-1)/2个二分类任务,测试阶段新样本同时交给所有的分类器,最终结果通过投票产生。一对多:每一次将一个例作为正例,其他的作为反例,训练N个分类器,测试时如果只有一个分类器预测为正类,则对应类别为最终结果,如果有多个,则一般选择置信度最大的。多对多:若干各类作为正类,若干个类作为反类。注意正反类必须特殊的设计。 7、线性回归用平方和损失、逻辑回归用logloss,为什么逻辑回归不用平方和损失? 参考回答:逻辑回归使用交叉熵损失(Log Loss)而不是平方和损失,主要是因为逻辑回归的目标函数和输出特性与平方和损失不太匹配。以下是一些原因解释为什么逻辑回归通常不使用平方和损失: 不适合概率预测: 逻辑回归的输出是一个介于0和1之间的概率值,而平方和损失在计算误差时会对较大的误差更加敏感。由于逻辑回归的输出范围限制在0到1之间,使用平方和损失可能会导致训练过程不稳定,不适合对概率预测进行建模。 非凸优化问题: 使用平方和损失的线性回归问题是一个凸优化问题,但将其应用于逻辑回归时,由于逻辑函数的非线性变换,损失函数会变成非凸的。这样的非凸优化问题可能会导致训练过程陷入局部最小值,并影响模型的性能。 不平衡类别: 在分类问题中,类别不平衡(即正负样本数量差异较大)是常见情况。平方和损失在这种情况下可能会导致模型偏向于预测数量较多的类别,而忽略数量较少的类别。 概率交叉熵的信息论解释: 交叉熵损失在信息论中有着明确的解释,与概率分布之间的差异有关,适用于逻辑回归的概率预测问题。 8、LR的使用场景,怎么引入的非线性?为什么要特征离散化? 参考回答:我们在使用逻辑回归的时候很少会把数据直接丢给LR来训练,我们一般会对特征进行离散化处理。离散后稀疏向量内积乘法运算速度更快,计算结果也方便存储,容易扩展。离散后的特征对异常值更具鲁棒性,如age>30为1否则为0,对于年龄为200的也不会对模型造成很大的干扰。其次LR属于广义线性模型,表达能力有限,经过离散化后,每个变量有单独的权重,这相当于引入了非线性,能够提升模型的表达能力,加大拟合。离散后特征可以进行特征交叉,提升表达能
点赞 9
评论 8
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
昨天 15:38
已编辑
武汉大学 Java
快手暑期实习 一面
额,全程拷打项目几乎没有纯八股相关的八股:redisson分布式锁相比于set nx的好处completableFuture与future相比有哪些不同说一下aoprabbitmq延时队列是怎么实现的手撕:删除链表重复元素II(昨晚喝了酒,我还以为是约的下午面试,早上九点起来发现是十点的面试,我嘞个豆
查看5道真题和解析
点赞
评论
收藏
分享
03-24 20:58
阿里巴巴_淘宝_前端
聊一聊一些 Agent 项目的亮点(进阶)
引言大部分人简历上写的 Agent 项目,技术链路是这样的:接收用户输入 → 调 LLM → 解析工具调用 → 执行工具 → 返回结果。这是 Agent 的"最小可用版本",能跑通,但没有任何区分度——2026 年了,跟着任何一个教程都能搭出来。尤其 RAG 相关的大家已经觉得烂大街了,评论区也有同学吐槽真正让面试官觉得"这个人做过真东西"的,是那些教程里不会教、但生产中必须解决的进阶问题。以下逐个拆解。一、Agent Harness:Agent 不是一个模型调用,是一个运行时是什么:Agent Harness 是 Agent 的"执行骨架&q...
简历中的项目经历要怎么写
点赞
评论
收藏
分享
02-28 15:06
潍坊科技学院 日语翻译
快,各位大神,给我分享分享经验
点赞
评论
收藏
分享
03-24 22:11
门头沟学院 Web前端
不是老了才会死。。
随时随地都有可能error
点赞
评论
收藏
分享
今天 14:02
吉林农业大学 算法工程师
腾讯 大模型应用开发 一面
1. 项目里是把 skill 直接塞进 system prompt 的,如果 skill 太多,占用上下文窗口太大,怎么处理不能把所有 skill 常驻塞进 system prompt,这样会带来三个问题:上下文窗口被占满、候选技能噪声太大、模型在选择 skill 时更容易混淆。更合理的方式是把 skill 做成外部注册表,system prompt 里只保留最小规则和调用协议,真正的 skill 描述按需动态注入。常见做法是先做一层 skill routing。可以用规则、分类模型或者向量检索先筛出 topk skill,再把这几个 skill 的 description、参数 schema...
AI-Agent面试实战...
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
双非选手的求职的感悟
2758
2
...
美团暑期实习一面
2735
美团笔试好难
热聊中
3
...
阿里笔试竟然考了AI提示词。。。
2108
4
...
暑期结束,拥抱腾讯了
1683
中国电信328笔试
热聊中
5
...
双非两段大厂实习0offer,我做对了什么
1620
6
...
携程3.25Java开发二面面经
1596
7
...
字节一面-飞书后端暑期实习
1507
8
...
9本暑期实习完全没面试,哪里有问题?
1432
9
...
京东零售暑期一面
1329
10
...
快手暑期前端一面 3.25
1162
创作者周榜
更多
正在热议
更多
#
AI面会问哪些问题?
#
23595次浏览
467人参与
#
中国电信笔试
#
30373次浏览
278人参与
#
厦门银行科技岗值不值得投
#
7273次浏览
183人参与
#
你的实习产出是真实的还是包装的?
#
18200次浏览
325人参与
#
找AI工作可以去哪些公司?
#
7162次浏览
174人参与
#
春招至今,你的战绩如何?
#
57986次浏览
523人参与
#
开放七大实习专项,百度暑期实习值得冲吗
#
13698次浏览
203人参与
#
从事AI岗需要掌握哪些技术栈?
#
7177次浏览
229人参与
#
你做过最难的笔试是哪家公司
#
28256次浏览
172人参与
#
哪些公司真双非友好?
#
69051次浏览
286人参与
#
投递几十家公司,到现在0offer,大家都一样吗
#
339282次浏览
2159人参与
#
阿里笔试
#
174690次浏览
1292人参与
#
面试被问期望薪资时该如何回答
#
382382次浏览
2163人参与
#
一张图晒出你司的标语
#
3705次浏览
67人参与
#
晶盛机电求职进展汇总
#
35191次浏览
318人参与
#
面试尴尬现场
#
220577次浏览
860人参与
#
五一之后,实习真的很难找吗?
#
102761次浏览
583人参与
#
沪漂/北漂你觉得哪个更苦?
#
8839次浏览
183人参与
#
___岗狗都不干,我干!
#
77743次浏览
309人参与
#
HR最不可信的一句话是__
#
5361次浏览
109人参与
#
AI时代,哪个岗位还有“活路”
#
10383次浏览
318人参与
#
长得好看会提高面试通过率吗?
#
21160次浏览
245人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务