首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
拖拉机的拖拉
University of Saskatchewan 算法工程师
关注
已关注
取消关注
m
@林小白zii:
机器学习面经-评估方法与评价指标
一、简介 在机器学习中,评价方法和评价指标用于衡量模型在给定数据上的性能和预测能力。不同的任务和问题可能会选择不同的评价方法和评价指标。如准确率、召回率、均方误差、AUC等。 二、面经 1、请问模型常用的评估方法有哪些? 2、请问常用的评价指标有哪些? 3、你知道准确率(Accuracy)、精确率(Precision)、召回率(Recall)是怎么算的吗? 4、讲讲F1-score是怎么算的? 5、针对上面提到的一些指标,当训练集中类别不均衡,哪个最不准确? 6、ROC、AUC、PR曲线是什么关系? 7、AUC为什么比其他指标好? 8、AUC高是否一定说明auc高的模型排序能力更强?AUC对均匀正负样本采样不敏感? 9、AUC 值本身的理论上限是1吗? 10、AUC 与线上业务指标的宏观关系? 11、ROC曲线和PR曲线的区别?各自的适用场景? 三、面经参考回答 1、请问模型常用的评估方法有哪些? 参考回答:常用的评估方法包括以下几种: 训练集和测试集划分:将数据集划分为训练集和测试集,通常按照一定比例(如70%训练集,30%测试集)划分数据。训练集用于训练模型,测试集用于评估模型的性能和泛化能力。 交叉验证:K折交叉验证:将数据集划分为K个子集,依次选取其中一个子集作为验证集,剩余K-1个子集作为训练集,进行K次训练和测试,最后将K次评估结果取平均值。K折交叉验证可以更充分地利用数据集,得到更稳定的性能评估结果。留一交叉验证:特殊情况下,K折交叉验证中K等于数据集大小,即每次只留一个样本作为验证集。 自助法(Bootstrap):自助法是一种有放回的采样方法,从原始数据集中随机采样得到一个新的训练集,然后使用剩余样本作为测试集。由于自助法采样可能会产生多个相似的数据集,因此可以得到多个模型性能评估结果,通过取平均值来得到最终评估结果。 留出集法(Hold-out):将数据集划分为训练集、验证集和测试集三部分。训练集用于模型训练,验证集用于调参和模型选择,测试集用于评估模型在未知数据上的泛化能力。 时间序列交叉验证:对于时间序列数据,为了避免训练集包含未来的信息,常用的交叉验证方法有滚动交叉验证和时间序列分割交叉验证。 2、请问常用的评价指标有哪些? 参考回答:当评估机器学习模型的性能时,常用的评价指标根据任务类型可以分为以下几类: 分类任务评价指标: 准确率(Accuracy):分类正确的样本数占总样本数的比例。 精确度(Precision):真阳性样本数占所有被模型预测为正样本的样本数的比例。 召回率(Recall):真阳性样本数占所有真实正样本的样本数的比例。 F1分数(F1 Score):精确度和召回率的调和平均,用于综合考虑模型的准确性和召回性能。 ROC曲线和AUC:ROC曲线绘制了灵敏度(召回率)和特异度之间的关系,AUC用于度量ROC曲线的性能,越接近1表示模型性能越好。 回归任务评价指标: 均方误差(Mean Squared Error,MSE):预测值与真实值之间的平方差的均值。 平均绝对误差(Mean Absolute Error,MAE):预测值与真实值之间的绝对值差的均值。 R2分数(R-squared):模型预测值的方差占总方差的比例,越接近1表示模型拟合效果越好。 聚类任务评价指标: 轮廓系数(Silhouette Coefficient):衡量聚类的紧密性和分离性,越接近1表示聚类效果越好。 互信息(Mutual Information):衡量聚类结果与真实标签之间的信息量,越大表示聚类效果越好。 排序任务评价指标: 平均精确率(Mean Average Precision,MAP):对多个查询的平均精确率的平均值。 多标签分类任务评价指标: Hamming Loss:平均每个样本上错误的标签比例。 Jaccard Similarity Score:真实标签和预测标签的交集与并集之间的比例。 不同的评价指标适用于不同的任务和场景,根据具体的问题选择合适的评价指标是非常重要的。在实际应用中,通常需要综合考虑多个评价指标,并根据业务需求来选择最适合的评价指标。 3、你知道准确率(Accuracy)、精确率(Precision)、召回率(Recall)是怎么算的吗? 参考回答:先说一下含义:TP、FP、FN、TN分别为真阳性、假阳性和假阴性、真阴性。简单来说,就是: 真阳性(TP):标签为正类,预测为正类; 假阳性(FP):标签为负类,预测为正类; 真阴性(TN):标签为负类,预测为负类; 假阴性(FN):标签为正类,预测为负类; 准确率(Accuracy):T
点赞 5
评论 4
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
11-11 18:05
魔门塔(苏州)科技有限公司_感知算法工程师(准入职员工)
momenta内推momenta内推
momenta自动驾驶C++日常实习一面面经流程时间线:3.25HR联系约一面3.25晚7点一面3.26早上通知一面通过约二面3.26下午5点二面3.27早上HR沟通入职时间,已OC。一面流程:无手撕50min1.自我介绍2.面试官介绍部门职责(不涉及算法开发,是否能接受)3.简历浅挖(面试官大概率不是规控方向的,对项目可能了解不多,后续了解到是电气背景的)(1)hybird启发项如何设计(2)介绍latticeplanner流程(3)项目中涉及哪些传感器,如何获取heading angle。4.一系列C++,Linux,ROS八股(只列出部分还记得的)1.听说过rvo嘛2.知道raii嘛,原...
点赞
评论
收藏
分享
11-10 10:59
门头沟学院 Java
字节tiktok生活服务前端二面
time:2025.11.31.自我介绍。2.实习经历,项目经历深挖。3.http协议组成,浏览器渲染原理。4.http缓存了解。5.redis的常用场景,以及持久化原理。6.介绍一下CDN原理,为什么要用CDN。7.进程与线程的区别,浏览器线程模型有了解吗。8.redis常见数据结构,线程模型。9.JVM的组成,堆内存划分以及垃圾回收机制。10.分布式系统的好处以及实现高可用的核心思想。11.Java的进程管理,如何传经进程。12.对于项目经历的询问。13.编程题:0 1 岛屿问题(dfs)。14.未来职业规划,自己的优缺点,实习收获,英语水平。
查看14道真题和解析
点赞
评论
收藏
分享
昨天 09:15
已编辑
广东南华工商职业学院 Web前端
关于我离职后被hr抓住鸡脚这件事
被训成啥了,正常发个吐槽公司的事离职后还能私聊阴阳我,公司是深圳思某shun
notbeentak...:
就抓,嗯抓,开不开匿名都要抓,一点坏事不让说,就对公司顶礼膜拜佩服的五体投地就对了
点赞
评论
收藏
分享
昨天 10:18
文远知行_感知算法工程师(准入职员工)
文远知行内推,文远知行内推码
恍恍惚惚也实习快半年了,工作主要是后端开发。 进了才知道是自动驾驶头部的明星初创(不是的话别打我🫣)。每天从家走路15min/骑车5min到公司属实很爽。 整体规模不大,工作内容还是很丰富。从python后端到java后端,中间又穿插了一个月前端开发(噩梦hhh),以后很可能还会涉及scala。长远来看,应该还是java和scala为主,go也有使用但是不清楚我会不会用上。 我本身是第一段开发实习,加上底子很弱,确实学到很多也成长很多。被分到各种任务有时候还是蛮慌张的,好在结果整体还ok! 不提倡狂加班,还是以结果为导向,干完就可以溜溜球。加上通勤很少,整体强度不算很大。组内氛围也是挺不错的...
文远知行公司福利 510人发布
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
拒了9个offer最终留米,我秋招到底获得了什么?
7508
2
...
在大厂实习被辞了......
5931
3
...
美团java日常实习
4280
4
...
离职前mt给我留的一句话
3689
5
...
我为什么要两次放弃年终奖
3537
6
...
【百日刷题活动】校内团战刷题,抱走牛客娘周边
3292
7
...
数字马力 二面
3127
8
...
秋招最没用的建议就是劝退别人转这转那的
2311
9
...
现在还找不到日常实习的真心可以停止了。信我的兄弟们
2139
10
...
在公司实习时如何写笔记?
2098
创作者周榜
更多
正在热议
更多
#
第一次找实习,我建议__
#
18067次浏览
244人参与
#
你怎么评价今年的春招?
#
141389次浏览
1384人参与
#
从mentor身上学到了__
#
16156次浏览
263人参与
#
秋招暂停,我将对以下公司做出处罚__
#
28253次浏览
129人参与
#
什么样的公司千万别去
#
14759次浏览
110人参与
#
韶音科技求职进展汇总
#
59401次浏览
504人参与
#
你听到的“最没用”的秋招建议
#
19462次浏览
223人参与
#
如果今天是你的last day,你会怎么度过?
#
46998次浏览
294人参与
#
外出实习被同学举报
#
2793次浏览
29人参与
#
秋招我要惩罚这些公司
#
2358次浏览
22人参与
#
2025秋招体验点评
#
45379次浏览
467人参与
#
军工所铁饭碗 vs 互联网高薪资,你会选谁
#
3757次浏览
18人参与
#
你认为工作的意义是什么
#
201588次浏览
1269人参与
#
工作以后,你父母对你啥态度
#
8640次浏览
90人参与
#
打工人的至爽时刻or至暗时刻
#
41298次浏览
221人参与
#
在国企工作的人,躺平了吗?
#
374843次浏览
3930人参与
#
秋招结束之后的日子
#
105323次浏览
1016人参与
#
实习生的蛐蛐区
#
834962次浏览
4093人参与
#
你的秋招第一面感觉怎么样
#
127790次浏览
795人参与
#
非技术岗简历怎么写
#
259760次浏览
3103人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务