首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
拖拉机的拖拉
University of Saskatchewan 算法工程师
关注
已关注
取消关注
m
@林小白zii:
机器学习面经-评估方法与评价指标
一、简介 在机器学习中,评价方法和评价指标用于衡量模型在给定数据上的性能和预测能力。不同的任务和问题可能会选择不同的评价方法和评价指标。如准确率、召回率、均方误差、AUC等。 二、面经 1、请问模型常用的评估方法有哪些? 2、请问常用的评价指标有哪些? 3、你知道准确率(Accuracy)、精确率(Precision)、召回率(Recall)是怎么算的吗? 4、讲讲F1-score是怎么算的? 5、针对上面提到的一些指标,当训练集中类别不均衡,哪个最不准确? 6、ROC、AUC、PR曲线是什么关系? 7、AUC为什么比其他指标好? 8、AUC高是否一定说明auc高的模型排序能力更强?AUC对均匀正负样本采样不敏感? 9、AUC 值本身的理论上限是1吗? 10、AUC 与线上业务指标的宏观关系? 11、ROC曲线和PR曲线的区别?各自的适用场景? 三、面经参考回答 1、请问模型常用的评估方法有哪些? 参考回答:常用的评估方法包括以下几种: 训练集和测试集划分:将数据集划分为训练集和测试集,通常按照一定比例(如70%训练集,30%测试集)划分数据。训练集用于训练模型,测试集用于评估模型的性能和泛化能力。 交叉验证:K折交叉验证:将数据集划分为K个子集,依次选取其中一个子集作为验证集,剩余K-1个子集作为训练集,进行K次训练和测试,最后将K次评估结果取平均值。K折交叉验证可以更充分地利用数据集,得到更稳定的性能评估结果。留一交叉验证:特殊情况下,K折交叉验证中K等于数据集大小,即每次只留一个样本作为验证集。 自助法(Bootstrap):自助法是一种有放回的采样方法,从原始数据集中随机采样得到一个新的训练集,然后使用剩余样本作为测试集。由于自助法采样可能会产生多个相似的数据集,因此可以得到多个模型性能评估结果,通过取平均值来得到最终评估结果。 留出集法(Hold-out):将数据集划分为训练集、验证集和测试集三部分。训练集用于模型训练,验证集用于调参和模型选择,测试集用于评估模型在未知数据上的泛化能力。 时间序列交叉验证:对于时间序列数据,为了避免训练集包含未来的信息,常用的交叉验证方法有滚动交叉验证和时间序列分割交叉验证。 2、请问常用的评价指标有哪些? 参考回答:当评估机器学习模型的性能时,常用的评价指标根据任务类型可以分为以下几类: 分类任务评价指标: 准确率(Accuracy):分类正确的样本数占总样本数的比例。 精确度(Precision):真阳性样本数占所有被模型预测为正样本的样本数的比例。 召回率(Recall):真阳性样本数占所有真实正样本的样本数的比例。 F1分数(F1 Score):精确度和召回率的调和平均,用于综合考虑模型的准确性和召回性能。 ROC曲线和AUC:ROC曲线绘制了灵敏度(召回率)和特异度之间的关系,AUC用于度量ROC曲线的性能,越接近1表示模型性能越好。 回归任务评价指标: 均方误差(Mean Squared Error,MSE):预测值与真实值之间的平方差的均值。 平均绝对误差(Mean Absolute Error,MAE):预测值与真实值之间的绝对值差的均值。 R2分数(R-squared):模型预测值的方差占总方差的比例,越接近1表示模型拟合效果越好。 聚类任务评价指标: 轮廓系数(Silhouette Coefficient):衡量聚类的紧密性和分离性,越接近1表示聚类效果越好。 互信息(Mutual Information):衡量聚类结果与真实标签之间的信息量,越大表示聚类效果越好。 排序任务评价指标: 平均精确率(Mean Average Precision,MAP):对多个查询的平均精确率的平均值。 多标签分类任务评价指标: Hamming Loss:平均每个样本上错误的标签比例。 Jaccard Similarity Score:真实标签和预测标签的交集与并集之间的比例。 不同的评价指标适用于不同的任务和场景,根据具体的问题选择合适的评价指标是非常重要的。在实际应用中,通常需要综合考虑多个评价指标,并根据业务需求来选择最适合的评价指标。 3、你知道准确率(Accuracy)、精确率(Precision)、召回率(Recall)是怎么算的吗? 参考回答:先说一下含义:TP、FP、FN、TN分别为真阳性、假阳性和假阴性、真阴性。简单来说,就是: 真阳性(TP):标签为正类,预测为正类; 假阳性(FP):标签为负类,预测为正类; 真阴性(TN):标签为负类,预测为负类; 假阴性(FN):标签为正类,预测为负类; 准确率(Accuracy):T
点赞 5
评论 4
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
01-18 17:03
已编辑
上海交通大学 算法工程师
打开一个网页,HTTP 请求几次?TCP 几次?
面试题简述打开一个网页的时候,一共会发多少次 HTTP 请求?又会建立几次 TCP 连接?面试官想听的1、是否真正理解浏览器和网络协议2、是否知道一个页面不等于一个请求面试回答举例打开一个网页时,HTTP 请求次数和 TCP 连接次数并不是固定的,取决于页面内容和 HTTP 协议版本。详情请参考:http://xhslink.com/o/5lyvnr7it26由浅入深分析1、请求是应用层概念,连接是传输层概念2、协议演进的目标是减少连接开销面试加分点1、能区分 HTTP/1.1 和 HTTP/22、能提 Keep-Alive、多路复用3、提到连接建立成本很高
2025八股文复盘
点赞
评论
收藏
分享
01-19 10:21
北京邮电大学 嵌入式工程师
真有985去做外包吗?为啥老在贩卖焦虑?
外包模式正流行超6成外包岗位薪资不低于正式岗位调查显示,外包等非正式雇佣普遍存在于企业中。受访职场人中,超过一半的外包员工以劳务派遣的形式工作,求职者先与一家劳务派遣单位签订合同,再被派到用工单位工作。其余35%的人通过项目外包的形式受雇,另有15%则是岗位外包。据了解,外包岗位的核心与非核心的边界正在模糊。在一些新兴领域的部分环节,也有外包的存在,例如:IT 开发中的测试工程师、UI 设计师、新媒体的内容审核专员等。前程无忧外包项目专家透露,“某家互联网公司研发团队,将 30%的测试工作外包给专业团队,这种项目制外包逐渐成为趋势。”不论是哪种形式,外包岗位的工作状态和感受体验,一定程度上区别...
点赞
评论
收藏
分享
01-23 13:06
西华大学 Web前端
27届前端仔仔的焦虑
这放了寒假真的好焦虑,在准备换简历的第一个项目,大概是用cursor去写的继承了ai功能的平台吧,语音转文字,文生图什么的,用的技术栈还是挺多的,前后端都涉及了,一遍也在背八股,刷算法,工程化什么的,感觉好焦虑,逛了牛客和别人面经感觉自己啥都不会,以前还信誓旦旦说寒假努努力过完年投大厂试试,现在感觉啥都不会了
没有实习经历,还有机会进...
点赞
评论
收藏
分享
2025-12-28 16:16
已编辑
清华大学 Java
26届java简历求拷打
打算全力参加春招了,简历也跟着目前的实习开始逐步更新,有没有佬帮看一下简历还需要怎么改。在现在的公司做了两个项目也收获了很多,产出偷了一点也了解些。
猫猫头猫头鹰:
不是,你这个已经很牛了我觉得如果每一个点都能扛得住拷打
机械人晒出你的简历
点赞
评论
收藏
分享
01-22 13:42
蓝禾技术_电商事业部_电商运营管培生(准入职员工)
蓝禾科技内推,蓝禾科技内推码
面经:蓝禾的流程推得很快,基本上投完两天就接到了hr的初试电话,直接进行了初试。初试全程大概三十分钟,hr小哥态度很和善。主要问了实践经历获奖的情况最有成就感的事情对电商运营的理解选择公司的标准等,都是比较常规的问题。禾你一起,做不可能的事 | 蓝禾26届校招启动啦公司介绍:蓝禾2008年成立于深圳,是一家集产品、设计、研发、品牌、营销、大数据运营于一体的创新型科技公司,旗下拥有图拉斯TORRAS、锐舞RANVOO、卡斯酷CASEKOO等多个品牌招聘岗位:运营(国内)、运营(国外)、营销、设计、研发技术、职能工作地点:深圳内推链接:https://lanhevip.jobs.feishu.cn...
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
实习产出如何包装?
1.2W
2
...
27届实习时间线
1.1W
3
...
【官方活动】牛客新春计划:给陌生人的一封信
6698
4
...
32岁程序员猝死,底薪3千要24h待岗
2829
5
...
HR约你面试,句句话都有目的!
2727
6
...
实习生怎么快速融入团队
1657
7
...
20多岁最痛苦的年纪
1555
8
...
字节实习规划求助
1519
9
...
后端从0开始来得及吗
1378
10
...
程序员996斩杀线悄然而至
1367
创作者周榜
更多
正在热议
更多
#
哪些公司开春招了?
#
10981次浏览
120人参与
#
互联网公司评价
#
479033次浏览
4081人参与
#
上班以后,你还有哪些坚持的爱好?
#
7615次浏览
182人参与
#
你觉得今年秋招难吗
#
1944493次浏览
18458人参与
#
你最近因为什么迷茫?
#
34922次浏览
575人参与
#
你的秋招进行到哪一步了
#
2506051次浏览
23247人参与
#
聊聊你的被动加班经历
#
3230次浏览
62人参与
#
实习离职怎么跟领导说
#
75995次浏览
432人参与
#
工作压力大怎么缓解
#
138098次浏览
1245人参与
#
我和mentor的爱恨情仇
#
101387次浏览
917人参与
#
找工作以来,你最看不惯__
#
15552次浏览
321人参与
#
实习好累,可以辞职全力准备秋招吗
#
518806次浏览
3559人参与
#
AI coding的好用工具分享
#
19270次浏览
381人参与
#
实习怎么做才有更好的产出
#
12645次浏览
228人参与
#
实习教会我的事
#
51799次浏览
404人参与
#
工作一周年分享
#
50037次浏览
262人参与
#
四大天坑是哪四家?
#
100889次浏览
235人参与
#
一人一个landing小技巧
#
142773次浏览
1495人参与
#
你都在哪些场所面过试?
#
20530次浏览
227人参与
#
实习生工资多少才算正常?
#
13321次浏览
202人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务