首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
拖拉机的拖拉
University of Saskatchewan 算法工程师
关注
已关注
取消关注
m
@林小白zii:
机器学习面经-评估方法与评价指标
一、简介 在机器学习中,评价方法和评价指标用于衡量模型在给定数据上的性能和预测能力。不同的任务和问题可能会选择不同的评价方法和评价指标。如准确率、召回率、均方误差、AUC等。 二、面经 1、请问模型常用的评估方法有哪些? 2、请问常用的评价指标有哪些? 3、你知道准确率(Accuracy)、精确率(Precision)、召回率(Recall)是怎么算的吗? 4、讲讲F1-score是怎么算的? 5、针对上面提到的一些指标,当训练集中类别不均衡,哪个最不准确? 6、ROC、AUC、PR曲线是什么关系? 7、AUC为什么比其他指标好? 8、AUC高是否一定说明auc高的模型排序能力更强?AUC对均匀正负样本采样不敏感? 9、AUC 值本身的理论上限是1吗? 10、AUC 与线上业务指标的宏观关系? 11、ROC曲线和PR曲线的区别?各自的适用场景? 三、面经参考回答 1、请问模型常用的评估方法有哪些? 参考回答:常用的评估方法包括以下几种: 训练集和测试集划分:将数据集划分为训练集和测试集,通常按照一定比例(如70%训练集,30%测试集)划分数据。训练集用于训练模型,测试集用于评估模型的性能和泛化能力。 交叉验证:K折交叉验证:将数据集划分为K个子集,依次选取其中一个子集作为验证集,剩余K-1个子集作为训练集,进行K次训练和测试,最后将K次评估结果取平均值。K折交叉验证可以更充分地利用数据集,得到更稳定的性能评估结果。留一交叉验证:特殊情况下,K折交叉验证中K等于数据集大小,即每次只留一个样本作为验证集。 自助法(Bootstrap):自助法是一种有放回的采样方法,从原始数据集中随机采样得到一个新的训练集,然后使用剩余样本作为测试集。由于自助法采样可能会产生多个相似的数据集,因此可以得到多个模型性能评估结果,通过取平均值来得到最终评估结果。 留出集法(Hold-out):将数据集划分为训练集、验证集和测试集三部分。训练集用于模型训练,验证集用于调参和模型选择,测试集用于评估模型在未知数据上的泛化能力。 时间序列交叉验证:对于时间序列数据,为了避免训练集包含未来的信息,常用的交叉验证方法有滚动交叉验证和时间序列分割交叉验证。 2、请问常用的评价指标有哪些? 参考回答:当评估机器学习模型的性能时,常用的评价指标根据任务类型可以分为以下几类: 分类任务评价指标: 准确率(Accuracy):分类正确的样本数占总样本数的比例。 精确度(Precision):真阳性样本数占所有被模型预测为正样本的样本数的比例。 召回率(Recall):真阳性样本数占所有真实正样本的样本数的比例。 F1分数(F1 Score):精确度和召回率的调和平均,用于综合考虑模型的准确性和召回性能。 ROC曲线和AUC:ROC曲线绘制了灵敏度(召回率)和特异度之间的关系,AUC用于度量ROC曲线的性能,越接近1表示模型性能越好。 回归任务评价指标: 均方误差(Mean Squared Error,MSE):预测值与真实值之间的平方差的均值。 平均绝对误差(Mean Absolute Error,MAE):预测值与真实值之间的绝对值差的均值。 R2分数(R-squared):模型预测值的方差占总方差的比例,越接近1表示模型拟合效果越好。 聚类任务评价指标: 轮廓系数(Silhouette Coefficient):衡量聚类的紧密性和分离性,越接近1表示聚类效果越好。 互信息(Mutual Information):衡量聚类结果与真实标签之间的信息量,越大表示聚类效果越好。 排序任务评价指标: 平均精确率(Mean Average Precision,MAP):对多个查询的平均精确率的平均值。 多标签分类任务评价指标: Hamming Loss:平均每个样本上错误的标签比例。 Jaccard Similarity Score:真实标签和预测标签的交集与并集之间的比例。 不同的评价指标适用于不同的任务和场景,根据具体的问题选择合适的评价指标是非常重要的。在实际应用中,通常需要综合考虑多个评价指标,并根据业务需求来选择最适合的评价指标。 3、你知道准确率(Accuracy)、精确率(Precision)、召回率(Recall)是怎么算的吗? 参考回答:先说一下含义:TP、FP、FN、TN分别为真阳性、假阳性和假阴性、真阴性。简单来说,就是: 真阳性(TP):标签为正类,预测为正类; 假阳性(FP):标签为负类,预测为正类; 真阴性(TN):标签为负类,预测为负类; 假阴性(FN):标签为正类,预测为负类; 准确率(Accuracy):T
点赞 5
评论 4
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
08-27 22:58
中南大学 Java
互联网大厂汇总:杭州篇
第一类(头部大厂)阿里巴巴(总部)(余杭区/滨江区):多元电商生态腾讯(分部)(西湖区/拱墅区):多元互联网服务字节跳动(分部)(余杭区):短视频及衍生业务百度(分部)(拱墅区):搜索与AI服务京东(分部)(上城区):自营电商+物流美团(分部)(萧山区):本地生活服务网易(总部)(滨江区):游戏及多元业务华为(企业业务分部)(滨江区):云计算装备技术服务第二类(细分领域突出)Deepseek(总部)(拱墅区):深度求索AI菜鸟网络(总部)(余杭区):智慧物流蚂蚁集团(总部)(西湖区):金融科技服务阿里云(总部)(西湖区):云计算服务小红书 (分部) (西湖区):内容电商滴滴(分部)(临平区):...
秋招投递记录
点赞
评论
收藏
分享
08-29 21:38
中南大学 Java
互联网大厂汇总(上海篇)
第一梯队(头部大厂)拼多多(长宁区):拼多多、多多买菜、Temu携程(长宁区):携程旅行、Trip.com、天巡哔哩哔哩(杨浦区):视频社区平台蚂蚁集团(支付宝)(浦东新区):支付宝东方财富(嘉定区):东方财富证券、天天基金美团/大众点评(杨浦区):美团、大众点评饿了么(普陀区):外卖平台小红书(黄浦区):内容电商平台字节跳动(上海研发中心)(闵行区):抖音、教育、游戏业务华为(上海):研发布局阿里巴巴(上海研发中心)(闵行区):盒马、本地生活、阿里国际站腾讯(华东总部)(徐汇区):游戏、人工智能、云计算百度(上海分公司)(浦东):搜索、AI、研发京东(上海分公司)(宝山区):综合电商网易(上...
秋招投递记录
点赞
评论
收藏
分享
07-08 17:56
门头沟学院 C++
快手面试官加我微信?
兄弟们我是28届双非本,本来想着投投简历试试,完全没想着会有什么好结果,简历上写了两个烂大街的项目,结果上午投的快手,下午就有人加我微信说是要内推我,这是不是骗子啊
程序员小白条:
铁骗子啊,牛客看到起码三位数了,笑死了
投递快手等公司10个岗位
点赞
评论
收藏
分享
08-01 11:19
电气工程师
救救孩子吧
找工作找的快崩溃了
我懒羊羊觉得没问题:
写的太学生化了
,像作文一样,很难看出你和岗位的匹配度
点赞
评论
收藏
分享
08-28 16:10
门头沟学院 前端工程师
快手前端一面面经
1. 平时怎么学新技术?2. (项目相关) 无限滚动列表是怎么优化的?3. 从输入 URL 到页面显示出来,都发生了啥?4. 重排和重绘是啥?有啥区别?5. `<script>` 标签为啥要放 `<body>` 最后面?放 `<head>` 里会怎么样?6. 实习和项目里,你最大的收获是啥?团队协作方面有什么经验吗?7. 算法题:实现 LRU,最长公共子序列体验还不错,主要聊了聊聊项目优化。
查看6道真题和解析
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
秋招小红书后端(社区技术)
3897
2
...
得物面试线上面试
2915
3
...
滴滴日常实习一面(8.27)
2642
4
...
记录下截至八月底接近30轮面试下来的秋招进度
2002
5
...
京东零售-平台产品与研发中心后端开发
1657
6
...
快手本地生活一面 已挂
1556
7
...
8.31 拼多多笔试
1461
8
...
怎么改打卡定位
1383
9
...
八月秋招总结
1357
10
...
快手后端一面面经
1207
创作者周榜
更多
正在热议
更多
#
九月了,是考研还是就业?
#
9140次浏览
67人参与
#
视觉/交互/设计招聘信息汇总
#
21031次浏览
619人参与
#
巨人网络求职进展汇总
#
47414次浏览
315人参与
#
一人一道大厂面试题
#
7915次浏览
59人参与
#
面试官是我前女友
#
120772次浏览
770人参与
#
工作后,谈恋爱还和学生时代一样吗?
#
3749次浏览
41人参与
#
荣耀校招
#
518704次浏览
3958人参与
#
工作时那些社死瞬间
#
47977次浏览
301人参与
#
工作丧失热情的瞬间
#
306524次浏览
2391人参与
#
工作两年想退休了
#
150700次浏览
1285人参与
#
打工人的精神状态
#
85665次浏览
1233人参与
#
打工人锐评公司红黑榜
#
162685次浏览
990人参与
#
工作后会跟朋友渐行渐远吗
#
35717次浏览
227人参与
#
反问环节如何提问
#
100803次浏览
1975人参与
#
毕业论文怎么查AI率
#
55417次浏览
1919人参与
#
视觉/交互/设计百问百答
#
55286次浏览
446人参与
#
基恩士求职进展汇总
#
17447次浏览
87人参与
#
你觉得现在还能进互联网吗?
#
23679次浏览
192人参与
#
投递几十家公司,到现在0offer,大家都一样吗
#
259100次浏览
1844人参与
#
秋招想进国企该如何准备
#
87569次浏览
462人参与
#
选择和努力,哪个更重要?
#
92593次浏览
766人参与
#
你投了多少家公司?进展是___
#
47445次浏览
414人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务