首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
拖拉机的拖拉
University of Saskatchewan 算法工程师
关注
已关注
取消关注
m
@林小白zii:
机器学习面经-评估方法与评价指标
一、简介 在机器学习中,评价方法和评价指标用于衡量模型在给定数据上的性能和预测能力。不同的任务和问题可能会选择不同的评价方法和评价指标。如准确率、召回率、均方误差、AUC等。 二、面经 1、请问模型常用的评估方法有哪些? 2、请问常用的评价指标有哪些? 3、你知道准确率(Accuracy)、精确率(Precision)、召回率(Recall)是怎么算的吗? 4、讲讲F1-score是怎么算的? 5、针对上面提到的一些指标,当训练集中类别不均衡,哪个最不准确? 6、ROC、AUC、PR曲线是什么关系? 7、AUC为什么比其他指标好? 8、AUC高是否一定说明auc高的模型排序能力更强?AUC对均匀正负样本采样不敏感? 9、AUC 值本身的理论上限是1吗? 10、AUC 与线上业务指标的宏观关系? 11、ROC曲线和PR曲线的区别?各自的适用场景? 三、面经参考回答 1、请问模型常用的评估方法有哪些? 参考回答:常用的评估方法包括以下几种: 训练集和测试集划分:将数据集划分为训练集和测试集,通常按照一定比例(如70%训练集,30%测试集)划分数据。训练集用于训练模型,测试集用于评估模型的性能和泛化能力。 交叉验证:K折交叉验证:将数据集划分为K个子集,依次选取其中一个子集作为验证集,剩余K-1个子集作为训练集,进行K次训练和测试,最后将K次评估结果取平均值。K折交叉验证可以更充分地利用数据集,得到更稳定的性能评估结果。留一交叉验证:特殊情况下,K折交叉验证中K等于数据集大小,即每次只留一个样本作为验证集。 自助法(Bootstrap):自助法是一种有放回的采样方法,从原始数据集中随机采样得到一个新的训练集,然后使用剩余样本作为测试集。由于自助法采样可能会产生多个相似的数据集,因此可以得到多个模型性能评估结果,通过取平均值来得到最终评估结果。 留出集法(Hold-out):将数据集划分为训练集、验证集和测试集三部分。训练集用于模型训练,验证集用于调参和模型选择,测试集用于评估模型在未知数据上的泛化能力。 时间序列交叉验证:对于时间序列数据,为了避免训练集包含未来的信息,常用的交叉验证方法有滚动交叉验证和时间序列分割交叉验证。 2、请问常用的评价指标有哪些? 参考回答:当评估机器学习模型的性能时,常用的评价指标根据任务类型可以分为以下几类: 分类任务评价指标: 准确率(Accuracy):分类正确的样本数占总样本数的比例。 精确度(Precision):真阳性样本数占所有被模型预测为正样本的样本数的比例。 召回率(Recall):真阳性样本数占所有真实正样本的样本数的比例。 F1分数(F1 Score):精确度和召回率的调和平均,用于综合考虑模型的准确性和召回性能。 ROC曲线和AUC:ROC曲线绘制了灵敏度(召回率)和特异度之间的关系,AUC用于度量ROC曲线的性能,越接近1表示模型性能越好。 回归任务评价指标: 均方误差(Mean Squared Error,MSE):预测值与真实值之间的平方差的均值。 平均绝对误差(Mean Absolute Error,MAE):预测值与真实值之间的绝对值差的均值。 R2分数(R-squared):模型预测值的方差占总方差的比例,越接近1表示模型拟合效果越好。 聚类任务评价指标: 轮廓系数(Silhouette Coefficient):衡量聚类的紧密性和分离性,越接近1表示聚类效果越好。 互信息(Mutual Information):衡量聚类结果与真实标签之间的信息量,越大表示聚类效果越好。 排序任务评价指标: 平均精确率(Mean Average Precision,MAP):对多个查询的平均精确率的平均值。 多标签分类任务评价指标: Hamming Loss:平均每个样本上错误的标签比例。 Jaccard Similarity Score:真实标签和预测标签的交集与并集之间的比例。 不同的评价指标适用于不同的任务和场景,根据具体的问题选择合适的评价指标是非常重要的。在实际应用中,通常需要综合考虑多个评价指标,并根据业务需求来选择最适合的评价指标。 3、你知道准确率(Accuracy)、精确率(Precision)、召回率(Recall)是怎么算的吗? 参考回答:先说一下含义:TP、FP、FN、TN分别为真阳性、假阳性和假阴性、真阴性。简单来说,就是: 真阳性(TP):标签为正类,预测为正类; 假阳性(FP):标签为负类,预测为正类; 真阴性(TN):标签为负类,预测为负类; 假阴性(FN):标签为正类,预测为负类; 准确率(Accuracy):T
点赞 5
评论 4
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
07-16 11:11
杭州电子科技大学 网络安全
这得多少人争啊?
看了下英伟达26校招都有6000多转发了,阅读7.9w,才发了4天,而且实在应届生投递率没那么高的七月……
码农索隆:
没事哒,学历筛选就像机场安检,双非坐过牢,过不去安检
26届校招投递进展
点赞
评论
收藏
分享
07-16 11:29
门头沟学院 Java
7.8科大讯飞 飞星计划 提前批一面
只有一个面试官上来先让我自我介绍然后根据简历上的内容一个一个让我介绍然后问了我一些简历上的项目实现的内容。以及参加比赛的一些比赛的算法实现和效果。然后基于简历进行一些基础的八股发散整体来说问的不怎么深,更多的是让你介绍你简历上面干了什么,怎么干的,怎么评估的。然后让我介绍了一下我要投的论文是怎么实现的。接下来就是问我一些知识储备,现有最新的一些研究我了解多少。然后问我base意向地选择,我说长沙的科大讯飞实验室,然后就是一些基础的反问,科大讯飞研究所是干什么之类的。大概差不多面了30分钟不到40分钟就结束了,然后说让我等hr联系我通知,可能要等一周左右的时间了。刚刚问了hr,已挂
科大讯飞一面307人在聊
点赞
评论
收藏
分享
06-09 20:53
已编辑
门头沟学院 Java
26届求求了🙏🥺
目标中小厂就行, boss200+沟通投出去 6份简历 1面试😫要了简历就没后续了,是不是简历写得不好,求大佬帮我看看简历提点建议🥺
sounfury:
找java工作的话把java内容占比写多点,你鸿蒙写太多了
点赞
评论
收藏
分享
06-18 20:47
广西大学 单片机
这是我的一个学长,进了核电站工作,刚入职年薪12W,这对吗这个简历能拿到这么好的offer?核电行业这么摆的吗?
运营你豪哥:
这应该不是靠简历拿到的机会哈
点赞
评论
收藏
分享
不愿透露姓名的神秘牛友
07-16 18:05
老娘没骂你就不错了
何尝不是一种学历歧视呢
码农索隆:
楼主明确拒绝,并说明拒绝原因了,这hr倒是挺忠心护主的
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
0实习0面试, 速通拼多多
1.4W
2
...
秋招腾讯TEG提前批(三面挂)
1.1W
3
...
玛勒戈壁得秋天到了吗就秋招。恨不得搁产房外面招聘
6643
4
...
我和妈妈讲以后我可能给不了她一个月1500
5209
5
...
后端实习到底该干什么啊
4497
6
...
双非本应届是如何拿到30
3846
7
...
明天五场面试,加油
3464
8
...
怎么准备实习
3175
9
...
王侯将相宁有种乎!
3144
10
...
实习,别太较真
3060
创作者周榜
更多
正在热议
更多
#
26届的你们有几段实习?
#
32539次浏览
387人参与
#
机械人,你拿到几个offer啦
#
38228次浏览
318人参与
#
你被哪些公司秒挂过?
#
24802次浏览
219人参与
#
面试体验感最好的是哪家?
#
222916次浏览
2378人参与
#
如何提高实习转正率?
#
9493次浏览
147人参与
#
双非能在秋招上岸吗?
#
219806次浏览
1163人参与
#
哪些公司校招卡第一学历
#
63365次浏览
240人参与
#
初创公司值得加入吗?
#
25965次浏览
189人参与
#
大疆的机械笔试比去年难吗
#
74768次浏览
636人参与
#
月薪多少能在一线城市生存
#
16168次浏览
226人参与
#
你后悔自己读研吗?
#
13263次浏览
212人参与
#
大家每天通勤多久?
#
48202次浏览
353人参与
#
当下环境,你会继续卷互联网,还是看其他行业机会
#
116140次浏览
804人参与
#
你认为哪些项目算烂大街?
#
13163次浏览
252人参与
#
你以为的实习VS真实的实习
#
17974次浏览
178人参与
#
设计人的面试记录
#
129117次浏览
1355人参与
#
比亚迪求职进展汇总
#
735485次浏览
3095人参与
#
网申一定要掌握的小技巧
#
10101次浏览
66人参与
#
你小时候最想从事什么职业
#
103724次浏览
1787人参与
#
机械校招之路总结
#
92898次浏览
1891人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务