遇到的一个面试题 这种该怎么回答
有这样一个场景,对一篇森林中的树木(有1000万)去实地记录了它很多维度的特征信息,比如说树的高度,树的种类,然后现在已经对于树的高度这个特征有些数据记录出错了,那我想尽可能准确的将这些错误的数据找出来。这个有啥方法吗。然后抽样了200条数据去看了,大约有3%的数据是错误的。
需要给出自己的思路,并能自圆其说
需要给出自己的思路,并能自圆其说
全部评论
不知道,我选择束手就擒
先用已有数据训一个预测树高度的模型出来,然后按预测值和记录值之差降序排序,取前3%认为是错误数据,可能不是最优,但应该可行
相关推荐
点赞 评论 收藏
分享
烤点老白薯:接了吧,然后再面别的
点赞 评论 收藏
分享
10-31 13:04
南华大学 Java
嵌入式的小白:很多面试,面试前不会去打扰cto的,但一般cto不会在这些小事上刷人,只能说这个cto比较操心,啥重要不重要,紧急不紧急的,估计都会过问,平淡看待吧 点赞 评论 收藏
分享
查看6道真题和解析