遇到的一个面试题 这种该怎么回答

有这样一个场景,对一篇森林中的树木(有1000万)去实地记录了它很多维度的特征信息,比如说树的高度,树的种类,然后现在已经对于树的高度这个特征有些数据记录出错了,那我想尽可能准确的将这些错误的数据找出来。这个有啥方法吗。然后抽样了200条数据去看了,大约有3%的数据是错误的。

需要给出自己的思路,并能自圆其说
全部评论
先用已有数据训一个预测树高度的模型出来,然后按预测值和记录值之差降序排序,取前3%认为是错误数据,可能不是最优,但应该可行
点赞
送花
回复
分享
发布于 2023-04-01 14:14 浙江
不知道,我选择束手就擒
点赞
送花
回复
分享
发布于 2023-04-02 11:45 内蒙古
网易互娱
校招火热招聘中
官网直投

相关推荐

点赞 收藏 评论
分享
牛客网
牛客企业服务