遇到的一个面试题 这种该怎么回答
有这样一个场景,对一篇森林中的树木(有1000万)去实地记录了它很多维度的特征信息,比如说树的高度,树的种类,然后现在已经对于树的高度这个特征有些数据记录出错了,那我想尽可能准确的将这些错误的数据找出来。这个有啥方法吗。然后抽样了200条数据去看了,大约有3%的数据是错误的。
需要给出自己的思路,并能自圆其说
需要给出自己的思路,并能自圆其说
全部评论
先用已有数据训一个预测树高度的模型出来,然后按预测值和记录值之差降序排序,取前3%认为是错误数据,可能不是最优,但应该可行
送花
回复
分享
不知道,我选择束手就擒
送花
回复
分享
网易互娱
官网直投
相关推荐
投递华为等公司9个岗位 >
点赞 评论 收藏
转发