K-means的特征维数问题~

昨天面试,因为项目中有用k-means,所以被问到。

面试官问我们数据的特征是多少维,我说20维左右,然后他说先让我去研究一下k-means的使用场景…

所以想请教各位大佬,这个维度的特征是太高了还是太低了,这个问题之前还真没想过,请哪位给位大佬给小菜鸡解释一下呗


#机器学习#
全部评论
维度太高会有curse of dimensionality?
点赞 回复
分享
发布于 2019-08-29 22:11
K-means不适合维度太高。用距离度量的算法,维度越高数据点之间的距离值越倾向接近,弱化了最近点的概念。
1 回复
分享
发布于 2019-08-29 22:47
小红书
校招火热招聘中
官网直投
太多了
点赞 回复
分享
发布于 2019-08-29 22:13
真的假的,kmeans20维有问题吗....kmeans拿来做vq压缩图像特征少说也得有几十维吧?
点赞 回复
分享
发布于 2019-08-30 02:48
对于适当的维度(例如100维),使用k-means的训练速度比其他算法快那么多,那么我情愿花点力气去提供更多的样本给它。但对于很高维的数据,采用其他算法例如sparse coding会比k-means性能要好,甚至速度也要更快。 知乎原话。咋办??
点赞 回复
分享
发布于 2019-08-30 12:04

相关推荐

点赞 11 评论
分享
牛客网
牛客企业服务