KNN算法的整理
对KNN算法的简单理解:
- 首先需要准备好一些已经有标注的数据,这里需要注意数据的分类样本平衡问题。
- 接着对需要进行分类预测的数据与1中每一个标注好的数据进行距离计算。这里需要注意数据的标准化与归一化处理,因为数据的规模不同,同时需要注意距离计算公式的选取,有欧式距离,曼哈顿距离(针对文本数据的处理)。
- 根据人为设定的K值,选取距离最近的K个点,根据投票方法进行分类选取,这里K值不能过大,也不能过小。
- 重复上述训练流程。
适用场景:
可以在分类问题,推荐系统上使用,原理简单,实现容易,计算量大。