KNN面试题


文档摘要

KNN面试题 1.简述一下KNN算法的原理 KNN算法利用训练数据集对特征向量空间进行划分。KNN算法的核心思想是在一个含未知样本的空间,可以根据样本最近的k个样本的数据类型来确定未知样本的数据类型。 该算法涉及的3个主要因素是:k值选择,距离度量,分类决策。 如何理解kNN中的k的取值? 在应用中,k值一般取比较小的值,并采用交叉验证法进行调优。 在kNN的样本搜索中,如何进行高效的匹配查找? 线性扫描(数据多时,效率低) 构建数据索引——Clipping和Overlapping两种。前者划分的空间没有重叠,如k-d树;后者划分的空间相互交叠,如R树。(对R树了解很少,可以之后再去了解) KNN算法有哪些优点和缺点? 优点: ​ 算法思想较简单,既可以做分类也可以做回归;


发布者: 作者: 转发
评论区 (0)
U