k-近邻算法

k-近邻算法


优点:精度高,对异常值不敏感、无数据输入假定

缺点:计算复杂度高、空间复杂度高

适用范围:数值型和标量型


k近邻算法的一般流程

  1. 收集数据:可以使用任何方法
  2. 准备数据:距离计算所需要的数值,最好是结构化的数据格式
  3. 分析数据:any
  4. 训练算法:kNN无需预训练
  5. 测试算法:计算错误率
  6. 使用算法:首先需要输入样本数据和结构化的输出结果,然后运行k近邻算法判定输入数据分别属于哪个分类,最后应用对计算出的分类执行后续的处理

继续阅读全文 »

使用kNN算法的手写识别系统

使用kNN算法的手写识别系统

1
2
3
4
5
6
1. 收集数据:提供文本文件
2. 准备数据:编写函数classify0(),将图像格式转换为分类器使用的list格式
3. 分析数据:在Python命令提示符中检察数据,确保它符合要求
4. 训练数据:此步骤不适用kNN
5. 测试算法:编写函数使用提供的部分数据集作为测试样本,另一部分作为验证样本
6. 使用算法:

继续阅读全文 »