2018-01-09

机器学习固本强基系列之正则化

2017-12-28

机器学习

k-近邻算法

优点：精度高，对异常值不敏感、无数据输入假定

缺点：计算复杂度高、空间复杂度高

适用范围：数值型和标量型

k近邻算法的一般流程

收集数据：可以使用任何方法
准备数据：距离计算所需要的数值，最好是结构化的数据格式
分析数据：any
训练算法：kNN无需预训练
测试算法：计算错误率
使用算法：首先需要输入样本数据和结构化的输出结果，然后运行k近邻算法判定输入数据分别属于哪个分类，最后应用对计算出的分类执行后续的处理

继续阅读全文 »

2017-12-28

机器学习

使用kNN算法的手写识别系统

1. 收集数据：提供文本文件
2. 准备数据：编写函数classify0（），将图像格式转换为分类器使用的list格式
3. 分析数据：在Python命令提示符中检察数据，确保它符合要求
4. 训练数据：此步骤不适用kNN
5. 测试算法：编写函数使用提供的部分数据集作为测试样本，另一部分作为验证样本
6. 使用算法：

继续阅读全文 »

2017-12-20