分类算法（KNN算法）

KNN（k-Nearest Neighbors）算法是一种常见的分类和回归算法。它的核心思想是通过计算待分类对象和训练集中已分类对象之间的距离来确定待分类对象所属的类别。其中，k表示选取距离待分类对象最近的k个训练样本，将这些样本的类别作为待分类对象的类别进行判定。

在分类问题中，KNN算法的基本步骤如下：

1.计算训练集中每个样本和待分类对象之间的距离。
2.选取距离待分类对象最近的k个训练样本。
3.统计这k个样本中出现最多的类别。
4.将待分类对象归为出现最多的类别。

在回归问题中，KNN算法的基本步骤如下：

1.计算训练集中每个样本和待预测对象之间的距离。
2.选取距离待预测对象最近的k个训练样本。
3.求这k个样本的平均值。
4.将待预测对象的预测值设为这个平均值。

需要注意的是，KNN算法中的距离度量方式会影响算法的分类或回归结果，一般使用欧氏距离、曼哈顿距离等度量方式。同时，在选择k值时，需要通过交叉验证等方法来确定最优的k值。

代码实现：


import numpy as np
 
class KNN:
    def __init__(self, k=3):
        self.k = k
        
    def euclidean_distance(self, x1, x2):
        return np.sqrt(np.sum((x1 - x2)**2))
    
    def fit(self, X, y):
        self.X_train = X
        self.y_train = y
        
    def predict(self, X):
        y_pred = []
        for x in X:
            distances = [self.euclidean_distance(x, x_train) for x_train in self.X_train]
            k_indices = np.argsort(distances)[:self.k]
            k_nearest_labels = [self.y_train[i] for i in k_indices]
            most_common = Counter(k_nearest_labels).most_common(1)
            y_pred.append(most_common[0][0])
        return np.array(y_pred)

相关阅读:
06【NIO核心组件之Selector】
「嵌入式」基于国产全志科技T3——从开发板到PLC测试案例
L50.linux命令每日一练 -- 第八章 Linux磁盘与文件系统管理命令 -- tune2fs和parted
软件测试13年从业经验的前辈，总结的5条测试就业建议....
Java_类和对象
旭日x3派与STM32串口通信
No144.精选前端面试题，享受每天的挑战和学习
人工智能——图像处理和Python深度学习的全教程（建议收藏）
在线免费无时长限制录屏工具 - 录猎在线版
bootstrap-datepicker实现只能选择每一年的某一个月份

原文地址：https://blog.csdn.net/qq_71356343/article/details/133032916