• sklearn【MAPE】平均相对误差介绍,以及案例学习!


    一、MAPE 介绍

    在预测任务中,评估模型的预测性能至关重要。除了常见的均方误差(MSE)和决定系数(R²)等指标外,平均百分比误差(MAPE,Mean Absolute Percentage Error)也是一个常用的评估指标。MAPE衡量了模型预测值与实际值之间的百分比误差的平均值,有助于我们了解预测的相对准确性。

    在Python的机器学习库sklearn中,虽然没有直接提供计算MAPE的函数,但我们可以自己编写一个简单的函数来实现这一功能。下面我们将通过一个示例来展示如何使用sklearn进行预测,并计算MAPE来评估模型的性能。

    二、案例学习

    首先,我们需要导入必要的库并加载数据集。在这个例子中,我们将使用一个简单的线性回归问题来演示计算MAPE的过程。

    from sklearn.model_selection import train_test_split
    from sklearn.metrics import mean_squared_error
    from sklearn.linear_model import LinearRegression
    from sklearn.datasets import fetch_california_housing
    from sklearn.metrics import mean_absolute_error 
    from sklearn.metrics import r2_score  
    import pandas as pd
    import numpy as np
    
    housing = fetch_california_housing()
    
    # 加载房价数据集
    X = housing.data
    y = housing.target
    
    # 划分训练集和测试集
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17

    接着,我们创建一个线性回归模型,并使用训练数据进行训练。

    # 创建线性回归模型
    model = LinearRegression()
    
    # 使用训练数据进行训练
    model.fit(X_train, y_train)
    
    • 1
    • 2
    • 3
    • 4
    • 5

    训练完成后,我们使用模型对测试集进行预测。

    # 对测试集进行预测
    y_pred = model.predict(X_test)
    
    • 1
    • 2

    现在,我们可以编写一个函数来计算MAPE。MAPE的计算公式是:

    M A P E = 1 n ∑ i = 1 n ∣ y i − y ^ i y i ∣ ∗ 100 % MAPE = \frac{1}{n} \sum_{i=1}^{n} \left|\frac{y_i - \hat{y}_i}{y_i}\right| * 100\% MAPE=n1i=1n yiyiy^i 100%

    其中 n n n 是数据点的数量, y i y_i yi 是第 i i i 个数据点的实际值, y ^ i \hat{y}_i y^i 是模型对第 i i i 个数据点的预测值。

    def calculate_mape(y_true, y_pred):
        y_true, y_pred = np.array(y_true), np.array(y_pred)
        mask = y_true != 0  # 避免除以零
        return np.mean(np.abs((y_true[mask] - y_pred[mask]) / y_true[mask])) * 100
    
    # 计算MAPE
    mape = calculate_mape(y_test, y_pred)
    print(f'Mean Absolute Percentage Error (MAPE): {mape:.2f}%')
    
    # Mean Absolute Percentage Error (MAPE): 31.95%
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10

    在上面的代码中,我们首先定义了一个calculate_mape函数,它接受实际值和预测值作为输入,并返回MAPE的值。在计算MAPE时,我们添加了一个掩码(mask)来排除实际值为零的情况,以避免除以零的错误。最后,我们调用这个函数来计算测试集上的MAPE,并打印结果。

    三、总结

    MAPE的值越小,说明模型的预测性能越好,预测值与实际值之间的百分比误差越小。然而,需要注意的是,MAPE对异常值比较敏感,因为当实际值很小时,即使预测值的绝对误差很小,也会导致MAPE的值很大。因此,在使用MAPE作为评估指标时,需要结合其他指标和实际情况进行综合考量。

  • 相关阅读:
    [leetcode 哈希表] 2034. 股票价格波动 M
    IP协议从0到1
    单位互联网网络时断时续的问题
    林沛满-TCP 是如何避免被发送方分片的?
    python中hasattr()函数用法详解
    R语言使用plot函数可视化数据散点图,使用lines函数在可视化图像中添加线条、使用lwd参数自定义线条的粗细
    分享:中兴 远航 30 pro root 解锁BL magisk ZTE 7532N 8040N 9041N 刷机 刷面具原厂刷机包 root方法下载
    RK3588平台开发系列讲解(项目篇)视频监控之RTMP推流
    Linux怎么查看group
    睿趣科技:新手无货源怎么开抖音小店
  • 原文地址:https://blog.csdn.net/weixin_42060598/article/details/138060157