• 数据分析:密度图


    在这里插入图片描述
    目前拥有的数据如图,三列分别对应瑕疵种类,对应的置信
    度,x方向坐标。
    现在想要做的事是观看瑕疵种类和置信度之间的关系。
    要显示数据分布的集中程度,可以使用以下几种常见的图形来观察:

    1、箱线图(Box Plot):箱线图展示了数据的中位数、上下四分位数、最小值和最大值等统计指标,并通过箱体的长度和须的长度来表示数据的分布情况。箱线图能够展示数据的异常值和偏态程度,从而提供数据集中程度的信息。
    2、直方图(Histogram):直方图用柱状图的形式表示数据在不同区间内的频数或频率。直方图能够给出数据的分布情况,高度表示数据出现的频次,整个图形可以展示数据的集中和离散程度。
    3、密度图(Density Plot):密度图是通过平滑直方图来估计数据的概率密度函数,并以连续曲线的形式展示数据分布的集中程度。密度图可以更直观地看出数据的峰值和分布的波动情况。
    4、散点图(Scatter Plot):散点图用点的位置来表示两个变量之间的关系。通过观察散点图中点的分布情况,可以大致判断数据的集中程度和相关性。

    下面我使用的是密度图,因为密度的连续曲线更加容易看出数据分布的集中程度。

    import pandas as pd
    import matplotlib.pyplot as plt
    
    # 读取没有列标签的CSV文件
    df = pd.read_csv('camera0.csv', header=None)
    # 使用整数索引访问列数据
    confidence_by_type = df.groupby(0)[1]
    # 绘制置信度密度分布图
    plt.figure(figsize=(10, 6))
    confidence_by_type.plot(kind='density', linewidth=2, alpha=0.5)
    plt.xlabel('Confidence')
    plt.ylabel('Density')
    plt.title('Confidence Density Distribution by Type')
    plt.legend(confidence_by_type.groups.keys())
    
    # 显示图形
    plt.show()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17

    请添加图片描述
    如上图所示,我的横坐标是第二列置信度,纵坐标是密度,四条线分别对应第一列的四种类型。
    这样就可以看懂我的数据的分布集中情况。

  • 相关阅读:
    C语言之内存函数篇(3)
    Springboot整合RocketMQ之生产者
    Qt扩展-QCustomPlot 简介及配置
    【物联网】ROM、RAM和FLASH的区别
    【数据结构】二叉树
    全志T3/A40i工业核心板,4核Cortex-A7@1.2GHz,国产化率达100%
    spring boot 集成 RedisSearch 和 RedisJSON
    揭秘弹幕游戏制作
    SSM(Spring SpringMVC MyBatis)配置文件信息,完成学生管理页面(前后端全部代码)
    以人为本是AI大模型的最终落脚点——读《大模型时代:ChatGPT开启通用人工智能浪潮》
  • 原文地址:https://blog.csdn.net/CSDN_Yangk/article/details/133920450