• python之value_counts()介绍


    目录


    value_counts() 是一个用于统计某列中各个值的出现次数的函数。当配合参数 bins 使用时,它可以将数据分成指定的区间,然后统计每个区间内值的出现次数。

    举个例子,假设我们有一个包含身高数据的DataFrame:

    |   姓名  | 身高(cm) |
    |--------|---------|
    |   小明 |   175   |
    |   小红 |   160   |
    |   小刚 |   180   |
    |   小美 |   162   |
    |   小强 |   175   |
    |   ...  |   ...   |
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    我们可以使用 value_counts() 统计各个身高出现的次数:

    height_counts = df['身高(cm)'].value_counts()
    
    • 1

    结果可能如下:

    180    3
    175    2
    162    1
    160    1
    Name: 身高(cm), dtype: int64
    
    • 1
    • 2
    • 3
    • 4
    • 5

    这表示在数据中,身高为180cm的出现了3次,175cm出现了2次,162cm出现了1次,160cm出现了1次。

    如果我们想将身高分成几个区间并统计每个区间内的人数,可以使用 bins 参数:

    height_counts_bins = df['身高(cm)'].value_counts(bins=[150, 160, 170, 180, 190])
    
    • 1

    这将把身高分成以下区间:(150, 160], (160, 170], (170, 180], (180, 190],然后统计每个区间内的人数。

    输出

    假设在给定的数据中:

    • 有3个人的身高在区间 (150, 160] 内,
    • 有2个人的身高在区间 (160, 170] 内,
    • 有1个人的身高在区间 (170, 180] 内,
    • 没有人的身高在区间 (180, 190] 内,

    那么 height_counts_bins 的输出可能会是类似于以下的结果:

    (150.0, 160.0]    3
    (160.0, 170.0]    2
    (170.0, 180.0]    1
    (180.0, 190.0]    0
    Name: 身高(cm), dtype: int64
    
    • 1
    • 2
    • 3
    • 4
    • 5

    希望这个例子能帮到您理解 value_counts()bins 的用法。

  • 相关阅读:
    极智AI | 谈谈昇腾 CANN AIPP
    布隆过滤器
    迁移vm到pve
    深入理解隔离性(MVCC,快照,undo log,Read View)
    如何实现快速的批量抓取拼多多商品数据?(包含价格销量详情等)
    RDD——Action算子
    Web Audio API 第3章 音量和响度
    CornerNet-Lite训练自己的数据集
    4.3 数据库迁移
    引入『客户端缓存』,Redis6算是把缓存玩明白了…
  • 原文地址:https://blog.csdn.net/weixin_46713695/article/details/133842730