• Pandas常见筛选数据的五种方法其一逻辑筛选。看见必懂,懂者必会,会者必加分


            前言:Pandas的数据操作中,最基本的就是操作的筛选了,但是对新学员来说的这又是一个难点,因为方法比较多,不容易记。在此总结一下pandas中的一些常用的数据筛选操作。 

         逻辑筛选数据:切片([ ]),loc,iloc,这三种都是支持逻辑表达式的,选其中一种比较常用的,逻辑运算符 与或非(& | ~)any,all

    展示使用的数据结构:

    1. import pandas as pd
    2. PATH = '/tmp/MSD0921.xlsx'
    3. dataframe = pd.read_excel(PATH,engine='openpyxl', nrows=50)
    SD1SD2SD3SD4SD5SD6SD7SD8
    047212676
    155555555
    217111666
    366322222
    444444444
    ...........................
    25815211776
    25917742171
    26013545556
    26113555532
    26217777777

    1、筛选出某一列大于某一个数的所有数据,例如:SD1>=7

    1. """筛选出SD1列中大于等于7的数据"""
    2. dataframe[dataframe['SD1'] >= 7]

    2、筛选出某一列大于或者小于另一列的输有数据,例如:SD1 < SD2

    1. """筛选出SD1列小于SD2列所有数据"""
    2. dataframe.loc[dataframe['SD1'] < dataframe['SD2']]

    3、筛选出某些列的值大于或小于某些值的所有数据,例如:SD1 >6并且SD1<3,使用 &

    1. """筛选出SD1大于6,并且SD2小于3的所有数据"""
    2. dataframe.loc[(dataframe['SD1'] > 6) & ( dataframe['SD2'] < 3)]

     4、筛选出某些列的值大于或小于某些值的所有数据,例如:SD1 >6或者SD1<3,使用 |

    1. """筛选出SD1小于6,或者SD2小于3的所有数据,并集"""
    2. dataframe.loc[(dataframe['SD1'] > 6) | ( dataframe['SD2'] < 3)]

    注意:需要注意的是在进行或(|)、与(&)、非(~)运算时,各个独立逻辑表达式需要用括号括起来

    除了上边的与或之外,pandas还提供了 all,any,对逻辑计算后的布尔值在进行判断,所有都为True,all才返回True,反之亦然,any满足其中之一即可。all,any可传参数axis,1为行方向,0为列方向。利用此方法可对整体数据逻辑判断。

    5、筛选出某些列的值同时大于或同时小于某值的所有数据,例如SD1>6 SD2>6

    1. """筛选出SD1, SD2同时大于6的所有数据"""
    2. dataframe[(dataframe.loc[:,['SD1', 'SD2']] > 6).all(1)]

     

    逻辑解读: dataframe.loc[:,['SD1', 'SD2']] > 6,这个逻辑计算的是SD1,SD2同时大于6返回的布尔值,逗号前的冒号表示所有行,返回的是False或者True的一个dataframe数据,整体在进行.all(1),操作返回的是SD1,SD2都为True的为True,否者为False所有行数。在使用切片 [ ],进行取数据。

    下篇文章会总结pandas的其他的一些常用方法,函数筛选

    pandas结合匿名函数lambda、比较函数eq(),le(),lt(),ge(),gt()

    dataframe.query()

    dataframe.filter()

    dataframe.select_dtypes()

  • 相关阅读:
    Windows Server 2019 - 辅助DNS
    Java设计模式之备忘录模式
    【软考 系统架构设计师】软件架构设计④ 基于架构的软件开发方法
    redis的启动方式
    IP 地址查询,快速查询自己的 IP 地址
    ESP32-S2 st7789 SPI TFT彩屏240X320
    CAP 7.1 版本发布通告
    大一,小小练习题--含答案
    Pytorch的grid_sample是如何实现对grid求导的?(源码解读)
    CNCC2023
  • 原文地址:https://blog.csdn.net/qq_42336581/article/details/128099619