• pandas read_excel 参数及使用


    pandas.read_excel(io, sheet_name…)

    参数说明

    1. io: 文件路径
    2. sheet_name 列名,默认为0, 可以是数字/列名/list(数字、列名)
    3. header 标题行,默认第一行,可以是数字/list
    4. names 补充列名, names元素的个数必须和dataframe的列数一致,name=[0,1,2…]: 0,1,2将作为列名
    5. index_col 指定行索引, 默认None, 可以是数字/list
    6. usecols: 指定读取列,
      usecols=[1,2,3] # 读取2-4列
      usecols=None, #读取所有列
    7. squeeze: 如果源数据只有一列, squeeze=False为DataFrame,squeeze=True时为Series
    8. converters={
      ‘收入’ lambda x: x/100 # 收入除以100
      }
    9. skiprows: 省略指定行数据,第一行开始
    10. skipfooter: 省略指定行数据,最后一行开始
    11. dtype: dtype={
      ‘grade’: np.float32
      } # 读取为类型数据

    使用

    创建一个Excel文件
    fakeExcel.xlsx

    import pandas as pd
    import numpy as np
    
    • 1
    • 2
    # 指定索引列
    pd.read_excel('./fakeExcel.xlsx', index_col=0) # 第0列作为标题
    
    • 1
    • 2

    在这里插入图片描述

    pd.read_excel('fakeExcel.xlsx',  header=0) # 指定表头行
    
    • 1

    在这里插入图片描述

    # 指定读取格式转换
    # 适合数据处理精度要求比较高或者速度要求比较快的情况
    pd.read_excel('fakeExcel.xlsx', dtype={
      'grade': np.float32
    }) # 指定表头列
    
    • 1
    • 2
    • 3
    • 4
    • 5

    在这里插入图片描述

    # 自定义缺失值, 如年龄为负数时,清空,显示NAN
    pd.read_excel('fakeExcel.xlsx', na_values={
      'title': 'aa'
    })
    
    • 1
    • 2
    • 3
    • 4

    在这里插入图片描述

    # 处理注释行
    
    pd.read_excel('fakeExcel.xlsx', sheet_name=1, comment='#')
    
    • 1
    • 2
    • 3

    在这里插入图片描述

    # 列操作, 列减少2
    data['grade'] = data['grade'] - 2
    data
    
    • 1
    • 2
    • 3

    在这里插入图片描述

    # 删除列:
    # 改变内存数据
    # 建议使用不改变内存的函数, 通过赋值修改原数据
    if True:
      del data["a"]
    # 不改变内存数据(返回新数据)
    else:
      data = data.drop('a', axis=1)
    data
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9

    在这里插入图片描述

    # 重命令列
    data.rename(columns={ 'grade': 'grade2' })
    # 或者
    data.columns = ['b', 'title', 'grade2']
    
    • 1
    • 2
    • 3
    • 4

    在这里插入图片描述

    # 保留指定的列
    data[['title',	'grade']]
    
    • 1
    • 2

    在这里插入图片描述

    # 过滤数据
    data[data['grade'] > 60]
    
    • 1
    • 2

    在这里插入图片描述

    data[data['title'] == 'bb']
    
    • 1

    在这里插入图片描述

    # 值排序
    data.sort_values('grade', ascending = True)
    
    • 1
    • 2

    在这里插入图片描述

    # names 参数的作用, 相当于rename
    pd.read_excel('fakeExcel.xlsx', header=0, names=[0,1,2]) 
    
    • 1
    • 2

    在这里插入图片描述

    # 删除指定字符串的行
    
    data.drop(data.index[(newData['line3'] == '--')], inplace=True) # inplace是否直接替换原数据
    
    • 1
    • 2
    • 3
  • 相关阅读:
    GO语言最常用的语法
    Java JDK 环境变量配置教程
    【PTA-训练day4】L2-015 互评成绩 + L1-011 A-B
    select() 的 timeout 陷阱
    Uni-app中实现数据选择并回传给上个页面的方法
    “世亚智博会,世亚软博会”双展联动,3月上海,4月杭州,6月北京
    【毕业设计】python+opencv+机器学习车牌识别
    Go语言入门心法(十三): 反射认知升维
    人工智能监考 VS 传统方式监考,你更喜欢哪一种?
    【HCIP】RSTP
  • 原文地址:https://blog.csdn.net/change_fate/article/details/126012860