极速系列03—python进行数据合并（concat/merge）

两个表中的数据，要根据关键字段，进行合并。
在Excel中可以使用vlookup的方式，在python中可以使用concat或者是merge的方法。

1、pd.concat

pd.concat 函数

拼接的对象可以是series，还可以是dataframe
拼接对象的个数不受限
axis 控制拼接方向（既支持上下拼接，也支持左右拼接）
左右拼接 axis=1，左右拼接的依据是行索引；
上下拼接 axis =0 ,拼接依据是列名，默认是上下拼接
join 指定拼接方法
join=“inner” 内联,表示保留两个表共有的行索引
join=“outer” 外联,表示保留两个表所有的行索引，默认外联

#导入需要的包
import pandas as pd
1
2

#创建需要的数据集：产品表
dict1={"产品编号":["CP13","CP14","CP15","CP16","CP17"],"产品名称":["产品A003","产品A004","产品A005","产品A006","产品A007"]}
df1 = pd.DataFrame(dict1)
df1
1
2
3
4

在这里插入图片描述

#创建需要的数据集：详情表
dict2={"订单编号":["20220913","20220914","20220915","20220915"],
       "产品编号":["CP13","CP14","CP15","CP16"],
       "产品销量":[13,24,45,32],
       "负责人":["张三","赵六","李八","李八"]}
df2 = pd.DataFrame(dict2)
df2
1
2
3
4
5
6
7

在这里插入图片描述

pd.concat([df1,df2])#默认上下拼接，拼接依据是列名；默认外联，保留两个表都有的索引信息
1

在这里插入图片描述

pd.concat([df1,df2],ignore_index=True)#重置行索引
1

在这里插入图片描述

#左右拼接的依据是行索引  axis默认是0上下拼接，1为左右拼接；默认外联（join = 'outer'）
pd.concat([df1,df2],axis=1) 
1
2

在这里插入图片描述

#join指定了拼接方法，内联，表示保留两个表共有的行索引
pd.concat([df1,df2],axis=1,join="inner") 
1
2

在这里插入图片描述

2、 df.append

和concat上下拼接的结果类似

df1.append(df2) 
1

在这里插入图片描述

3、 pd.merge()

拼接对象是dataframe或者series，左表必须是dataframe
拼接的数量只能是两个
拼接方向只能左右拼

#left_on写左表进行拼接的字段，right_on写右表要进行拼接的字段
pd.merge(df1,df2,left_on="产品编号",right_on="产品编号",how = 'right')
1
2

#若两表拼接字段名完全一样，可写一个on
pd.merge(df1,df2,on="产品编号")
1
2

在这里插入图片描述

4、 df.join

和concat左右拼接的结果类似

df1.join(df2, lsuffix='_b', rsuffix='_a')
1

在这里插入图片描述

总结

在这里插入图片描述

相关阅读:
ROS学习笔记(六)---服务通信机制
rk3288-android8.1-OV13850
kafka和flink的入门到精通 1 大数据时代，分布式数据存储，数仓
板凳---------unix网络编程卷1：第二章传输层：TCP、UDP 和 SCTP
Redeis缓存查询基于元注解与AOP结合使用——不过时的优雅
Git 之已有项目创建 git 仓库
Springboot3 + knife4j(springdoc) 框架整合
ros rviz显示orb-slam2保存的轨迹
【计算机视觉】SimSiam 讲解
Kubernetes Helm的应用

原文地址：https://blog.csdn.net/one_bird_/article/details/126805418