资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

pandas实现数据concat拼接

创作时间:

作者:

@小白创作中心

pandas实现数据concat拼接

引用

CSDN

https://blog.csdn.net/panghuangang/article/details/146065293

pandas中的concat函数是一个非常强大的数据拼接工具，广泛应用于批量拼接相同格式的Excel文件、给DataFrame添加行或列等场景。本文将详细介绍concat函数的语法、参数，并通过多个具体示例展示其使用方法。

pandas实现数据concat拼接

使用场景：批量拼接相同格式的excel、给DataFrame添加行、给DataFrame添加列等。

语法

使用某种方式合并方式（inner/outer）、沿着某个轴向（axis=0/1）、把多个Pandas对象（DataFrame/Seires）拼接成一个。

pandas.concat(objs, *, axis=0, join='outer', ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, sort=False, copy=None)

返回值：

当沿索引（axis=0）连接所有 Series 时，返回一个 Series。
当 objs 中包含至少一个 DataFrame 时，返回一个 DataFrame。
当沿列（axis=1）连接时，返回一个 DataFrame。

参数说明：

objs：需要连接的对象（如 DataFrame 或 Series）的列表或字典。
axis：指定连接轴。{0/’index’, 1/’columns’}, 默认0。axis=0：沿行方向连接（垂直堆叠）。axis=1：沿列方向连接（水平堆叠）。
join：指定连接方式，{‘inner’, ‘outer’}，默认为 ‘outer’。join=‘outer’：外连接，保留所有索引（默认）。join=‘inner’：内连接，只保留共有索引。
ignore_index：是否忽略原始索引并生成新的整数索引。bool，默认为 False。ignore_index=True：忽略原始索引，生成新的整数索引。ignore_index=False：保留原始索引。
keys：为连接后的对象添加外层索引（多层索引）。list 或 tuple。
levels：与 keys 参数配合使用，指定多层索引的具体层级。list 或 tuple。
names：为多层索引的层级命名。list 或 tuple。
verify_integrity：是否检查新索引是否有重复。bool，默认为 False。
sort：是否对非连接轴进行排序。bool，默认为 False。
copy：是否复制数据。bool，默认为 True。

示例：使用pandas.concat合并数据

第1个DataFrame：

import pandas as pd
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'], 'B': ['B0', 'B1', 'B2', 'B3'], 'C': ['C0', 'C1', 'C2', 'C3'], 'D': ['D0', 'D1', 'D2', 'D3']})

查看数据：

第2个DataFrame：

df2 = pd.DataFrame({'B': ['B4', 'B5', 'B6', 'B7'], 'C': ['C4', 'C5', 'C6', 'C7'], 'D': ['D4', 'D5', 'D6', 'D7'], 'E': ['E4', 'E5', 'E6', 'E7']})

查看结果：

默认的concat：参数axis=0，join=‘outer’，ignore_index=False

pd.concat([df1, df2])

合并后的结果：

使用ignore_index=True参数可以忽略原来的索引

pd.concat([df1, df2], ignore_index=True)

合并后的数据：

使用join='inner’参数过滤掉不匹配的列

pd.concat([df1, df2], ignore_index=True, join='inner')

合并后的数据：

使用axis=1相当于添加新列

添加一列Series

DataFrame：

再构造一个Series：

s1 = pd.Series(list(range(10, 14)), name='F')

按列合并：

pd.concat([df1, s1], axis=1)

合并后的结果：

添加多列Series

DataFrame：

第1个Series：

第2个Series：

s2 = df1.apply(lambda x : x['D'] + '_G', axis=1)
s2.name = 'G'

合并1个DataFrame和2个Series：

pd.concat([df1, s1, s2], axis=1)

合并后的结果：

concat的要合并的对象参数可以只包含Series列表

合并两个Series：

pd.concat([s1, s2], axis=1)

合并后的结果：

concat的要合并的对象参数DataFrame和Series顺序可以混合

要合并的DataFrame:

要合并的Series:

合并数据：

pd.concat([s1, df1, s2], axis=1)

合并后的结果：

一行一行给DataFrame添加数据

先生成一个空的DataFrame：

df = pd.DataFrame(columns=['S'])

利用concat可以接受对象列表的特点，进行拼接：

pd.concat([pd.DataFrame([i], columns=['S']) for i in range(6)], ignore_index=True)

拼接后的结果：

热门推荐

应用AI在工作上？工作不安全感与心理健康的相互影响

百癣夏塔热片治疗湿疹效果如何

渗透测试工具：加强您的网络安全

重塑思维：12种方法唤醒大脑潜能

头皮酵母菌感染怎么办？原因、症状与治疗全解析

每天了解一个繁华城市—萨尔瓦多，巴西第三大城市

GPIO的八种模式及工作原理(电路原理和三极管)

启蒙运动：从黑暗到光明的智慧之旅

2025年比乙巳蛇年少19天

水产养殖中如何确保水体氧气充足

劳务侵权案件的举证要点、证据收集与法律适用

法定代表人需要承担哪些法律责任附法定代表人法律责任详细清单

百会穴的位置和作用

尼安德特人是如何消失的？《科学》有新发现

深入解析：免疫系统的基因组变异如何影响人体健康与疾病发展

流动相中产生气泡所引起的问题及解决方案

不用考研就能读985/211硕士？中外合办硕士的一些真相！

韩国新潜艇服役引关注　具备准战略打击能力

世界四大军校——美国西点军校

英伟达财报超预期，反衬出A股科技龙头短板

清洗空调是请师傅还是自己来？自己动手需注意这三点

北大校友参与Cell论文：让空间站“脏一些”，可以改善宇航员健康

虚拟企业过程集成关键问题研究

虚拟电厂：多元格局下的市场机遇与挑战并存

这条穿过闵行的铁路，原来沿线藏着许多宝藏景点！

上海又一条市域线要来了！设15座车站，最高时速160公里，与机场线互联互通