Pandas数据透视表(pivot_table)的存储与读取
创作时间:
作者:
@小白创作中心
Pandas数据透视表(pivot_table)的存储与读取
引用
CSDN
1.
https://m.blog.csdn.net/m0_47149835/article/details/139301205
在使用Pandas处理数据透视表时,经常会遇到列名多级索引的问题。本文将详细介绍如何创建数据透视表、保存为Excel文件,以及如何正确读取包含多级列索引的Excel文件。
当对某个DataFrame进行pd.pivot_table
操作时,输出的透视表的列名会根据参数columns
所指定的列内含有的类别进行细分,最终生成到Excel时,列名也会占据多行,虽然提高了肉眼的可读性,但再次用程序加载得到的表并不方便处理。
创建一个DataFrame
import pandas as pd
df = pd.DataFrame(
data={'User': ['Jaye', 'Ben', 'Ben', 'Jaye', 'Leo'],
'Class one?': ['Y', 'N', 'Y', 'Y', 'N'],
'Value': [5, 7.0, 10, 2, 8.8], })
print(df)
输出结果:
User Class one? Value
0 Jaye Y 5.0
1 Ben N 7.0
2 Ben Y 10.0
3 Jaye Y 2.0
4 Leo N 8.8
创建数据透视表
df_pivot = pd.pivot_table(df, index='User', columns='Class one?', aggfunc='sum')
df_pivot.to_excel('testing.xlsx')
仔细观察MultiIndex
pivot_table
的columns
是MultiIndex,遍历输出后发现它由多个tuple组成,每一个tuple都代表了最细粒度的类别。
输出到Excel并重新读取
通过参数index_col
(对应index
)和header
(对应columns
),就可以读取前文已经输出到Excel的数据透视表
pd.read_excel('testing.xlsx', index_col=0, header=[0, 1])
index_col=0
表示将第一列设为index
header=[0, 1]
表示将第1~2行作为columns
热门推荐
AI 如何重塑商业分析:从数据到决策的革命
托莫西汀能不能提高注意力
观看《命运之盘》前必读,《夺宝奇兵》全系列的故事回顾
管理软件如何找客户电话
精选内容集|从入门基础到专业技艺,探索调酒的艺术之旅
河内美食:从街头小吃到文化名片
湄江风景区:解锁湘中宝藏旅游地
如何优化Android应用的内存管理以提升性能
数据采集规范:确保数据质量的关键步骤
银禧科技业绩大洗澡 多项财务数据真实性待考
雾化用畅起布地奈德混悬液如何正确使用?
活泼性格的心理学解读
香港“S”车牌创下天价成交:底价5000元 5分钟1420万元拍出
2025郑州庙会活动全攻略:时间、地点及特色活动一览
福建漳州:嵌入式养老,构筑幸福养老生活圈
如何利用社交媒体实现国际营销成功?(指南收藏)
什么是债券的“久期”?
甲状腺肿大自查攻略:症状识别与就医指南
2025“行星连珠”时间表来了!天文奇景不容错过!
中北大学地址在哪里,哪个城市,哪个区?
如何在外汇市场中进行有效的资金管理?外汇交易策略有哪些潜在的风险和策略?
荷花种植完全指南:从入门到精通
如何让你的英语更符合非正式场合的氛围呢?
SWOT分析法
儿童生长发育:钙、铁、锌的重要性
在国外维持家庭联系的有效策略与技巧
德媒:中企领跑汽车创新,前10占5强,欧美无法跟上
哲學的定義是什麼?
央视警告!这4种春菜吃不对,可能变成“慢性毒药”!
对骨骼好的十大食物,药补不如食补,不想骨质疏松,记得要常吃!