Pandas数据透视表(pivot_table)的存储与读取
创作时间:
作者:
@小白创作中心
Pandas数据透视表(pivot_table)的存储与读取
引用
CSDN
1.
https://m.blog.csdn.net/m0_47149835/article/details/139301205
在使用Pandas处理数据透视表时,经常会遇到列名多级索引的问题。本文将详细介绍如何创建数据透视表、保存为Excel文件,以及如何正确读取包含多级列索引的Excel文件。
当对某个DataFrame进行pd.pivot_table
操作时,输出的透视表的列名会根据参数columns
所指定的列内含有的类别进行细分,最终生成到Excel时,列名也会占据多行,虽然提高了肉眼的可读性,但再次用程序加载得到的表并不方便处理。
创建一个DataFrame
import pandas as pd
df = pd.DataFrame(
data={'User': ['Jaye', 'Ben', 'Ben', 'Jaye', 'Leo'],
'Class one?': ['Y', 'N', 'Y', 'Y', 'N'],
'Value': [5, 7.0, 10, 2, 8.8], })
print(df)
输出结果:
User Class one? Value
0 Jaye Y 5.0
1 Ben N 7.0
2 Ben Y 10.0
3 Jaye Y 2.0
4 Leo N 8.8
创建数据透视表
df_pivot = pd.pivot_table(df, index='User', columns='Class one?', aggfunc='sum')
df_pivot.to_excel('testing.xlsx')
仔细观察MultiIndex
pivot_table
的columns
是MultiIndex,遍历输出后发现它由多个tuple组成,每一个tuple都代表了最细粒度的类别。
输出到Excel并重新读取
通过参数index_col
(对应index
)和header
(对应columns
),就可以读取前文已经输出到Excel的数据透视表
pd.read_excel('testing.xlsx', index_col=0, header=[0, 1])
index_col=0
表示将第一列设为index
header=[0, 1]
表示将第1~2行作为columns
热门推荐
见证上海百年风云,黄浦这些传奇酒店从未迟暮
鳗苗人工繁育依然是全球性科技攻关难题,2050年前难以规模量产推广
古代法医学实践中的沛郡唐赐蛊虫案件判例
DotA2 IMBA模式玩法全攻略:从入门到精通
双鱼座认真谈恋爱的表现:真诚与直接的爱意表达
青少年双相情感障碍:诊断与治疗的挑战
猫咪陪睡健康指南,三大隐形雷区预警,科学共眠这样做!
各年龄段用户如何挑选奶和奶制品?专家回应:生长期儿童不建议选用脱脂和低脂类产品
远程重启服务器的技巧与注意事项:提升运维效率的必备技能
街头巷尾,人间烟火里的绝美风景
光影之诗:古典之境,以镜头捕捉灵魂之美
什么是隆中对?隆中对中最核心的内容是什么?
仓颉编程语言有什么优势
门店经营数据分析:洞察商业智慧,驱动决策优化
八字国学命理真人讲解:如何深入理解个人命运与传统文化智慧
嘴角总长小水泡,多半与4个原因有关,想要治疗它,需做好3件事!
口腔科医生解答牙齿发黑原因及日常保健建议
如何避免锻炼腹肌时的常见误区?
新手马拉松训练计划精华版
用户活跃、留存、流失,超全图解!
颈椎病如何治疗才会好
电脑风扇转速查看与调整指南
基金投资:如何评估基金的分红政策与收益再投资
如何解决《荒野大镖客2》服务器网络延迟问题?
破解智能与意识本质需解决的五个关键问题
辩论赛总结:科技发展与人类幸福感的关系
几丁寡糖在功能性食品中的应用
服务器怎么保存数据不丢失
如何防止掉电状况下的系统出错
云盘如何设置隐私空间