read_excel函数详解:pandas库中读取Excel文件的常用参数及用法
创作时间:
作者:
@小白创作中心
read_excel函数详解:pandas库中读取Excel文件的常用参数及用法
引用
CSDN
1.
https://m.blog.csdn.net/youxiaoID/article/details/144637544
read_excel函数是pandas库中用于读取Excel文件的函数,本文将详细解释read_excel函数中常用的几个参数及其用法。
假设被读取的表格名为‘test1221.xlsx’,文件路径是"C:\Users\非常规用户名\Desktop\test1221.xlsx"
1. 默认参数读取表格
首先需要导入pandas包,将读取的表格赋值给data变量,括号里是文件路径。如果文件和Python代码文件在一个文件夹下,那么直接输入文件名就可以;否则需要输入文件路径。一般直接复制文件地址作为输入是不行的,需要将反斜杠改为斜杠或输入两个反斜杠,或者在文件路径前面加一个r让read_excel函数能识别这个路径。最后查看一下读取的表格类型,结果为pandas.core.frame.DataFrame类型,这是一个二维数据结构。
import pandas as pd
data1 = pd.read_excel('test1221.xlsx')
data2 = pd.read_excel("C:/Users/非常规用户名/Desktop/test1221.xlsx")
data3 = pd.read_excel("C:\\Users\\非常规用户名\\Desktop\\test1221.xlsx")
data4 = pd.read_excel(r"C:\Users\非常规用户名\Desktop\test1221.xlsx")
type(data1)
2. 读取指定位置的表格
sheet_name的值可以为None、string、int、字符串列表或整数列表,默认为0,也就是第一个表格。假设现在想要分别读取Sheet1的内容、Sheet3的内容、Sheet3与Sheet6的内容:
import pandas as pd
#2.1、读取第一个表格
data1_1 = pd.read_excel("C:\\Users\\非常规用户名\\Desktop\\test1221.xlsx", sheet_name = 0)#从0开始计数
data1_2 = pd.read_excel("C:\\Users\\非常规用户名\\Desktop\\test1221.xlsx", sheet_name = "Sheet1")
#2.2、读取第三个表格
data2_1 = pd.read_excel("C:\\Users\\非常规用户名\\Desktop\\test1221.xlsx", sheet_name = 1)
data2_2 = pd.read_excel("C:\\Users\\非常规用户名\\Desktop\\test1221.xlsx", sheet_name = "Sheet2")
#2.3、读取第3个和第6个表格
data2_3 = pd.read_excel("C:\\Users\\非常规用户名\\Desktop\\test1221.xlsx", sheet_name = [2,5])
data2_3 = pd.read_excel("C:\\Users\\非常规用户名\\Desktop\\test1221.xlsx", sheet_name = ['Sheet3','Sheet6'])
3. 指定列名行
header参数默认为0,以第一行为列名。
3.1 指定某一行为列名
data1 = pd.read_excel(r"C:\Users\非常规用户名\Desktop\test1221.xlsx", header = 1)#第二行作为列名
print(data1)
3.2 指定多列作为列名
data2 = pd.read_excel("C:\\Users\\非常规用户名\\Desktop\\test1221.xlsx",sheet_name = 'Sheet10', header = [0,1])#指定两列作为列名
print(data2)
3.3 自动生成列名
设置header为None,通常将列名设为从0开始的整数,如果使用header默认值的话会将第一行作为列名。
data3 = pd.read_excel("test1221.xlsx", sheet_name = 'Sheet4',header = None)
3.4 设置列名
names参数指定列名
data4 = pd.read_excel("test1221.xlsx", names = ['A','B','C','D','E','F'])#从右到左

4. 读取指定行列
设置usecols和nrows参数,行列索引都是从0开始计数的
data1 = pd.read_excel("test1221.xlsx", usecols = [0,1], nrows = 5)#前5行
print(data1)
data2 = pd.read_excel("test1221.xlsx", usecols = ["x1","Series 1"], nrows = 5)
print(data2)
5. 跳过指定行
'skip'意为‘跳’,skiprows表示要跳过的行的索引,skipfooter表示要跳过的尾部行数
#跳过第一行,skip意为“跳”
data1 = pd.read_excel(r"C:\\Users\\非常规用户名\\Desktop\test1221.xlsx",
sheet_name = 'Sheet16',skiprows = [0,1])
#跳过尾部的行
data2 = pd.read_excel(r"C:\\Users\\非常规用户名\\Desktop\test1221.xlsx",
sheet_name = 'Sheet16',skipfooter = 2)
6. 指定列数据类型
dtype参数指定列数据类型,未指定的列程序自动根据数据设置数据类型。
data1 = pd.read_excel("test1221.xlsx", dtype = {"x1":int, "Series 1":str ,"x3":int})
print(data1.dtypes)
7. 将某些值视为NA
na_value参数表示将某些值视为NA
data4 = pd.read_excel("test1221.xlsx",sheet_name = 'Sheet3',
na_values = ["Dairy and Egg Products","Baby Foods"])
热门推荐
德语阅读材料中的文化差异怎么理解?
《福尔摩斯》犯罪心理学:分析侦探的心理剖析
2019年张扣扣为母报仇案画上句号,他死后,其父坚决不领儿子骨灰
缺觉的人,到底该不该运动?
茂名仙人洞村:生态旅游带动年入140万,村民家门口当老板
冷水能燃烧卡路里,热水助消化?专家解读饮用水温真相
电饭煲维修必备:工作原理与故障处理详解
告别电水壶使用误区,这样煮水更安全高效
死亡后毛发指甲“生长”真相:皮肤收缩所致
婴幼儿时期的肠道保健很重要 肠道不适可用妈咪爱益生菌及时调
土鳖虫:土里钻来钻去,却能续筋接骨
兰州水墨丹霞:绝美探险攻略来袭!
玉米补贴多少钱一亩2024?具体什么时间发放?附详情
司马迁《史记》:史学文学双璧,影响中国文化的经典巨著
《史记》里的商业智慧:10句古训解读
一次性使用穿刺针:在医疗过程中更安全更便捷
盐浴的功效与危害
腰椎穿刺(脊椎穿刺):目的、风险及注意事项
TikTok禁令风暴下的省广集团:股价暴跌后的理性思考
冬季养生必备:莲子养心安神
立秋养生,莲子养心安神的秘密
莲子心茶的神仙搭配,你get了吗?
西洋参莲子百合汤:养心安神新宠
陶寺遗址博物馆开馆,考古人讲述66年探寻之路
济南市槐荫区康城小学:拆迁户子女上学难题破解指南
农村拆迁后,孩子上学难题如何破解?
拆迁安置协议搞定户口迁移攻略
曾厝垵:闽南文化的网红打卡地
泉州&漳州古城:闽南文化的活态传承
太原迎泽区:集团化办学让优质教育资源均衡覆盖