read_excel函数详解:pandas库中读取Excel文件的常用参数及用法
创作时间:
作者:
@小白创作中心
read_excel函数详解:pandas库中读取Excel文件的常用参数及用法
引用
CSDN
1.
https://m.blog.csdn.net/youxiaoID/article/details/144637544
read_excel函数是pandas库中用于读取Excel文件的函数,本文将详细解释read_excel函数中常用的几个参数及其用法。
假设被读取的表格名为‘test1221.xlsx’,文件路径是"C:\Users\非常规用户名\Desktop\test1221.xlsx"
1. 默认参数读取表格
首先需要导入pandas包,将读取的表格赋值给data变量,括号里是文件路径。如果文件和Python代码文件在一个文件夹下,那么直接输入文件名就可以;否则需要输入文件路径。一般直接复制文件地址作为输入是不行的,需要将反斜杠改为斜杠或输入两个反斜杠,或者在文件路径前面加一个r让read_excel函数能识别这个路径。最后查看一下读取的表格类型,结果为pandas.core.frame.DataFrame类型,这是一个二维数据结构。
import pandas as pd
data1 = pd.read_excel('test1221.xlsx')
data2 = pd.read_excel("C:/Users/非常规用户名/Desktop/test1221.xlsx")
data3 = pd.read_excel("C:\\Users\\非常规用户名\\Desktop\\test1221.xlsx")
data4 = pd.read_excel(r"C:\Users\非常规用户名\Desktop\test1221.xlsx")
type(data1)
2. 读取指定位置的表格
sheet_name的值可以为None、string、int、字符串列表或整数列表,默认为0,也就是第一个表格。假设现在想要分别读取Sheet1的内容、Sheet3的内容、Sheet3与Sheet6的内容:
import pandas as pd
#2.1、读取第一个表格
data1_1 = pd.read_excel("C:\\Users\\非常规用户名\\Desktop\\test1221.xlsx", sheet_name = 0)#从0开始计数
data1_2 = pd.read_excel("C:\\Users\\非常规用户名\\Desktop\\test1221.xlsx", sheet_name = "Sheet1")
#2.2、读取第三个表格
data2_1 = pd.read_excel("C:\\Users\\非常规用户名\\Desktop\\test1221.xlsx", sheet_name = 1)
data2_2 = pd.read_excel("C:\\Users\\非常规用户名\\Desktop\\test1221.xlsx", sheet_name = "Sheet2")
#2.3、读取第3个和第6个表格
data2_3 = pd.read_excel("C:\\Users\\非常规用户名\\Desktop\\test1221.xlsx", sheet_name = [2,5])
data2_3 = pd.read_excel("C:\\Users\\非常规用户名\\Desktop\\test1221.xlsx", sheet_name = ['Sheet3','Sheet6'])
3. 指定列名行
header参数默认为0,以第一行为列名。
3.1 指定某一行为列名
data1 = pd.read_excel(r"C:\Users\非常规用户名\Desktop\test1221.xlsx", header = 1)#第二行作为列名
print(data1)
3.2 指定多列作为列名
data2 = pd.read_excel("C:\\Users\\非常规用户名\\Desktop\\test1221.xlsx",sheet_name = 'Sheet10', header = [0,1])#指定两列作为列名
print(data2)
3.3 自动生成列名
设置header为None,通常将列名设为从0开始的整数,如果使用header默认值的话会将第一行作为列名。
data3 = pd.read_excel("test1221.xlsx", sheet_name = 'Sheet4',header = None)
3.4 设置列名
names参数指定列名
data4 = pd.read_excel("test1221.xlsx", names = ['A','B','C','D','E','F'])#从右到左

4. 读取指定行列
设置usecols和nrows参数,行列索引都是从0开始计数的
data1 = pd.read_excel("test1221.xlsx", usecols = [0,1], nrows = 5)#前5行
print(data1)
data2 = pd.read_excel("test1221.xlsx", usecols = ["x1","Series 1"], nrows = 5)
print(data2)
5. 跳过指定行
'skip'意为‘跳’,skiprows表示要跳过的行的索引,skipfooter表示要跳过的尾部行数
#跳过第一行,skip意为“跳”
data1 = pd.read_excel(r"C:\\Users\\非常规用户名\\Desktop\test1221.xlsx",
sheet_name = 'Sheet16',skiprows = [0,1])
#跳过尾部的行
data2 = pd.read_excel(r"C:\\Users\\非常规用户名\\Desktop\test1221.xlsx",
sheet_name = 'Sheet16',skipfooter = 2)
6. 指定列数据类型
dtype参数指定列数据类型,未指定的列程序自动根据数据设置数据类型。
data1 = pd.read_excel("test1221.xlsx", dtype = {"x1":int, "Series 1":str ,"x3":int})
print(data1.dtypes)
7. 将某些值视为NA
na_value参数表示将某些值视为NA
data4 = pd.read_excel("test1221.xlsx",sheet_name = 'Sheet3',
na_values = ["Dairy and Egg Products","Baby Foods"])
热门推荐
史上最狂的10首诗词:大鹏一日同风起,扶摇直上九万里
我爱学诗词丨大鹏一日同风起,扶摇直上九万里(上李邕 李白)
我国地外生命探寻计划包含太阳系考古,这要如何进行,发射飞船?
为什么牙齿经常出血?一文详解原因与预防方法
牙龈出血的误解: 你上火了!
Overlord哥布林小红帽:探索神秘角色背后的故事与影响力
上海援疆:把沪喀优品推向更广阔市场
进京证是什么?为何外地车不能直接进京,而要办进京证?
权变市场营销:灵活应对市场变化的策略解析
遗产分割中的继承权确认与争议解决
齐鲁临床技能大模型接入DeepSeek,打造医学教育云+AI新范式
电镀锌工艺流程详解
AI生成人物对话文案:优势、方法与应用
炒山药和生山药区别是什么
夏天一天用几次洗面奶
猎豹其实不是豹
猎豹与花豹:大自然中的速度之王和隐匿猎手
青少年毒品预防最强攻略:从认识毒品到自我保护
笔记本电脑摄像头未检测到怎么办?7个小技巧,快速解决问题
如何调整手表的时间?调整步骤和注意事项有哪些?
如何提高乒乓球的力量?(掌握正确的技术和训练方法)
揭开神秘面纱:黑玫瑰花语
游玩全攻略!福鼎太姥山~
螺旋钢管标准:从生产到应用的全面解析
高血压患者饮食搭配有“技巧”
神秘的武夷山大红袍
适合海外儿童的10本中文分级读物与10个免费中文分级阅读网站详细推荐
德国人拉贝曾救下我国25万同胞,多年后孙儿来求药,我国:必须帮
土豆施肥全攻略:科学施肥助力高产优质
桂林西瓜霜使用说明指导