read_excel函数详解:pandas库中读取Excel文件的常用参数及用法
创作时间:
作者:
@小白创作中心
read_excel函数详解:pandas库中读取Excel文件的常用参数及用法
引用
CSDN
1.
https://m.blog.csdn.net/youxiaoID/article/details/144637544
read_excel函数是pandas库中用于读取Excel文件的函数,本文将详细解释read_excel函数中常用的几个参数及其用法。
假设被读取的表格名为‘test1221.xlsx’,文件路径是"C:\Users\非常规用户名\Desktop\test1221.xlsx"
1. 默认参数读取表格
首先需要导入pandas包,将读取的表格赋值给data变量,括号里是文件路径。如果文件和Python代码文件在一个文件夹下,那么直接输入文件名就可以;否则需要输入文件路径。一般直接复制文件地址作为输入是不行的,需要将反斜杠改为斜杠或输入两个反斜杠,或者在文件路径前面加一个r让read_excel函数能识别这个路径。最后查看一下读取的表格类型,结果为pandas.core.frame.DataFrame类型,这是一个二维数据结构。
import pandas as pd
data1 = pd.read_excel('test1221.xlsx')
data2 = pd.read_excel("C:/Users/非常规用户名/Desktop/test1221.xlsx")
data3 = pd.read_excel("C:\\Users\\非常规用户名\\Desktop\\test1221.xlsx")
data4 = pd.read_excel(r"C:\Users\非常规用户名\Desktop\test1221.xlsx")
type(data1)
2. 读取指定位置的表格
sheet_name的值可以为None、string、int、字符串列表或整数列表,默认为0,也就是第一个表格。假设现在想要分别读取Sheet1的内容、Sheet3的内容、Sheet3与Sheet6的内容:
import pandas as pd
#2.1、读取第一个表格
data1_1 = pd.read_excel("C:\\Users\\非常规用户名\\Desktop\\test1221.xlsx", sheet_name = 0)#从0开始计数
data1_2 = pd.read_excel("C:\\Users\\非常规用户名\\Desktop\\test1221.xlsx", sheet_name = "Sheet1")
#2.2、读取第三个表格
data2_1 = pd.read_excel("C:\\Users\\非常规用户名\\Desktop\\test1221.xlsx", sheet_name = 1)
data2_2 = pd.read_excel("C:\\Users\\非常规用户名\\Desktop\\test1221.xlsx", sheet_name = "Sheet2")
#2.3、读取第3个和第6个表格
data2_3 = pd.read_excel("C:\\Users\\非常规用户名\\Desktop\\test1221.xlsx", sheet_name = [2,5])
data2_3 = pd.read_excel("C:\\Users\\非常规用户名\\Desktop\\test1221.xlsx", sheet_name = ['Sheet3','Sheet6'])
3. 指定列名行
header参数默认为0,以第一行为列名。
3.1 指定某一行为列名
data1 = pd.read_excel(r"C:\Users\非常规用户名\Desktop\test1221.xlsx", header = 1)#第二行作为列名
print(data1)
3.2 指定多列作为列名
data2 = pd.read_excel("C:\\Users\\非常规用户名\\Desktop\\test1221.xlsx",sheet_name = 'Sheet10', header = [0,1])#指定两列作为列名
print(data2)
3.3 自动生成列名
设置header为None,通常将列名设为从0开始的整数,如果使用header默认值的话会将第一行作为列名。
data3 = pd.read_excel("test1221.xlsx", sheet_name = 'Sheet4',header = None)
3.4 设置列名
names参数指定列名
data4 = pd.read_excel("test1221.xlsx", names = ['A','B','C','D','E','F'])#从右到左

4. 读取指定行列
设置usecols和nrows参数,行列索引都是从0开始计数的
data1 = pd.read_excel("test1221.xlsx", usecols = [0,1], nrows = 5)#前5行
print(data1)
data2 = pd.read_excel("test1221.xlsx", usecols = ["x1","Series 1"], nrows = 5)
print(data2)
5. 跳过指定行
'skip'意为‘跳’,skiprows表示要跳过的行的索引,skipfooter表示要跳过的尾部行数
#跳过第一行,skip意为“跳”
data1 = pd.read_excel(r"C:\\Users\\非常规用户名\\Desktop\test1221.xlsx",
sheet_name = 'Sheet16',skiprows = [0,1])
#跳过尾部的行
data2 = pd.read_excel(r"C:\\Users\\非常规用户名\\Desktop\test1221.xlsx",
sheet_name = 'Sheet16',skipfooter = 2)
6. 指定列数据类型
dtype参数指定列数据类型,未指定的列程序自动根据数据设置数据类型。
data1 = pd.read_excel("test1221.xlsx", dtype = {"x1":int, "Series 1":str ,"x3":int})
print(data1.dtypes)
7. 将某些值视为NA
na_value参数表示将某些值视为NA
data4 = pd.read_excel("test1221.xlsx",sheet_name = 'Sheet3',
na_values = ["Dairy and Egg Products","Baby Foods"])
热门推荐
如何把握股市中的成长潜力股?这种潜力股如何挖掘和跟踪?
鲁荣渔2682号惨案,真实版大逃杀,33人出海作业,22人被喂了鲨鱼
塔式起重机安全操作规程要点详解
宝宝辅食应该怎么挑选
RFSoC芯片在国内的应用情况简介
冬季用电高峰,工业和商业如何选择高效柴油发电机组
计算机组成原理:一位全加器详解
如何理解C语言中的二级指针
牛蹄筋的功效与作用是什么
AI编织的生命体长什么样?《数字世界的生命体》全球首展在深圳开幕
厦金大桥(厦门段)建设取得重要进展,预计年底完成关键节点
量比变化与股票价格波动的关系
四季养生—四季气候变化对人体的影响以及怎样调理
牛排几分熟,你分得清吗?
粉刺怎么办?黑头/闭口粉刺的正确处理方法!
植发价格水太深?2025年不同技术 部位 城市收费全解析
每天吃黑米能减肥吗
狗糖尿病治疗:从饮食到运动的全方位护理指南
宠物糖尿病体重恢复攻略
个人所得税如何申请房贷抵税:全流程解析与法律要点
南沙人口首超越秀!过去10年,广州哪些区人口增长最猛?
低费率时代开启 还有哪些ETF待降费?
痛风能吃腐乳吗
谈“激素”色变?揭秘糖皮质激素
激素类药物使用指南:正确使用,远离恐惧
湿气重则百病生!湿气重的人,身体这4个部位是“臭”的
相机采集帧率越低越好吗
心衰患者的五大饮食原则
南通地区结婚彩礼习俗探究
被誉为“千古反间第一计”的金刀计,究竟厉害在哪?基本是无解