资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

Pandas DataFrame创建详解：从一维数据到已有文件

创作时间:

作者:

@小白创作中心

Pandas DataFrame创建详解：从一维数据到已有文件

引用

CSDN

https://m.blog.csdn.net/Morse_Chen/article/details/137130981

本文是一篇关于Pandas库中DataFrame创建的教程。文章详细介绍了DataFrame的创建方法，包括基于一维数据、二维数据以及已有文件的创建方式，并通过具体的代码示例和解释帮助读者理解。文章内容结构清晰，从DataFrame的简介开始，逐步深入到具体的创建方法，适合Pandas初学者学习。

一、DataFrame简介

DataFrame 是一个表格型的数据结构，它含有一组有序的列，每列可以是不同的值类型（数值、字符串、布尔值等）。DataFrame 既有行索引也有列索引，它可以被看做由 Series 组成的字典（共用同一个索引）是基于。

DataFrame函数原型：

pd.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)

data：数据，可以是多种形式，如ndarray、Series、DataFrame、字典等。
index：行索引，用于指定行的标签，默认为整数索引。
columns：列索引，用于指定列的标签，默认为整数索引。
dtype：数据类型，用于指定DataFrame中的数据类型，默认为None。
copy：是否复制数据，默认为False。

DataFrame的属性：

函数	返回值
values	元素
index	索引
columns	列名
dtypes	类型
size	元素个数
ndim	维度数
shape	数据形状（行列数目）

导入 NumPy 库和 Pandas 库：

import numpy as np
import pandas as pd

二、基于一维数据创建

DataFrame 对象看成一维对象的有序序列，序列中的对象元素又分成按列排列和按行排列两种情况。

（一）按列排列

按列排列，需要基于字典构建：字典的键对应列名，字典的值可以是一列表、一维Numpy数组、Series 对象，或者字典都行。此时，只要一列存在行索引，则该行索引被共享（例如 english 的索引）；如果各列都没有行索引，则用整数作为隐含索引。

1、字典的值分别是一个Series对象、一维列表、一维Numpy数组的情形

# case1-① ② ③：字典的值分别是一个Series对象、一维列表、一维Numpy数组的情形
english = pd.Series([93,97],index=['s01','s02'])  
pd.DataFrame({'英语':english,'语文':[86,88],'数学':np.array([97,95])})

2、字典的值是字典的情形

# case1-④：字典的值是字典的情形
pd.DataFrame({'数学':{'s01':97,'s02':95},'英语':{'s01':93,'s02':97},'语文':{'s01':86,'s02':88}})

对比：看看下面语句的执行结果：

pd.DataFrame({'s01':{'语文':86,'数学':97,'英语':93},'s02':{'数学':95,'语文':88,'英语':97}})

小结：只要外层是字典，则外层字典的键一定是作为 DataFrame 对象的列标签。内层如果是字典或 Series 对象（也可以看成是字典），则内层字典的键将作为作为 DataFrame 对象的行标签。

（二）按行排列

按行排列，需要基于列表构建：列表中的元素可以是一维 Series 对象、一维列表、一维 Numpy 数组或字典都行。

1、把行看成Series对象的情形

# case2-①：这是把行看成Series对象的情形
s1 = pd.Series({'语文':86,'数学':97,'英语':93})
s2 = pd.Series({'数学':95,'语文':88,'英语':97})
pd.DataFrame([s1,s2],index=['s01','s02'])

2、把行看成列表的情形

# case2-②：这是把行看成列表的情形
pd.DataFrame([[97,93,86],[95,97,88]],index=['s01','s02'],columns=['数学','英语','语文'])

3、把行看成一维Numpy数组的情形

# case2-③：这是把行看成一维Numpy数组的情形
pd.DataFrame([np.array([97,93,86]),np.array([95,97,88])],index=['s01','s02'],columns=['数学','英语','语文'])

4、把行看成字典的情形

# case2-④：这是把行看成字典的情形
pd.DataFrame([{'语文':86,'数学':97,'英语':93},{'数学':95,'语文':88,'英语':97}],index=['s01','s02'])

三、基于二维数据创建

1、基于二维列表创建

# case3-①：基于二维列表创建
pd.DataFrame([[97,93,86],[95,97,88]],index=['s01','s02'],columns=['数学','英语','语文'])

2、基于二维数组创建

# case3-②：基于二维数组创建
scores = np.array([[97,93,86],
                [95,97,88]])
pd.DataFrame(scores,index=['s01','s02'],columns=['数学','英语','语文'])

3、基于字典创建

# case3-③：基于字典创建，列名看作字典的键
pd.DataFrame({'数学':[97,95],'英语':[93,97],'语文':[86,88]},index=['s01','s02'])

四、基于已有的文件创建

# case4--基于已有的文件创建
pd.read_excel('team.xlsx')

注意：使用 index 和 columns 属性查看 DataFrame 的行、列名。字符串在 Pandas 中被处理成 object 类型的对象。

df = pd.DataFrame([[97,93,86],[95,97,88]],index=['s01','s02'],columns=['数学','英语','语文'])
print(df.index)
print(df.columns)

ser = pd.Series({'a':[1,2,3],'b':['1','2','3']})
ser

热门推荐

国内9大先进汽车风洞试验室汇总

中医科普：现代人阳气不足的原因及中医应对之策

基于51单片机的智能窗户系统设计

血糖高的人可以吃西瓜吗？专家解读：关键在于控制量

被害妄想症属于抑郁症吗

石科院分布式氨分解制氢技术实现燃料电池车首车商用充装

天津大学：985与211双一流高校的综合实力解析

沈阳药科大学2024年全国录取分数线及招生计划详解

没有红绿灯的十字路口如何开车，要遵守哪些交通规则

舌侧矫正与传统矫正哪个成效更好？来对比两种矫正方式的成效&优势等

彩色的油菜花，你见过吗？

西安铁路职业技术学院2025年五年一贯制高职招生：住宿、餐饮与就业全攻略

长孙皇后与李世民：一段承载爱情与权力的生死离别

奇亚籽：超级食物的减肥功效与实用食谱

中国银发经济规模约7万亿元，2035年有望达30万亿元

治疗成功率95.5%！肝癌、肝转移治疗迎来颠覆性突破，李嘉诚都直呼“不可思议”！

短视频侵权被起诉：法律问题的深度剖析与应对策略

土豆米你听说过吗？中国科学家研发的“黑科技”来了！

丝素蛋白医疗器械的研究现状与审评要点

半桥LLC谐振拓扑：高效稳定电源的首选方案（中）

市宅基地纠纷判决书的法律适用与实务分析

疲倦感：如何科学应对日常疲劳

煎饼果子的做法和配方，教你轻松制作美味小吃！

前端如何安全上传文件

手臂关节处弯曲或伸直就痛？可能由这些原因引起

狗为什么舔地面（探究狗舔地行为的原因及其健康影响）