Pandas数据筛选20种实用方法详解
创作时间:
作者:
@小白创作中心
Pandas数据筛选20种实用方法详解
引用
CSDN
1.
https://blog.csdn.net/qq_36807888/article/details/141310241
Pandas 提供了丰富的功能用于筛选数据,以下列举 20 种常用方法:
假设我们有一个名为 df 的 DataFrame,包含以下数据:
使用布尔索引
直接使用条件表达式筛选数据:
# 年龄大于 25 岁的
df[df['age'] > 25]
2. 使用 isin 方法
筛选属于指定列表中的值:
# 城市为 'New York' 或 'London' 的
df[df['city'].isin(['New York', 'London'])]
3. 使用 ~ 取反
筛选不满足条件的数据:
# 城市不是 'New York' 的
df[~df['city'].isin(['New York'])]
4. 使用 query 方法
使用字符串表达式筛选数据:
# 年龄大于 25 岁且性别为男性的
df.query("age > 25 and gender == 'M'")
5. 使用 loc 属性
根据标签筛选数据:
# 索引为 1 到 3 的行
df.loc[1:3]
6. 使用 iloc 属性
根据位置筛选数据:
# 前 3 行
df.iloc[:3]
7. 使用 head 方法
筛选前几行数据:
# 前 2 行
df.head(2)
8. 使用 tail 方法
筛选后几行数据:
# 后 2 行
df.tail(2)
9. 使用 sample 方法
随机筛选数据:
# 随机抽取 2 行
df.sample(2)
10. 使用 nlargest 方法
筛选最大的 n 个值:
# 年龄最大的 2 个人
df.nlargest(2, 'age')
11. 使用 nsmallest 方法
筛选最小的 n 个值:
# 年龄最小的 2 个人
df.nsmallest(2, 'age')
12. 使用 between 方法
筛选在指定范围内的值:
# 年龄在 25 到 30 岁之间的
df[df['age'].between(25, 30)]
13. 使用 startswith 方法
筛选以指定字符串开头的值:
# 名字以 'A' 开头的
df[df['name'].str.startswith('A')]
14. 使用 endswith 方法
筛选以指定字符串结尾的值:
# 城市以 'k' 结尾的
df[df['city'].str.endswith('k')]
15. 使用 contains 方法
筛选包含指定字符串的值:
# 城市包含 'o' 的
df[df['city'].str.contains('o')]
16. 使用正则表达式
使用 str.match 方法筛选匹配正则表达式的值:
# 名字匹配正则表达式 '^B.*' 的
df[df['name'].str.match(r'^B.*')]
17. 使用 lambda 函数
使用 apply 方法应用自定义筛选逻辑:
# 筛选年龄为偶数的
df[df['age'].apply(lambda x: x % 2 == 0)]
18. 根据多列的值进行筛选
结合多个条件表达式:
# 年龄大于 25 岁且城市为 'New York' 的
df[(df['age'] > 25) & (df['city'] == 'New York')]
19. 根据索引和列名筛选
结合 loc 和条件表达式:
# 索引为 1 到 3,且年龄大于 25 的
df.loc[1:3, df['age'] > 25]
20. 根据索引和列位置筛选
结合 iloc 和条件表达式:
# 前 3 行,且第 2 列 (age) 大于 25 的
df.iloc[:3, df.columns.get_loc('age') > 25]
以上只是 Pandas 筛选数据的部分常用方法,你可以根据实际需求组合使用这些方法,或者探索更多高级用法。
热门推荐
开学第一课 | 消防"童"行,安全启航
不断探索“研学+旅游”新模式 打造属于达古冰川特有的研学IP产品
法语学习发音的秘诀:如何掌握这门优雅语言的核心
报告:我国新一代AI在大模型技术领域专利申请量约4.4万件
罕见镜头:虎鲸群捕猎巨型蓝鲸
乒乓球侧旋发球技巧与实战应用指南
项目管理沙盘怎么做
禁毒之光,照亮生命之路——禁毒教育基地建设方案
国道限速60开到80怎么处罚
剖析《朝花夕拾 》,挖掘鲁迅文学带来的艺术欣赏价值和现实意义
成都人力资源怎么开公司
秋天穿裙子,下面别穿“打底裤、丝袜”,老土!这3种穿法更优雅
技术分析之均线:股票市场技术分析的重要工具
颈椎病的中医疗法
葛根怎么样泡水喝
职场中的"扮猪吃老虎":你是否已察觉那些深藏不露的高手?
揭秘《新白娘子传奇》中的四位半步天仙,为何迟迟不能成仙?
餐饮连锁如何快速扩张(餐饮连锁门店扩张的模式)
高效复现类 Sora 视频生成方案开源!Open-Sora 最佳实践教程来啦!
积极思考的力量:改变生活、改善心态的5个关键实践
高中化学中常见的35条误区,千万别中招!
《峡谷》:科幻与爱情的碰撞之旅
关系再好,也不要在微信上如此“称呼”对方,特别是人到中年
一文读懂褪黑素:作用、适用人群与注意事项
如何优化叠层别墅设计方案以提升居住舒适度和功能性?
黄土高原的形成原因及其气候特征
贵州的10大美食,黔味让人一口就“上头”,吃过了才算没白来
风格指南:如何选择适合你品牌的logo设计风格?
牛顿力学的哲学思考:确定性与混沌、量子坍缩
五香花生米的做法,用这两种粉挂糊,花生米香脆不糊