Pandas筛选数据的20种方法
创作时间:
作者:
@小白创作中心
Pandas筛选数据的20种方法
引用
CSDN
1.
https://blog.csdn.net/qq_36807888/article/details/141310241
Pandas 是一个强大的数据处理库,提供了丰富的功能用于筛选数据。以下是 20 种常用的数据筛选方法:
假设我们有一个名为 df 的 DataFrame,包含以下数据:
1. 使用布尔索引
直接使用条件表达式筛选数据:
# 年龄大于 25 岁的
df[df['age'] > 25]
2. 使用 isin 方法
筛选属于指定列表中的值:
# 城市为 'New York' 或 'London' 的
df[df['city'].isin(['New York', 'London'])]
3. 使用 ~ 取反
筛选不满足条件的数据:
# 城市不是 'New York' 的
df[~df['city'].isin(['New York'])]
4. 使用 query 方法
使用字符串表达式筛选数据:
# 年龄大于 25 岁且性别为男性的
df.query("age > 25 and gender == 'M'")
5. 使用 loc 属性
根据标签筛选数据:
# 索引为 1 到 3 的行
df.loc[1:3]
6. 使用 iloc 属性
根据位置筛选数据:
# 前 3 行
df.iloc[:3]
7. 使用 head 方法
筛选前几行数据:
# 前 2 行
df.head(2)
8. 使用 tail 方法
筛选后几行数据:
# 后 2 行
df.tail(2)
9. 使用 sample 方法
随机筛选数据:
# 随机抽取 2 行
df.sample(2)
10. 使用 nlargest 方法
筛选最大的 n 个值:
# 年龄最大的 2 个人
df.nlargest(2, 'age')
11. 使用 nsmallest 方法
筛选最小的 n 个值:
# 年龄最小的 2 个人
df.nsmallest(2, 'age')
12. 使用 between 方法
筛选在指定范围内的值:
# 年龄在 25 到 30 岁之间的
df[df['age'].between(25, 30)]
13. 使用 startswith 方法
筛选以指定字符串开头的值:
# 名字以 'A' 开头的
df[df['name'].str.startswith('A')]
14. 使用 endswith 方法
筛选以指定字符串结尾的值:
# 城市以 'k' 结尾的
df[df['city'].str.endswith('k')]
15. 使用 contains 方法
筛选包含指定字符串的值:
# 城市包含 'o' 的
df[df['city'].str.contains('o')]
16. 使用正则表达式
使用 str.match 方法筛选匹配正则表达式的值:
# 名字匹配正则表达式 '^B.*' 的
df[df['name'].str.match(r'^B.*')]
17. 使用 lambda 函数
使用 apply 方法应用自定义筛选逻辑:
# 筛选年龄为偶数的
df[df['age'].apply(lambda x: x % 2 == 0)]
18. 根据多列的值进行筛选
结合多个条件表达式:
# 年龄大于 25 岁且城市为 'New York' 的
df[(df['age'] > 25) & (df['city'] == 'New York')]
19. 根据索引和列名筛选
结合 loc 和条件表达式:
# 索引为 1 到 3,且年龄大于 25 的
df.loc[1:3, df['age'] > 25]
20. 根据索引和列位置筛选
结合 iloc 和条件表达式:
# 前 3 行,且第 2 列 (age) 大于 25 的
df.iloc[:3, df.columns.get_loc('age') > 25]
以上只是 Pandas 筛选数据的部分常用方法,你可以根据实际需求组合使用这些方法,或者探索更多高级用法。
热门推荐
江苏镇江旅游攻略:不可错过的景点体验指南
全天候保持穿着质感!六大避免衣服皱褶的技巧
电助力自行车的革命:从智能化特点到通勤体面方案全面解析
深陷商标之争内耗不断,华彬集团如何走出困局?
尿毒症前期症状及处理方法
六大关键词解读《2025中国家居家装行业发展研究报告》
从汉末开始的“士族门阀”时代究竟是怎么结束的?
是什么造就了“一点就炸”的“互联网恶少年”?
Agent未来已来?揭示LLM Agent技术架构与现实挑战
孩子不让父母亲近什么心理
葡萄牙和西班牙,谁才是欧洲伊比利亚半岛的旅游王者?
丙午日柱和辛未日柱会比较辛苦:性格与策略应对之道
澳门必买伴手礼推荐:16种澳门特产精选指南
全球第一!中国造船业综合竞争力全面超越韩国
瑞舒伐他汀 vs 普伐他汀:从疗效、副作用到适用人群的全方位对比
国际贸易术语FAS、FOB、CFR、CIF深度解析
探讨"我行我素"个性在现代社会中的适应与挑战。
二手市场M.2 SSD选购秘籍大公开!
“肠”不住的秘密:探秘肠道微生态
洛丹伦的历史与传说:从辉煌到衰落的王国
有感冒的症状了怎么办
什么是虹吸式坐便器(虹吸式坐便器解剖图)
辅警转正必看!这3条入警途径,有人成功上岸!最后一个门槛最低
画布上开不尽的那些花儿
范仲淹《岳阳楼记》与家训《百字铭》原文及译文
放射科需要采取的辐射防护措施有哪些?
“延迟退休”在美成热门话题
品牌的市场定位是什么?有哪些特征?
事关城市更新,深圳“房票”要来了
炒花生米时,不要先放油!多做2步,花生米更香更脆,七天不回潮