当前位置:首页 > 科技  > 软件

Pandas中选择和过滤数据的终极指南

来源: 责编: 时间:2023-11-30 17:30:30 351观看
导读Python pandas库提供了几种选择和过滤数据的方法,如loc、iloc、[]括号操作符、query、isin、between等等本文将介绍使用pandas进行数据选择和过滤的基本技术和函数。无论是需要提取特定的行或列,还是需要应用条件过滤,pa

Python pandas库提供了几种选择和过滤数据的方法,如loc、iloc、[]括号操作符、query、isin、between等等vbA28资讯网——每日最新资讯28at.com

本文将介绍使用pandas进行数据选择和过滤的基本技术和函数。无论是需要提取特定的行或列,还是需要应用条件过滤,pandas都可以满足需求。vbA28资讯网——每日最新资讯28at.com

vbA28资讯网——每日最新资讯28at.com

选择列

loc[]:根据标签选择行和列。df.row_label loc, column_label]vbA28资讯网——每日最新资讯28at.com

也可以使用loc进行切片操作:vbA28资讯网——每日最新资讯28at.com

df.loc['row1_label':'row2_label' , 'column1_label':'column2_label']vbA28资讯网——每日最新资讯28at.com

例如vbA28资讯网——每日最新资讯28at.com

# Using loc for label-based selection df.loc[:, 'Customer Country':'Customer State']

vbA28资讯网——每日最新资讯28at.com

# Using loc for label-based selection df.loc[[0,1,2], 'Customer Country':'Customer State']

vbA28资讯网——每日最新资讯28at.com

iloc[]:根据位置索引选择行和列。df.iloc [row_position column_position]vbA28资讯网——每日最新资讯28at.com

可以使用iloc进行切片操作:vbA28资讯网——每日最新资讯28at.com

df.iloc['row1_position':'row2_position','col1_position':'col2_position']

例如:vbA28资讯网——每日最新资讯28at.com

# Using iloc for index-based selection df.iloc[[0,1,2,3] , [3,4,5,6,7,8]]  # or df.iloc[[0,1,2,3] , 3:9]

vbA28资讯网——每日最新资讯28at.com

# Using iloc for index-based selection df.iloc[:, 3:8]

vbA28资讯网——每日最新资讯28at.com

[]括号操作符:它允许选择一个或多个列。df[['column_label']]或df[['column1', 'column2']]]vbA28资讯网——每日最新资讯28at.com

# Selecting a single column df[['Customer Country']]

vbA28资讯网——每日最新资讯28at.com

# Selecting multiple columns df[['Customer Country', 'Customer State']]

vbA28资讯网——每日最新资讯28at.com

过滤行

loc[]:按标签过滤行。df.loc(条件)vbA28资讯网——每日最新资讯28at.com

# Using loc for filtering rows condition = df['Order Quantity'] > 3 df.loc[condition]  # or df.loc[df['Order Quantity'] > 3]

vbA28资讯网——每日最新资讯28at.com

# Using loc for filtering rows df.loc[df['Customer Country'] == 'United States']

vbA28资讯网——每日最新资讯28at.com

iloc():按位置索引筛选行。vbA28资讯网——每日最新资讯28at.com

# Using iloc for filtering rows df.iloc[[0, 2, 4]]

vbA28资讯网——每日最新资讯28at.com

# Using iloc for filtering rows df.iloc[:3, :2]

vbA28资讯网——每日最新资讯28at.com

[]括号操作符:它允许根据条件过滤行。df(条件)vbA28资讯网——每日最新资讯28at.com

# Using [] bracket operator for filtering rows# Using [] bracket operator for filtering rows condition = df['Order Quantity'] > 3 df[condition]  # or df[df['Order Quantity'] > 3]

vbA28资讯网——每日最新资讯28at.com

isin([]):基于列表过滤数据。df (df (column_name”).isin ([value1, ' value2 ']))vbA28资讯网——每日最新资讯28at.com

# Using isin for filtering rows df[df['Customer Country'].isin(['United States', 'Puerto Rico'])]

vbA28资讯网——每日最新资讯28at.com

# Filter rows based on values in a list and select spesific columns df[["Customer Id", "Order Region"]][df['Order Region'].isin(['Central America', 'Caribbean'])]

vbA28资讯网——每日最新资讯28at.com

# Using NOT isin for filtering rows df[~df['Customer Country'].isin(['United States'])]

vbA28资讯网——每日最新资讯28at.com

query():方法用于根据类似sql的条件表达式选择数据。df.query(条件)vbA28资讯网——每日最新资讯28at.com

如果列名包含空格或特殊字符,首先应该使用rename()函数来重命名它们。vbA28资讯网——每日最新资讯28at.com

# Rename the columns before performing the query df.rename(columns={'Order Quantity' : 'Order_Quantity', "Customer Fname" : "Customer_Fname"}, inplace=True)  # Using query for filtering rows with a single condition df.query('Order_Quantity > 3')

vbA28资讯网——每日最新资讯28at.com

# Using query for filtering rows with multiple conditions df.query('Order_Quantity > 3 and Customer_Fname == "Mary"')

vbA28资讯网——每日最新资讯28at.com

between():根据在指定范围内的值筛选行。df[df['column_name'].between(start, end)]vbA28资讯网——每日最新资讯28at.com

# Filter rows based on values within a range df[df['Order Quantity'].between(3, 5)]

vbA28资讯网——每日最新资讯28at.com

字符串方法:根据字符串匹配条件筛选行。例如str.startswith(), str.endswith(), str.contains()vbA28资讯网——每日最新资讯28at.com

# Using str.startswith() for filtering rows df[df['Category Name'].str.startswith('Cardio')]

vbA28资讯网——每日最新资讯28at.com

# Using str.contains() for filtering rows df[df['Customer Segment'].str.contains('Office')]

vbA28资讯网——每日最新资讯28at.com

更新值

loc[]:可以为DataFrame中的特定行和列并分配新值。vbA28资讯网——每日最新资讯28at.com

# Update values in a column based on a condition df.loc[df['Customer Country'] == 'United States', 'Customer Country'] = 'USA'

vbA28资讯网——每日最新资讯28at.com

iloc[]:也可以为DataFrame中的特定行和列并分配新值,但是他的条件是数字索引vbA28资讯网——每日最新资讯28at.com

# Update values in a column based on a condition df.iloc[df['Order Quantity'] > 3, 15] = 'greater than 3'  # condition = df['Order Quantity'] > 3 df.iloc[condition, 15] = 'greater than 3'

vbA28资讯网——每日最新资讯28at.com

replace():用新值替换DataFrame中的特定值。df.['column_name'].replace(old_value, new_value, inplace=True)vbA28资讯网——每日最新资讯28at.com

# Replace specific values in a column df['Order Quantity'].replace(5, 'equals 5', inplace=True)

vbA28资讯网——每日最新资讯28at.com

总结

Python pandas提供了很多的函数和技术来选择和过滤DataFrame中的数据。比如我们常用的 loc和iloc,有很多人还不清楚这两个的区别,其实它们很简单,在Pandas中前面带i的都是使用索引数值来访问的,例如 loc和iloc,at和iat,它们访问的效率是类似的,只不过是方法不一样,我们这里在使用loc和iloc为例做一个简单的说明:vbA28资讯网——每日最新资讯28at.com

loc:根据标签(label)索引,什么是标签呢?vbA28资讯网——每日最新资讯28at.com

行标签就是我们所说的索引(index),列标签就是列名(columns)vbA28资讯网——每日最新资讯28at.com

iloc,根据标签的位置索引。vbA28资讯网——每日最新资讯28at.com

iloc就是 integer loc的缩写。也就是说我们不知道列名的时候可以直接访问的第几行,第几列vbA28资讯网——每日最新资讯28at.com

这样解释应该可以很好理解这两个的区别了。最后如果你看以前(很久以前)的代码可能还会看到ix,它是先于iloc、和loc的。但是现在基本上用iloc和loc已经完全能取代ix,所以ix已经被官方弃用了。如果有看到的话说明这个代码已经很好了,并且完全可以使用iloc替代。vbA28资讯网——每日最新资讯28at.com

最后,通过灵活本文介绍的这些方法,可以更高效地处理和分析数据集,从而更好地理解和挖掘数据的潜在信息。希望这个指南能够帮助你在数据科学的旅程中取得更大的成功!vbA28资讯网——每日最新资讯28at.com


vbA28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-35559-0.htmlPandas中选择和过滤数据的终极指南

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: Python文件操作:高效处理文件的技巧

下一篇: 快速入门 Python sympy 库:解决数学难题从此不再困扰!

标签:
  • 热门焦点
  • 直屏旗舰来了 iQOO 12和K70 Pro同台竞技

    旗舰机基本上使用的都是双曲面屏幕,这就让很多喜欢直屏的爱好者在苦等一款直屏旗舰,这次,你们等到了。据博主数码闲聊站带来的最新爆料称,Redmi下代旗舰K70 Pro和iQOO 12两款手
  • 三言两语说透设计模式的艺术-单例模式

    写在前面单例模式是一种常用的软件设计模式,它所创建的对象只有一个实例,且该实例易于被外界访问。单例对象由于只有一个实例,所以它可以方便地被系统中的其他对象共享,从而减少
  • 一个注解实现接口幂等,这样才优雅!

    场景码猿慢病云管理系统中其实高并发的场景不是很多,没有必要每个接口都去考虑并发高的场景,比如添加住院患者的这个接口,具体的业务代码就不贴了,业务伪代码如下:图片上述代码有
  • 新电商三兄弟,“抖快红”成团!

    来源:价值研究所作 者:Hernanderz 随着内容电商的概念兴起,抖音、快手、小红书组成的“新电商三兄弟”成为业内一股不可忽视的势力,给阿里、京东、拼多多带去了巨大压
  • 阿里瓴羊One推出背后,零售企业迎数字化新解

    作者:刘旷近年来随着数字经济的高速发展,各式各样的SaaS应用服务更是层出不穷,但本质上SaaS大多局限于单一业务流层面,对用户核心关切的增长问题等则没有提供更好的解法。在Saa
  • 网传小米汽车开始筛选交付中心 建筑面积不低于3000平方米

    7月7日消息,近日有微博网友@长三角行健者爆料称,据经销商集团反馈,小米汽车目前已经开始了交付中心的筛选工作,要求候选场地至少有120个车位,建筑不能低
  • 三星获批量产iPhone 15全系屏幕:苹果史上最惊艳直屏

    按照惯例,苹果将继续在今年9月举办一年一度的秋季新品发布会,有传言称发布会将于9月12日举行,届时全新的iPhone 15系列将正式与大家见面,不出意外的话
  • iQOO 11S评测:行业唯一的200W标准版旗舰

    【Techweb评测】去年底,iQOO推出了“电竞旗舰”iQOO 11系列,作为一款性能强机,该机不仅全球首发2K 144Hz E6全感屏,搭载了第二代骁龙8平台及144Hz电竞
  • 苹果140W USB-C充电器:采用氮化镓技术

    据10 月 30 日 9to5 Mac 消息报道,当苹果推出新的 MacBook Pro 2021 时,该公司还推出了新的 140W USB-C 充电器,附赠在 MacBook Pro 16 英寸机型的盒子里,也支
Top