当前位置：首页 > 科技 > 软件

Pandas入门的12个技巧

来源：责编：时间：2024-01-03 17:22:15 357观看

导读今天，就为大家总结一下 “Pandas数据处理的12技巧”，拿来即用，随查随用。今天，就为大家总结一下 “Pandas数据处理的12技巧”，拿来即用，随查随用。1. 安装你还可以使用内置的 Python 工具 pip 安装 Pandas 并运行以下命令:$

今天，就为大家总结一下 “Pandas数据处理的12技巧”，拿来即用，随查随用。

1. 安装

你还可以使用内置的 Python 工具 pip 安装 Pandas 并运行以下命令:

$ pip install pandas

安装完成后的提示成功，则可以环境中使用pandas包了。

import pandas

2. 创建数据列

Pandas一维数组(数据列)可以保存任何数据类型。一般通过调用 pd.Series() 方法实现，不指定index，默认为0,1,2,3...。

import pandasimport numpyS = pandas.Series(    [1, 2, 3, 4],  # 数据    index=["a", "b", "c", "d"],  # 指定索引    dtype=numpy.int8,  # 指定数据类型)S.name = "test"  # 创建一维数组的名称S.index.name = "index"  # 创建一维数组的索引名称print(S)

输出:

indexa    1b    2c    3d    4Name: test, dtype: int8

3. 创建数据框

创建具有列的二维数据结构的对象(数据框)。一般通过调用 pd.DataFrame() 方法实现，不指定index，默认为0,1,2,3...。

import pandasdat_list = [    [1, 2, 3],    [4, 6, 8],    [10, 11, 12],]df = pandas.DataFrame(    dat_list,    index=["i1", "i3", "i2"],    columns=["a", "b", "c"],)print(df)

输出:

a   b   ci1   1   2   3i3   4   6   8i2  10  11  12

4. CSV文件的读写

Pandas 支持从 CSV的读写，我们用 pd.read_csv() 和 pd.to_csv() 方法来实现。

import pandasd = {    "A": [1, 2, 3],    "B": [4, 5, 6],    "C": [7, 8, 9],    "D": [10, 11, 12],}df = pandas.DataFrame(d, index=["i2", "i1", "i3"])print(df)df.to_csv("output/test.csv") # 导出到CSV文件dfnew = pandas.read_csv("output/test.csv", index_col=0) # index_col=0 表示第一列为索引print(dfnew)

5. Excel文件的读写

Pandas 支持从 Excel的读写，我们用 pd.read_excel() 和 pd.to_excel() 方法来实现。

import pandasd = {    "A": [1, 2, 3],    "B": [4, 5, 6],    "C": [7, 8, 9],    "D": [10, 11, 12],}df = pandas.DataFrame(d, index=["i2", "i1", "i3"])print(df)df.to_excel("output/test.xlsx") # 导出到exceldfnew = pandas.read_excel("output/test.xlsx", index_col=0) # index_col=0 表示第一列为索引print(dfnew)

6. 通过位置选择值

Pandas 支持通过位置选择值，我们用 df.iloc[row_index, column_index] 来实现。

import pandasd = {    "A": [1, 2, 3],    "B": [4, 5, 6],    "C": [7, 8, 9],    "D": [10, 11, 12],}df = pandas.DataFrame(d, index=["i2", "i1", "i3"])print(df)print(df.iloc[2, 1])  # 6 结果为一个值print(df.iloc[[2], [1]])  # 结果为一个元素的数据框print(df.iloc[1:3, :])  # 结果为一个数据框

输出:

A  B  C   Di2  1  4  7  10i1  2  5  8  11i3  3  6  9  126    Bi3  6    A  B  C   Di1  2  5  8  11i3  3  6  9  12

7. 通过名称选择值

Pandas 支持通过名称选择值，我们用 df.loc[row_name, column_name] 来实现。

import pandasd = {    "A": [1, 2, 3],    "B": [4, 5, 6],    "C": [7, 8, 9],    "D": [10, 11, 12],}df = pandas.DataFrame(d, index=["i2", "i1", "i3"])print(df)print(df.loc["i2", "C"])  # 6 结果为一个值print(df.loc[["i2"], ["C"]])  # 结果为一个元素的数据框print(df.loc[["i2", "i3"], ["A", "D"]])  # 切片

输出:

A  B  C   Di2  1  4  7  10i1  2  5  8  11i3  3  6  9  127    Ci2  7    A   Di2  1  10i3  3  12

8. 标签可以重复么？

这是一个有意思的问题，如果重复了如何取值呢，如何去掉重复呢？

import pandasd = {    "A": [1, 2, 3],    "B": [4, 5, 6],    "C": [7, 8, 9],    "D": [10, 11, 12],}df = pandas.DataFrame(d, index=["i2", "i1", "i2"])print(df)print(df.loc["i2", "C"])df.columns = ["A", "B", "B", "D"]print(df)print(df.loc["i2", "B"])

输出:

A  B  C   Di2  1  4  7  10i1  2  5  8  11i2  3  6  9  12i2    7i2    9Name: C, dtype: int64    A  B  B   Di2  1  4  7  10i1  2  5  8  11i2  3  6  9  12    B  Bi2  4  7i2  6  9

9. 删除行/列

Pandas 支持删除行/列，我们用 df.drop([col/row name], axis=0/1) 来实现。

import pandasd = {    "A": [1, 2, 3],    "B": [4, 5, 6],    "C": [7, 8, 9],    "D": [10, 11, 12],}df = pandas.DataFrame(d, index=["i2", "i1", "i3"])print(df)df.drop(    ["i2", "i1"],    axis=0,  # axis=0删除行，axis=1删除列    inplace=True, # 如果为True，则在原数据上进行操作，否则，创建一个新的数据对象    errors="ignore",  # 忽略不存在的列)print(df)

输出:

A  B  C   Di2  1  4  7  10i1  2  5  8  11i3  3  6  9  12    A  B  C   Di3  3  6  9  12

10. 在最后增加列

import pandasd = {    "A": [1, 2, 3],    "B": [4, 5, 6],    "C": [7, 8, 9],    "D": [10, 11, 12]}df = pandas.DataFrame(d, index=["i2", "i1", "i3"])print(df)df['E'] = 0print(df)

输出为:

A  B  C   Di2  1  4  7  10i1  2  5  8  11i3  3  6  9  12    A  B  C   D  Ei2  1  4  7  10  0i1  2  5  8  11  0i3  3  6  9  12  0

11. 在最后增加行

import pandasd = {    "A": [1, 2, 3],    "B": [4, 5, 6],    "C": [7, 8, 9],    "D": [10, 11, 12],}df = pandas.DataFrame(d, index=["i2", "i1", "i3"])print(df)df = df.append(    pandas.DataFrame({"A": 13, "B": 14, "C": 15, "D": 16}, index=["i4"]),    ignore_index=True,)print(df)

输出：

A  B  C   Di2  1  4  7  10i1  2  5  8  11i3  3  6  9  12    A   B   C   D0   1   4   7  101   2   5   8  112   3   6   9  123  13  14  15  16

12. 通过标签(索引或列名)排序

import pandasd = {    "A": [1, 2, 3],    "B": [4, 5, 6],    "C": [7, 8, 9],    "D": [10, 11, 12]}df = pandas.DataFrame(d, index=["i2", "i1", "i3"])print(df)df = df.sort_index(    axis=0, # axis=0 按行标签排序，axis=1 按列标签排序    level=None,    ascending=True, # 是否升序    inplace=False, # 是否修改原数据    kind="quicksort", # 排序算法    na_positinotallow="last", # 如果有NA值，放在最后    sort_remaining=True, # 是否排序剩余列)print(df)

输出:

A  B  C   Di2  1  4  7  10i1  2  5  8  11i3  3  6  9  12    A  B  C   Di1  2  5  8  11i2  1  4  7  10i3  3  6  9  12

总结

上面分享的pandas入门的12个技巧，希望对你有所帮助。

本文链接：http://www.28at.com/showinfo-26-57288-0.htmlPandas入门的12个技巧

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：加速Python循环的12种方法,最高可以提速900倍

下一篇：掌握这个技术，给轮播图和文本插上自由之翼

标签：

热门焦点

中兴AX5400Pro+上手体验：再升级双2.5G网口+USB 3.0这次全都有

2021年11月的时候，中兴先后发布了两款路由器产品，中兴AX5400和中兴AX5400 Pro，从产品命名上就不难看出这是隶属于同一系列的，但在外观设计上这两款产品可以说是完全没一点关系
Raft算法：保障分布式系统共识的稳健之道

1. 什么是Raft算法？Raft 是英文”Reliable、Replicated、Redundant、And Fault-Tolerant”（“可靠、可复制、可冗余、可容错”）的首字母缩写。Raft算法是一种用于在分布式系统
三言两语说透柯里化和反柯里化

JavaScript中的柯里化(Currying)和反柯里化(Uncurrying)是两种很有用的技术，可以帮助我们写出更加优雅、泛用的函数。本文将首先介绍柯里化和反柯里化的概念、实现原理和应用
腾讯盖楼，字节拆墙

来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之“想重温暴刷深渊、30+技能搭配暴搓到爽的游戏体验吗？一起上晶核，即刻暴打！”曾凭借直播腾讯旗下代理格斗游戏《DNF》一
签约井川里予、何丹彤，单视频点赞近千万，MCN黑马永恒文希快速崛起！

来源：视听观察永恒文希传媒作为一家MCN公司，说起它的名字来，可能大家会觉得有点儿陌生，但是说出来下面一串的名字之后，或许大家就会感到震惊，原来这么多网红，都签约这家公司了。根
郭明錤称华为和江淮汽车合作开发问界MPV，定价100万左右、计划明年量产

8 月 1 日消息，郭明錤今天在 Medium 平台发布博文，称华为正在和江淮汽车合作，开发售价在 100 万元的问界 MPV，预计在 2024 年第 2 季度量产，销量目标为
华为Mate60标准版细节曝光：经典星环相机模组回归

这段时间以来，关于华为新旗舰的爆料日渐密集。据此前多方爆料，今年华为将开始恢复一年双旗舰战略，除上半年推出的P60系列外，往年下半年的Mate系列也将
OPPO K11评测：旗舰级IMX890加持 2000元档最强影像手机

【Techweb评测】中端机型用户群体巨大，占了中国目前手机市场的大头，一直以来都是各手机品牌的“必争之地”，其中OPPO K系列机型一直以来都以高品质、
英特尔Xe-HP项目终止，将专注Xe-HPC/HPG系列显卡

据10 月 31 日消息报道，英特尔高级副总裁兼加速计算系统和图形事业部总经理表示，Xe-HP“ Arctic Sound” 系列服务器 GPU 已经应用于 oneAPI devcloud 云服

Pandas入门的12个技巧

1. 安装

2. 创建数据列

3. 创建数据框

4. CSV文件的读写

5. Excel文件的读写

6. 通过位置选择值

7. 通过名称选择值

8. 标签可以重复么？

9. 删除行/列

10. 在最后增加列

11. 在最后增加行

12. 通过标签(索引或列名)排序

总结

中兴AX5400Pro+上手体验：再升级双2.5G网口+USB 3.0这次全都有

Raft算法：保障分布式系统共识的稳健之道

三言两语说透柯里化和反柯里化

腾讯盖楼，字节拆墙

签约井川里予、何丹彤，单视频点赞近千万，MCN黑马永恒文希快速崛起！

郭明錤称华为和江淮汽车合作开发问界MPV，定价100万左右、计划明年量产

华为Mate60标准版细节曝光：经典星环相机模组回归

OPPO K11评测：旗舰级IMX890加持 2000元档最强影像手机

英特尔Xe-HP项目终止，将专注Xe-HPC/HPG系列显卡

最新推荐

猜你喜欢

热门推荐

相关资讯