当前位置:首页 > 科技  > 软件

数据分析必会的十个 Python 库

来源: 责编: 时间:2024-02-01 12:51:57 153观看
导读Scikit-learnScikit-learn 是一个功能强大的机器学习库,为监督和无监督学习、模型选择和预处理提供了广泛的算法。Scikit-learn 简化了构建机器学习模型的过程,使其成为数据科学家和分析师的热门选择。可以通过 pip 命

Scikit-learn

gYe28资讯网——每日最新资讯28at.com

Scikit-learn 是一个功能强大的机器学习库,为监督和无监督学习、模型选择和预处理提供了广泛的算法。Scikit-learn 简化了构建机器学习模型的过程,使其成为数据科学家和分析师的热门选择。gYe28资讯网——每日最新资讯28at.com

可以通过 pip 命令来进行安装。gYe28资讯网——每日最新资讯28at.com

pip install scikit-learn

以下是导入和使用 scikit-learn 的方法。gYe28资讯网——每日最新资讯28at.com

import numpy as npimport pandas as pdfrom sklearn.model_selection import train_test_splitfrom sklearn.linear_model import LogisticRegressiondf = pd.read_csv('data.csv')X = df.drop('target', axis=1)y = df['target']X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)model = LogisticRegression().fit(X_train, y_train)y_pred = model.predict(X_test)

Statsmodels

Statsmodels 是一个面向统计的模块,用于数据分析、统计推断和数据建模。它提供了模型拟合、假设检验等工具。Statsmodels 对于生成统计数据和假设检验结果特别有用。gYe28资讯网——每日最新资讯28at.com

同样,我们也可以直接使用 pip 来安装它。gYe28资讯网——每日最新资讯28at.com

pip install statsmodels

以下是导入和使用 Scipy 的方法。gYe28资讯网——每日最新资讯28at.com

import statsmodels.api as smimport pandas as pddf = pd.read_csv('data.csv')model = sm.OLS(endog=df['target'], exog=df[['X1', 'X2']])results = model.fit()print(results.summary())

Scipy

SciPy 是基于 Python 的一个重要科学计算库,它构建在 NumPy 的基础上,提供了大量的数学算法和函数工具,主要用于科学和工程领域的计算。gYe28资讯网——每日最新资讯28at.com

要安装 Scipy,请在终端中运行以下命令。gYe28资讯网——每日最新资讯28at.com

pip install scipy

以下是导入和使用 Scipy 的方法。gYe28资讯网——每日最新资讯28at.com

import numpy as npfrom scipy.optimize import minimizedef objective(x):    return np.sum((x[0] - x[1])**2)start = np.array([1, 1])opt = minimize(objective, start, method='TNC')print(opt.x)

TensorFlow

TensorFlow 是一个开源平台,用于构建机器学习模型以及训练、评估和部署它们。它使用 GPU 和 TPU 提供加速计算,并支持跨多个 CPU、GPU 或 TPU 设备进行分布式训练。gYe28资讯网——每日最新资讯28at.com

以下是导入和使用 TensorFlow 的方法。gYe28资讯网——每日最新资讯28at.com

import tensorflow as tfmodel = tf.keras.Sequential([     tf.keras.layers.Dense(64, input_shape=(1000,)),     tf.keras.layers.Dense(1),     tf.keras.layers.Activation('sigmoid') ])model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])model.fit(x_train, y_train, epochs=100, validation_split=0.2)

Keras

Keras 是一个开源神经网络库,用 Python 编写,能够在 TensorFlow 和 CNTK 上运行。它提供了更高层次的抽象,可以快速高效地构建深度学习模型。gYe28资讯网——每日最新资讯28at.com

以下是导入和使用 Keras 的方法。gYe28资讯网——每日最新资讯28at.com

import kerasfrom keras.models import Sequentialfrom keras.layers import Densemodel = Sequential()model.add(Dense(64, input_shape=(1000,)))model.add(Dense(1))model.add(Dense(1, activation='sigmoid'))model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])model.fit(x_train, y_train, epochs=100, validation_split=0.2)

PyTorch

PyTorch 是一个开源的机器学习库,广泛用于计算机视觉和自然语言处理等应用领域。PyTorch 以其易于使用和灵活性而闻名,特别适用于深度学习和神经网络的研究与开发。gYe28资讯网——每日最新资讯28at.com

以下是导入和使用 PyTorch 的方法。gYe28资讯网——每日最新资讯28at.com

import torchimport torch.nn as nnimport torch.optim as optim# 创建一个简单的线性模型model = nn.Linear(in_features=1, out_features=1)# 定义损失函数和优化器criterion = nn.MSELoss()optimizer = optim.SGD(model.parameters(), lr=0.01)# 示例数据x_train = torch.tensor([[1.0], [2.0], [3.0]])y_train = torch.tensor([[2.0], [4.0], [6.0]])# 训练模型for epoch in range(1000):    model.train()    optimizer.zero_grad()        # 正向传播    y_pred = model(x_train)        # 计算损失    loss = criterion(y_pred, y_train)        # 反向传播和优化    loss.backward()    optimizer.step()# 测试模型model.eval()with torch.no_grad():    y_pred = model(torch.tensor([[4.0]]))    print(y_pred)

PySpark

PySpark 是 Apache Spark 的 Python 模块。它提供了用于大数据处理的 Python 高级 API,并支持关系数据源和 NoSQL 数据源。PySpark 提供丰富的数据框架和 SQL 功能。gYe28资讯网——每日最新资讯28at.com

import pyspark.sql.functions as Fdf = spark.createDataFrame([(1, 'A'), (2, 'B'), (3, 'C'), (4, 'B')], ['id', 'word'])result = df.groupBy('word').count().orderBy('count', ascending=False)result.show()

Requests

Requests 是一种发送 HTTP 请求并处理其响应的简单、灵活且可重用的方式。它提供了对类 UNIX 代码定制和技术的快速访问。gYe28资讯网——每日最新资讯28at.com

要安装 Requests,请在终端中运行以下命令。gYe28资讯网——每日最新资讯28at.com

pip install requests

以下是导入和使用请求的方法。gYe28资讯网——每日最新资讯28at.com

import requestsresponse = requests.get('https://example.com')print(response.status_code)

BeautifulSoup

BeautifulSoup 是一个用于从 HTML 和 XML 文档中提取数据的 Python 库。它创建了文档的解析树,使得用户可以方便地提取数据。gYe28资讯网——每日最新资讯28at.com

要安装 BeautifulSoup,请在终端中运行以下命令。gYe28资讯网——每日最新资讯28at.com

pip install beautifulsoup4

以下是导入和使用 BeautifulSoup 的方法。gYe28资讯网——每日最新资讯28at.com

from bs4 import BeautifulSouphtml = '<ul><li>1</li><li>2</li><li>3</li></ul>'soup = BeautifulSoup(html, 'html.parser')li_list = soup.find_all('li')for li in li_list:    print(li.get_text())

Flask

Flask 是一个用 Python 编写的轻量级 Web 应用框架。它被广泛用于快速开发简单的网站和 API。gYe28资讯网——每日最新资讯28at.com

from flask import Flaskapp = Flask(__name__)@app.route('/')def hello():     return 'Hello, World!'app.run()

本文链接:http://www.28at.com/showinfo-26-70471-0.html数据分析必会的十个 Python 库

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 十个Python编程小技巧

下一篇: 2023年哪个前端框架用的最多?用数据说话

标签:
  • 热门焦点
  • 小米降噪蓝牙耳机Necklace分享:听一首歌 读懂一个故事

    小米降噪蓝牙耳机Necklace分享:听一首歌 读懂一个故事

    在今天下午的小米Civi 2新品发布会上,小米还带来了一款新的降噪蓝牙耳机Necklace,我们也在发布结束的第一时间给大家带来这款耳机的简单分享。现在大家能见到最多的蓝牙耳机
  • 印度登月最关键一步!月船三号今晚进入环月轨道

    印度登月最关键一步!月船三号今晚进入环月轨道

    8月5日消息,据印度官方消息,月船三号将于北京时间今晚21时30分左右开始近月制动进入环月轨道。这是该探测器能够成功的最关键步骤之一,如果成功将开始围
  • JavaScript 混淆及反混淆代码工具

    JavaScript 混淆及反混淆代码工具

    介绍在我们开始学习反混淆之前,我们首先要了解一下代码混淆。如果不了解代码是如何混淆的,我们可能无法成功对代码进行反混淆,尤其是使用自定义混淆器对其进行混淆时。什么是混
  • Rust中的高吞吐量流处理

    Rust中的高吞吐量流处理

    作者 | Noz编译 | 王瑞平本篇文章主要介绍了Rust中流处理的概念、方法和优化。作者不仅介绍了流处理的基本概念以及Rust中常用的流处理库,还使用这些库实现了一个流处理程序
  • CSS单标签实现转转logo

    CSS单标签实现转转logo

    转转品牌升级后更新了全新的Logo,今天我们用纯CSS来实现转转的新Logo,为了有一定的挑战性,这里我们只使用一个标签实现,将最大化的使用CSS能力完成Logo的绘制与动画效果。新logo
  • 服务存储设计模式:Cache-Aside模式

    服务存储设计模式:Cache-Aside模式

    Cache-Aside模式一种常用的缓存方式,通常是把数据从主存储加载到KV缓存中,加速后续的访问。在存在重复度的场景,Cache-Aside可以提升服务性能,降低底层存储的压力,缺点是缓存和底
  • 电视息屏休眠仍有网络上传 爱奇艺被质疑“薅消费者羊毛”

    电视息屏休眠仍有网络上传 爱奇艺被质疑“薅消费者羊毛”

    记者丨宁晓敏 见习生丨汗青出品丨鳌头财经(theSankei) 前不久,爱奇艺发布了一份亮眼的一季报,不仅营收和会员营收创造历史最佳表现,其运营利润也连续6个月实现增长。自去年年初
  • 网红炒股不为了赚钱,那就是耍流氓!

    网红炒股不为了赚钱,那就是耍流氓!

    来源:首席商业评论6月26日高调宣布入市,网络名嘴大v胡锡进居然进军了股市。在一次财经媒体峰会上,几个财经圈媒体大佬就&ldquo;胡锡进炒股是否知道认真报道&rdquo;展开讨论。有
  • iQOO Neo8系列新品发布会

    iQOO Neo8系列新品发布会

    旗舰双芯 更强更Pro
Top