当前位置：首页 > 科技 > 软件

一行 Python 代码搞定训练分类或回归模型

来源：责编：时间：2023-11-10 17:08:02 447观看

导读自动机器学习(Auto-ML)是指自动化数据科学模型开发流水线的组件。AutoML 减少了数据科学家的工作量，并加快了工作流程。AutoML 可用于自动化各种流水线组件，包括数据理解，EDA，数据处理，模型训练，超参数调整等。在本文中，我们

自动机器学习(Auto-ML)是指自动化数据科学模型开发流水线的组件。AutoML 减少了数据科学家的工作量，并加快了工作流程。AutoML 可用于自动化各种流水线组件，包括数据理解，EDA，数据处理，模型训练，超参数调整等。

在本文中，我们将讨论如何使用开放源码的 Python 库 LazyPredict 来自动化模型训练过程。

什么是 LazyPredict ？

LazyPredict 是一个开源的 Python 库，它自动化了模型培训流水线并加快了工作流。LazyPredict 为一个分类数据集训练了大约30个分类模型，为一个回归数据集训练了大约40个回归模型。

Lazypredicate 返回训练好的模型以及它的性能指标，而不需要编写很多代码。我们可以比较每个模型的性能指标，并优化最佳模型以进一步提高性能。

安装

可以通过以下方式从 PyPl 库安装 LazyPredict:

pip install lazypredict

安装完成后，可导入库进行分类和回归模型的自动训练。

from lazypredict.Supervised import LazyRegressor, LazyClassifier

用法

Lazypredicate 同时支持分类和回归问题，因此我们将进行这两个任务的演示：

波士顿住房（回归）和泰坦尼克号（分类）数据集用于演示 LazyPredict 库。

() 分类任务：

LazyPredict 的使用非常直观，类似于 scikit-learn。首先，为分类任务创建一个估计器 LazyClassifier 的实例。可以通过自定义指标进行评估，默认情况下，每个模型都会根据准确度、ROC AUC 分数、F1 分数进行评估。

在进行 lazypredict 预测模型训练之前，必须读取数据集并对其进行处理以使其适合训练。

import pandas as pdfrom sklearn.model_selection import train_test_split# Read the titanic datasetdf_cls = pd.read_csv("titanic.csv")df_cls = df_cls.drop(['PassengerId','Name','Ticket', 'Cabin'], axis=1)# Drop instances with null recordsdf_cls = df_cls.dropna()# feature processingdf_cls['Sex'] = df_cls['Sex'].replace({'male':1, 'female':0})df_cls['Embarked'] = df_cls['Embarked'].replace({'S':0, 'C':1, 'Q':2})# Creating train test splity = df_cls['Survived']X = df_cls.drop(columns=['Survived'], axis=1)# Call train test split on the data and capture the resultsX_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42, test_size=0.2)

经过处理将数据拆分为训练测试数据后，我们可以使用 LazyPredict 进行模型训练。

# LazyClassifier Instance and fiting datacls= LazyClassifier(ignore_warnings=False, custom_metric=None)models, predictions = cls.fit(X_train, X_test, y_train, y_test)

(2)回归任务：

类似于分类模型训练，lazypredicate 提供了用于回归数据集的自动模型训练。实现类似于分类任务，只是对实例 LazyRegressor 进行了更改。

import pandas as pdfrom sklearn.model_selection import train_test_split# read the datacolumn_names = ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV']df_reg = pd.read_csv("housing.csv", header=None, delimiter=r"/s+", names=column_names)# Creating train test splity = df_reg['MEDV']X = df_reg.drop(columns=['MEDV'], axis=1)# Call train_test_split on the data and capture the resultsX_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42, test_size=0.2)

reg = LazyRegressor(ignore_warnings=False, custom_metric=None)models, predictions = reg.fit(X_train, X_test, y_train, y_test)

从以上性能指标来看，AdaBoost 分类器是分类任务的最佳执行模型，而 GradientBoostingRegressor 模型是回归任务的最佳执行模型。

总结

在本文中，我们讨论了 LazyPredict 库的实现，该库可以在几行 Python 代码中训练大约70个分类和回归模型。这是一个非常方便的工具，因为它提供了模型执行情况的总体图像，并且可以比较每个模型的性能。

每个模型都使用其默认参数进行训练，因为它不执行超参数调整。选择性能最佳的模型后，开发人员可以调整模型以进一步提高性能。

本文链接：http://www.28at.com/showinfo-26-20054-0.html一行 Python 代码搞定训练分类或回归模型

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇： Python好用的可视化库（从低级到高级）

下一篇： Python文件读写实战：处理日常任务的终极工具！

标签：

热门焦点

K60至尊版狂暴引擎2.0加持：超177万跑分斩获性能第一

Redmi的后性能时代战略发布会今天下午如期举办，在本次发布会上，Redmi公布了多项关于和联发科的深度合作，以及新机K60 Ultra在软件和硬件方面的特性，例如：“K60 至尊版，双芯旗舰
帅气纯真少年！日本最帅初中生选美冠军出炉

日本第一帅哥初一生选美大赛冠军现已正式出炉，冠军是来自千叶县的宗田悠良。日本一直热衷于各种选美大赛，从“最美JK”起到“最美女星&r
Automa-通过连接块来自动化你的浏览器

1、前言通过浏览器插件可实现自动化脚本的录制与编写，具有代表性的工具就是：Selenium IDE、Katalon Recorder，对于简单的业务来说可快速实现自动化的上手工作。Selenium IDEKat
四年持续更迭坚持探索行业无人之境，HarmonyOS 4带来五大升级多项创新

除了华为每年新发布的旗舰手机系列，上亿花粉更加期待鸿蒙系统每次的跨版本大更新。8月4日，HarmonyOS 4于HDC 2023正式发布，这也是该系统历经四年的再
华为发布HarmonyOS 4：更好玩、更流畅、更安全

在8月4日的华为开发者大会2023（HDC.Together）大会上，HarmonyOS 4正式发布。自2019年发布以来，HarmonyOS一直以用户为中心，经历四年多的发展HarmonyOS已
余承东:AI大模型技术的发展将会带来下一代智能终端操作系统的智慧体验

8月4日消息，2023年华为开发者大会（HDC.Together）今天正式开幕，华为发布HarmonyOS 4、全新升级的鸿蒙开发套件、HarmonyOS Next开发者预览版本等一系列
AI芯片初创公司Tenstorrent获三星和现代1亿美元投资

Tenstorrent是一家由芯片行业资深人士Jim Keller领导的加拿大初创公司，专注于开发人工智能芯片，该公司周三表示，已经从现代汽车集团和三星投资基金等
Counterpoint ：OPPO双旗舰战略全面落地高端产品销量增长22%

2023年6月30日，全球行业分析机构Counterpoint Research发布的《中国智能手机高端市场白皮书》显示，中国智能手机品牌正在寻求高质量发展，中国高端智能
联想YOGA 16s 2022笔记本将要推出，屏幕支持触控功能

联想此前宣布，将于11月2日19:30召开联想秋季轻薄新品发布会，推出联想 YOGA 16s 2022 笔记本等新品。官方称，YOGA 16s 2022 笔记本将搭载 16 英寸屏幕，并且是一

一行 Python 代码搞定训练分类或回归模型

什么是 LazyPredict ？

安装

用法

总结

K60至尊版狂暴引擎2.0加持：超177万跑分斩获性能第一

帅气纯真少年！日本最帅初中生选美冠军出炉

Automa-通过连接块来自动化你的浏览器

四年持续更迭坚持探索行业无人之境，HarmonyOS 4带来五大升级多项创新

华为发布HarmonyOS 4：更好玩、更流畅、更安全

余承东:AI大模型技术的发展将会带来下一代智能终端操作系统的智慧体验

AI芯片初创公司Tenstorrent获三星和现代1亿美元投资

Counterpoint ：OPPO双旗舰战略全面落地高端产品销量增长22%

联想YOGA 16s 2022笔记本将要推出，屏幕支持触控功能

最新推荐

猜你喜欢

热门推荐

相关资讯