当前位置：首页 > 科技 > 软件

使用回调函数训练YOLO模型

来源：责编：时间：2024-07-23 07:22:52 433观看

导读大多数人可能熟悉如何训练计算机视觉模型，比如流行的YOLO模型，甚至知道如何使用这些模型进行预测。但你知道我们可以通过回调函数为这些模型增加一些灵活性，以便在模型训练和模型推断中使用吗？大多数最先进的（SOTA）YOLO模型

大多数人可能熟悉如何训练计算机视觉模型，比如流行的YOLO模型，甚至知道如何使用这些模型进行预测。但你知道我们可以通过回调函数为这些模型增加一些灵活性，以便在模型训练和模型推断中使用吗？大多数最先进的（SOTA）YOLO模型，如YOLOv8和YOLO-NAS，都实现了回调函数，我们可以调整这些函数以有效地利用我们的计算机视觉模型的训练和推断。

考虑以下情景。假设你是一名计算机视觉工程师，与团队中的许多工程师一起工作。你正在使用自定义数据集训练自定义的计算机视觉模型（也许是YOLO），以实现一些业务逻辑。你负责实现训练和推断逻辑。除此之外，你还需要报告模型的训练进度、训练模型的准确性等。作为一名工程师，你决定在很多个epoch上训练你的模型，这可能需要几天的时间，具体取决于一些因素，比如数据集的数量、服务器资源等。你需要密切关注模型的训练进度，因为由于诸如服务器资源问题等原因，模型可能在一段时间后停止训练，导致训练崩溃。你可能也希望在模型训练完成后收到自动警报，比如在训练结束后收到带有验证指标的电子邮件，或者在模型训练完成后自动向团队负责人发送报告。这些以及许多其他事情都是你作为计算机视觉工程师可能想要做的事情。

要实现以上任何一种情况，我们需要一种回调函数。这就是在训练计算机视觉模型时回调函数的作用。好消息是，大多数SOTA YOLO模型默认实现了这些回调函数。例如，默认情况下，YOLOv8和YOLO-NAS实现了这些回调函数，你可以在训练或进行模型预测时有效地利用它们。在本文章中，我将向你展示一些示例，演示在训练YOLO模型时如何使用回调函数。在本例中，我将使用YOLOv8，但请注意，这可以扩展到其他一些YOLO模型，比如YOLO-NAS。

让我们继续演示如何在YOLOv8上实现回调函数。我们将编写代码并在自定义数据集上训练我们的模型。我们将实现回调函数。其中一个功能是在模型训练结束后向我们的团队工程师发送电子邮件。我们发送的电子邮件将包含受过训练模型的报告，如指标、训练模型所花费的时间等。

项目实施步骤

第1步：创建一个文件夹并给它命名（在我的案例中，我将我的文件夹命名为“yolo_with_callbacks”）。

在你创建的文件夹中，创建一个新的文本文件（requirements.txt）并添加以下内容：

opencv-python==4.8.1.78Pillow==10.0.1tqdm==4.66.1ultralytics==8.1.2python-dotenv==1.0.1

然后，在你的项目文件夹中创建一个Python虚拟环境，并安装requirements.txt文件中列出的依赖项。

python3 -m venv env

接下来，通过运行以下命令激活新创建的虚拟环境：

source env/bin/activate  # if you are using Ubuntusource env/Scripts/activate  # if you are using Windows

然后，通过运行以下命令安装依赖项：

pip install -r requirements.txt

第2步：下载一个用于自定义模型训练的示例数据集。

你可以使用任何你选择的数据集，只要注释是以YOLO格式提供的即可。在我的案例中，为了本教程的目的，我将使用来自Roboflow的POTHOLE数据集，你可以从这个链接下载：POTHOLE数据集。下载数据集后，你将得到三个文件夹（train、val和test）。现在，在你的项目目录中创建一个数据集文件夹，并将你下载的数据集（train、val和test）复制到这个文件夹中。你的数据集文件夹应该如下所示：

Datasets    └── train        ├── images        └── labels    └── val        ├── images        └── labels    └── test        ├── images        └── labels

接下来，在项目根目录中创建一个数据集配置文件（我们称之为data.yaml）并在YAML文件中添加以下内容：

train: ./dataset/train/imagesval: ./dataset/val/imagestest: ./dataset/test/imagesnc: 1names: ['pothole']

第3步：创建模型训练脚本。

接下来，我们需要编写代码来使用我们的自定义数据集训练模型。之后，我们将继续实现模型的回调函数，这是本教程的唯一目的。现在，在你的项目根目录中创建一个新文件（命名为training.py）。在这个training.py文件中，我们将实现模型训练和回调函数。首先，让我们编写一个用于训练YOLOV8模型的函数：

def train_yolov8_model(config_path, num_epochs, training_result_dir):        model = YOLO("yolov8x.pt")        model.add_callback("on_train_start", on_train_start)        model.add_callback("on_train_epoch_end", on_train_epoch_end)        model.add_callback("on_train_end", on_train_end)        model.start_time = datetime.now()        start_time = datetime.now().strftime("%Y-%m-%d %H:%M:%S")        # Train the model        model.train(            data=config_path,            name="Yolo_Model_Training",            project=training_result_dir,            task="detect",            epochs=num_epochs,            patience=20,            batch=16,            cache=True,            imgsz=640,            iou=0.5,            augment=True,            degrees=25.0,            fliplr=0.0,            lr0=0.0001,            optimizer="Adam",            device=device,        )

注意：函数参数中的config_path是我们之前创建的数据集yaml配置文件。我们稍后将定义的回调函数，就像model.add_callback这样的调用，稍等一下。

接下来，让我们实现回调函数。在这种情况下，我们将要实现的回调函数包括：on_train_start、on_train_epoch_end和on_train_end。on_train_start回调是在模型开始训练时立即触发的回调函数。on_train_epoch_end是在每个epoch结束后立即触发的回调函数。on_train_end是在模型完成训练后触发的回调函数。

实现回调函数

   def on_train_start(trainer):        start_time = datetime.now()    def on_train_epoch_end(trainer):        curr_epoch = trainer.epoch + 1        text = f"Epoch Number: {curr_epoch}/{trainer.epochs} finished"        print(text)        print("-" * 50)

对于on_train_start回调，我们需要追踪模型开始训练的确切时间。你实际上可以在这里实现更复杂的逻辑。对于on_train_epoch_end，我们只是获取了当前epoch并打印出来。这只是一个简单的演示。我们可以在这里实现更复杂的逻辑。例如，如果我们有一个用户正在从中训练模型的前端应用程序，我们可以在每个epoch结束后更新GUI的训练进度条。我们可以在这个函数中实现这个功能。

现在，让我们继续实现本教程的主要逻辑。我们将继续实现on_train_end回调函数。如前所述，此函数仅在模型训练成功完成后触发。在我们的情况下，我们想要发送一个包含模型训练报告的电子邮件给我们的团队工程师。为了实现这一点，首先，让我们编写一个发送电子邮件的函数。我们将使用Gmail发送电子邮件。

以下是发送电子邮件的函数：

 def send_email(        body,        from_email=FROM_EMAIL,        to_emails=RECIPENT_EMAIL,        subject=subject,        api=EMAIL_API_KEY,    ):        msg = MIMEMultipart()        msg["From"] = from_email        msg["To"] = to_emails        msg["Subject"] = subject        msg.attach(MIMEText(body, "html"))        try:            smtp_server = smtplib.SMTP("smtp.gmail.com", 587)            smtp_server.starttls()            smtp_server.login(from_email, api)            smtp_server.sendmail(from_email, to_emails, msg.as_string())            smtp_server.quit()            print("Email sent.")        except Exception as e:            print("Email not sent", e)

但请注意，我们需要将诸如EMAIL API KEY、SENDER EMAIL等秘密凭证存储到一个环境文件中。基于此，请在你的项目根目录中创建一个新文件（命名为.env）。在.env文件中，添加以下示例内容。

EMAIL_API_KEY=your Gmail app password goes hereEMAIL_ACCOUNT=your Gmail account which you created app password goes hereRECIPENT_EMAIL=the email address you will be sending the report email goes here.

现在，让我们继续实现回调函数（on_train_end），该函数将在模型训练成功完成后触发发送电子邮件功能。

  def on_train_end(trainer):        trainer_epoch = trainer.epoch        trainer_metrics = trainer.metrics        current_time = datetime.now().strftime("%Y-%m-%d %H:%M:%S")        end_time = datetime.now()        time_taken = end_time - start_time        hours, remainder = divmod(time_taken.total_seconds(), 3600)        minutes, seconds = divmod(remainder, 60)        time_taken_str = ""        if int(hours) > 0:            time_taken_str += f"{int(hours)} hr "        if int(minutes) > 0:            time_taken_str += f"{int(minutes)} mins "        if int(seconds) > 0:            time_taken_str += f"{int(seconds)} secs"        time_taken_str = time_taken_str.strip()        body = f"""        <html>            <head>                <style>                    table, th, td {{                        border: 1px solid black;                        border-collapse: collapse;                        padding: 5px;                    }}</style>            </head>            <body>                <h1>Training Report</h1>                <p>Date and Time: {current_time}</p>                <p>Total Epoch Trained: {trainer_epoch + 1} </p>                <p>Time Taken to Train Model: {time_taken_str} </p>                <table>                    <tr>                        <th>Metric</th>                        <th>Value</th>                    </tr>                    {''.join([f'<tr><td>{k}</td><td>{v:.2f}</td></tr>' for k, v in trainer_metrics.items()])}                </table>            </body>        </html>        """        send_email(body)

以上回调函数将在模型训练完成后向指定收件人发送报告邮件。现在，我们已经编写了所有必要的函数，将它们全部封装在一个名为ModelTraining的类中是一个好主意。所以，我们training.py文件中的完整代码现在应该如下所示：

import osfrom datetime import datetimefrom dotenv import find_dotenv, load_dotenvimport torchfrom ultralytics import YOLOimport smtplibfrom email.mime.text import MIMETextfrom email.mime.multipart import MIMEMultipartload_dotenv(find_dotenv())EMAIL_API_KEY = os.getenv("EMAIL_API_KEY")FROM_EMAIL = os.getenv("EMAIL_ACCOUNT")RECIPIENT_EMAIL = os.getenv("RECIPIENT_EMAIL")subject = "Model Training Completed"class ModelTraining:    def __init__(self):        self.device = torch.device("cuda" if torch.cuda.is_available() else "cpu")        self.start_time = None        self.end_time = None    def send_email(        self,        body,        from_email=FROM_EMAIL,        to_emails=RECIPIENT_EMAIL,        subject=subject,        api=EMAIL_API_KEY,    ):        msg = MIMEMultipart()        msg["From"] = from_email        msg["To"] = to_emails        msg["Subject"] = subject        msg.attach(MIMEText(body, "html"))        try:            smtp_server = smtplib.SMTP("smtp.gmail.com", 587)            smtp_server.starttls()            smtp_server.login(from_email, api)            smtp_server.sendmail(from_email, to_emails, msg.as_string())            smtp_server.quit()            print("Email sent.")        except Exception as e:            print("Email not sent", e)    def on_train_start(self, trainer):        self.start_time = datetime.now()    def on_train_epoch_end(self, trainer):        curr_epoch = trainer.epoch + 1        text = f"Epoch Number: {curr_epoch}/{trainer.epochs} finished"        print(text)        print("-" * 50)    def on_train_end(self, trainer):        trainer_epoch = trainer.epoch        trainer_metrics = trainer.metrics        current_time = datetime.now().strftime("%Y-%m-%d %H:%M:%S")        self.end_time = datetime.now()        time_taken = self.end_time - self.start_time        hours, remainder = divmod(time_taken.total_seconds(), 3600)        minutes, seconds = divmod(remainder, 60)        time_taken_str = ""        if int(hours) > 0:            time_taken_str += f"{int(hours)} hr "        if int(minutes) > 0:            time_taken_str += f"{int(minutes)} mins "        if int(seconds) > 0:            time_taken_str += f"{int(seconds)} secs"        time_taken_str = time_taken_str.strip()        body = f"""        <html>            <head>                <style>                    table, th, td {{                        border: 1px solid black;                        border-collapse: collapse;                        padding: 5px;                    }}                </style>            </head>            <body>                <h1>Training Report</h1>                <p>Date and Time: {current_time}</p>                <p>Total Epochs Trained: {trainer_epoch + 1} </p>                <p>Time Taken to Train Model: {time_taken_str} </p>                <table>                    <tr>                        <th>Metric</th>                        <th>Value</th>                    </tr>                    {''.join([f'<tr><td>{k}</td><td>{v:.2f}</td></tr>' for k, v in trainer_metrics.items()])}                </table>            </body>        </html>        """        self.send_email(body)    def train_yolov8_model(self, config_path, num_epochs, training_result_dir):        model = YOLO("yolov8x.pt")        model.add_callback("on_train_start", self.on_train_start)        model.add_callback("on_train_epoch_end", self.on_train_epoch_end)        model.add_callback("on_train_end", self.on_train_end)        model.start_time = datetime.now()        start_time = datetime.now().strftime("%Y-%m-%d %H:%M:%S")        # Train the model        model.train(            data=config_path,            name="Yolo_Model_Training",            project=training_result_dir,            task="detect",            epochs=num_epochs,            patience=20,            batch=16,            cache=True,            imgsz=640,            iou=0.5,            augment=True,            degrees=25.0,            fliplr=0.0,            lr0=0.0001,            optimizer="Adam",            device=self.device,        )        model.end_time = datetime.now()if __name__ == "__main__":    model_training = ModelTraining()    # Load the dataset configuration file    current_dir = os.path.dirname(os.path.abspath(__file__))    config_path = os.path.join(current_dir, "data.yaml")    num_epochs = 40  # Change it to any number of epochs you want.    training_result_path = "./results"    os.makedirs(training_result_path, exist_ok=True)    model_training.train_yolov8_model(config_path, num_epochs, training_result_path)

完整的项目结构应该如下所示：

yolo_with_callback/│├── dataset/            # Directory containing dataset files│├── env/                # python virtual environment directory│          │── .env                # Environment variables file containing secret keys├── results/            # Directory for storing training results│├── data.yaml           # Dataset configuration file│├── requirements.txt    # File listing required Python packages│└── training.py         # Main script for model training

现在，你已经完成了实现，可以继续运行training.py代码。训练完成后，训练结果报告将发送到指定的收件人邮箱。

本文链接：http://www.28at.com/showinfo-26-102914-0.html使用回调函数训练YOLO模型

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇： UML 类图真的很重要，十分钟带你掌握！

下一篇： Python神器盘点！20个数据科学库打造数据魔法世界！

标签：

热门焦点

6月iOS设备好评榜：第一蝉联榜首近一年

作为安兔兔各种榜单里变化最小的那个，2023年6月的iOS好评榜和上个月相比没有任何排名上的变化，仅仅是部分设备好评率的下降，长年累月的用户评价和逐渐退出市场的老款机器让这
6月安卓手机性价比榜：Note 12 Turbo断层式碾压

6月份有一个618，虽然这是京东周年庆的日子，但别的电商也都不约而同的跟进了，反正促销没坏处，厂商和用户都能满意。618期间一些产品也出现了历史低价，那么各个价位段的产品性价比
容量越大越不坏？24万块硬盘故障率报告公布这些产品零故障

8月5日消息，云存储服务商Backblaze发布了最新的硬盘故障率报告，年故障率有所上升。Backblaze发布的硬盘季度统计数据，其中包括故障率等重要方面。这些结
iQOO 11S屏幕细节公布：首发三星2K E6全感屏安卓最好的直屏手机

日前iQOO手机官方宣布，新一代电竞旗舰iQOO 11S将会在7月4日19:00正式与大家见面。随着发布时间的日益临近，官方关于该机的预热也更加密集，截至目前已
Android 14发布：首批适配机型公布

5月11日消息，谷歌在今天凌晨举行了I/O大会，本次发布会谷歌带来了自家的AI语言模型PaLM 2、谷歌Pixel Fold折叠屏、谷歌Pixel 7a手机，同时发布了Androi
OPPO K11搭载高性能石墨散热系统：旗舰同款性能凉爽释放

日前OPPO官方宣布，将于7月25日14:30举办新品发布会，届时全新的OPPO K11将正式与大家见面，将主打旗舰影像，和同档位竞品相比，其最大的卖点就是将配备索尼
朋友圈可以修改可见范围了苹果用户可率先体验

近日，iOS用户迎来微信8.0.27正式版更新，除了可更换二维码背景外，还新增了多项实用功能。在新版微信中，朋友圈终于可以修改可见范围，简单来说就是已发布的朋友圈
最薄的14英寸游戏笔记本电脑 Alienware X14已可以购买

2022年1月份在国际消费电子展(CES2022)上首次亮相的Alienware新品——Alienware X14现在已经可以购买了，这款笔记本电脑被誉为世界上最薄的 14 英寸游戏笔
AI艺术欣赏体验会在上海梅赛德斯奔驰中心音乐俱乐部上演

光影交错的镜像世界，虚实幻化的视觉奇观，虚拟偶像与真人共同主持，这些场景都出现在2019世界人工智能大会的舞台上。8月29日至31日，“AI艺术欣赏体验会”在上海