当前位置:首页 > 科技  > 知识百科

九种深度学习算法简介

来源: 责编: 时间:2023-08-07 16:30:00 362观看
导读 一. 两阶段算法两阶段算法包含选择候选框和修正目标分类/位置两个阶段,对这两个阶段的不同处理方式,构成了不同的算法方案。1. R-CNN算法2014年,R. Girshick等人提出了R-CNN算

 一. 两阶段算法pQ628资讯网——每日最新资讯28at.com

两阶段算法包含选择候选框和修正目标分类/位置两个阶段,对这两个阶段的不同处理方式,构成了不同的算法方案。pQ628资讯网——每日最新资讯28at.com

1. R-CNN算法pQ628资讯网——每日最新资讯28at.com

2014年,R. Girshick等人提出了R-CNN算法。R-CNN算法的思路非常简单,首先基于Selective Search方法从原始图像中筛选出若干候选框,然后将每个候选框中的图像缩放的固定尺度送入卷积网络提取特征,最后通过支持向量机(SVM)方法对特征进行分类,判断候选框中的图像是背景还是我们关注的目标类型。pQ628资讯网——每日最新资讯28at.com

在VOC2007数据集上,R-CNN算法相比之前的检测算法,在性能有了显著的提升(从33.7%提升到58.5%),是检测算法的一个里程碑式的突破。pQ628资讯网——每日最新资讯28at.com

虽然R-CNN在算法性能上取得了巨大的进展,但弊端也非常明显,因为需要分别从2000多个候选框中提取特征,所以效率非常低,后续各种算法正是为了解决这一问题而提出的一系列改进方案。pQ628资讯网——每日最新资讯28at.com

2. SPP-Net算法pQ628资讯网——每日最新资讯28at.com

2014年,何恺明等人提出了SPP-Net(Spatial Pyramid Pooling Networks,空间金字塔池化网络)算法。pQ628资讯网——每日最新资讯28at.com

R-CNN算法要求输入卷积网络用来提取特征的子图像尺寸固定,比如Alex-Net就要求输入的图像大小为固定的224像素×224像素,而SPP-Net算法则去掉了这一限制。SPP-Net算法基于一个空间金字塔池化层(SPP layer),无论输入的子图像大小如何,都会将子图像采样成固定大小的图像。pQ628资讯网——每日最新资讯28at.com

在使用SPP-Net进行检测的过程中,对原始图像只需要进行一次卷积网络计算,在得到整幅图像的特征图之后,通过空间金字塔池化层将每个候选框区域(ROI)都分别采样成相同尺寸的子图像,将相同尺寸的各个子图像送入后续的网络进行特征提取,提取的特征具有相同的维数,最后送入全连接层进行分类。pQ628资讯网——每日最新资讯28at.com

SPP-Net不需要进行多次卷积网络计算,与R-CNN相比,在算法精度不变的情况下,算法的速度有了20倍的大幅提升。pQ628资讯网——每日最新资讯28at.com

3. Fast R-CNN算法pQ628资讯网——每日最新资讯28at.com

2015年,R. Girshick等人提出了Fast R-CNN算法,其本质是在R-CNN和SPP-Net的基础上进行了进一步改进。Fast R-CNN可以在网络里同时预测目标的分类概率和位置偏移。pQ628资讯网——每日最新资讯28at.com

在VOC2007数据集上,Fast R-CNN将mAP(mean Average Precision,平均精度均值)从58.5%提升至70.0%,算法速度也比R-CNN有了200倍的提升。虽然Fast R-CNN的性能和速度相比R-CNN和SPP-Net有了明显的改善,但整体速度仍然受到候选框检测算法的制约,为了解决这个问题,Faster R-CNN算法诞生了。pQ628资讯网——每日最新资讯28at.com

4. Faster R-CNN算法pQ628资讯网——每日最新资讯28at.com

2015年,S. Ren等人提出了Faster R-CNN算法,Faster R-CNN是第一个端到端算法,也是第一个接近实时深度学习的目标检测算法。使用ZF-Net网络骨架,在VOC2007数据集上,mAP达到了73.2%,算法速度达到了17fps。pQ628资讯网——每日最新资讯28at.com

Faster R-CNN最主要的贡献是使用卷积网络检测候选框。检测候选框、预测目标的类别、回归目标位置的偏移量,共享底层卷积特征,整个算法流程融合成了一个完整的端到端学习框架。Faster R-CNN突破了候选框检测的速度瓶颈,是一种十分重要的两阶段算法。pQ628资讯网——每日最新资讯28at.com

5. FPN算法pQ628资讯网——每日最新资讯28at.com

2017年,Lin等人在Faster R-CNN的基础上提出了FPN(Feature Pyramid Net works,特征金字塔策略)算法。pQ628资讯网——每日最新资讯28at.com

在FPN之前,绝大多数深度学习检测器都是基于卷积网络最顶层的特征图进行计算的。深层特征包含全局信息,却弱化了细节信息,使用深层特征在小目标检测,尤其是精准定位方面,有着较大的劣势。FPN采用top-down结构以及侧连方法,将深层特征和浅层特征进行融合,使得特征既包含全局信息又包含细节信息。pQ628资讯网——每日最新资讯28at.com

另外,检测计算也基于特征金字塔的多层特征图,具有更强的多尺度适应性。基于FPN的Faster R-CNN算法在COCO数据集上取得了最优的性能。当前,FPN已经成为构建检测算法的基础策略。pQ628资讯网——每日最新资讯28at.com

pQ628资讯网——每日最新资讯28at.com

二. 一阶段算法pQ628资讯网——每日最新资讯28at.com

一阶段算法和两阶段算法最主要的区别,就是没有单独的候选框筛选阶段,而是直接回归目标的位置坐标和分类概率。常用的一阶段算法如下。pQ628资讯网——每日最新资讯28at.com

1. YOLO算法pQ628资讯网——每日最新资讯28at.com

2015年,R. Joseph等人提出了YOLO(You Look Only Once)算法,这是首个深度学习领域的一阶段算法。pQ628资讯网——每日最新资讯28at.com

从名字就可以看出,YOLO没有两阶段算法中提取候选框和验证分类两个步骤,图像送入一个神经网络就能完成整个预测过程。YOLO算法的实现方案是,先把原始图像划分成网格,然后基于网格的每个单元格回归目标的类别概率和位置坐标。pQ628资讯网——每日最新资讯28at.com

作为一阶段算法,YOLO的一个最大优点就是速度快,在VOC2007数据集上,mAP为63.4%,检测算法速度可以达到45fps;YOLO的加速版本mAP为52.7%,速度甚至可以达到惊人的155fps。pQ628资讯网——每日最新资讯28at.com

不过,YOLO也有不尽如人意的地方,在目标位置的精度上比两阶段算法有所降低,尤其是在对一些小目标的检测方面,效果明显变差。正因为存在这些问题,后续YOLO的版本以及其他一阶段算法,都致力于更好地解决上述问题。pQ628资讯网——每日最新资讯28at.com

2. SSD算法pQ628资讯网——每日最新资讯28at.com

2015年,W. Liu等人提出了SSD(Single Shot MultiBox Detector)算法,这是深度学习领域的第二个一阶段算法。pQ628资讯网——每日最新资讯28at.com

与仅使用最顶层特征图进行预测的方法不同,SSD最主要的贡献是引入了基于多尺度特征图的检测策略,显著提升了算法的性能,尤其是在小目标检测方面,相比YOLO有了明显的改善,在VOC2007数据集上,mAP达到了76.8%。pQ628资讯网——每日最新资讯28at.com

3. Retina-Net算法pQ628资讯网——每日最新资讯28at.com

Retina-Net算法的主要目的是解决正负样本不平衡的问题。常规的一阶段算法在提取训练样本的过程中,背景样本的比例远大于目标样本的比例。正负样本的极度不平衡会导致训练过程中模型较少关注目标样本,这也是一阶段算法的精度低于两阶段算法的主要原因。pQ628资讯网——每日最新资讯28at.com

Retina-Net算法引入了损失函数,其核心思想是在训练过程中,对传统的交叉熵损失加上权重,使得错分的样本产生的损失在最终损失中占有更大的比例。引入损失函数,使得一阶段算法在保持速度优势的前提下,保证了目标检测的精度。pQ628资讯网——每日最新资讯28at.com

4. FCOS算法pQ628资讯网——每日最新资讯28at.com

2019年,沈春华团队提出了FCOS(Fully Convolutional One-Stage)算法。和SSD等一阶段算法不同,FCOS是一种“anchor free”方法,回归目标位置不需要预先设定anchor,在待检测目标尺度和形态变化较大的场景中有重要的应用。pQ628资讯网——每日最新资讯28at.com

另外,FCOS算法在具体实现的过程中也使用了FPN策略,对于多尺度的目标有更好的检测效果。pQ628资讯网——每日最新资讯28at.com

关于作者:涂铭,资深数据架构师和人工智能技术专家,现就职于腾讯,曾就职于阿里。对大数据、自然语言处理、图像识别、Python、Java等相关技术有深入的研究,积累了丰富的实践经验。pQ628资讯网——每日最新资讯28at.com

金智勇,计算机视觉算法专家,在计算机视觉领域深耕12年。现就职于百度,曾就职于阿里和三星等知名高新技术企业。业务领域涵盖增强现实、人脸识别、图像美化、智能交通、工业质检等多个方向,具有丰富的算法研究与落地经验。pQ628资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-119-2210-0.html九种深度学习算法简介

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 骗人还是文字强!MIT最新研究:DeepFake换脸还不如编辑动动笔

下一篇: 云安全日报220310:IBM轻量级企业应用服务器发现执行任意代码漏洞,需要尽快升级

标签:
  • 热门焦点
  • 中兴AX5400Pro+上手体验:再升级 双2.5G网口+USB 3.0这次全都有

    2021年11月的时候,中兴先后发布了两款路由器产品,中兴AX5400和中兴AX5400 Pro,从产品命名上就不难看出这是隶属于同一系列的,但在外观设计上这两款产品可以说是完全没一点关系
  • 三言两语说透设计模式的艺术-简单工厂模式

    一、写在前面工厂模式是最常见的一种创建型设计模式,通常说的工厂模式指的是工厂方法模式,是使用频率最高的工厂模式。简单工厂模式又称为静态工厂方法模式,不属于GoF 23种设计
  • 让我们一起聊聊文件的操作

    文件【1】文件是什么?文件是保存数据的地方,是数据源的一种,比如大家经常使用的word文档、txt文件、excel文件、jpg文件...都是文件。文件最主要的作用就是保存数据,它既可以保
  • 从零到英雄:高并发与性能优化的神奇之旅

    作者 | 波哥审校 | 重楼作为公司的架构师或者程序员,你是否曾经为公司的系统在面对高并发和性能瓶颈时感到手足无措或者焦头烂额呢?笔者在出道那会为此是吃尽了苦头的,不过也得
  • 一文搞定Java NIO,以及各种奇葩流

    大家好,我是哪吒。很多朋友问我,如何才能学好IO流,对各种流的概念,云里雾里的,不求甚解。用到的时候,现百度,功能虽然实现了,但是为什么用这个?不知道。更别说效率问题了~下次再遇到,
  • 10天营收超1亿美元,《星铁》比《原神》差在哪?

    来源:伯虎财经作者:陈平安即便你没玩过《原神》,你一定听说过的它的大名。恨它的人把《原神》开服那天称作是中国游戏史上最黑暗的一天,有粉丝因为索尼在PS平台上线《原神》,怒而
  • ESG的面子与里子

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之三伏大幕拉起,各地高温预警不绝,但处于厄尔尼诺大“烤”之下的除了众生,还有各大企业发布的ESG报告。ESG是“环境保
  • 小米MIX Fold 3下月亮相:今年唯一无短板的全能折叠屏

    这段时间以来,包括三星、一加、荣耀等等有不少品牌旗下的最新折叠屏旗舰都有新的进展,其中荣耀、三星都已陆续发布了最新的折叠屏旗舰,尤其号荣耀Magi
  • 消息称小米汽车开始筛选交付中心:需至少120个车位

    IT之家 7 月 7 日消息,日前,有微博简介为“汽车行业从业者、长三角一体化拥护者”的微博用户 @长三角行健者 发文表示,据经销商集团反馈,小米汽车目前
Top