基于YOLO的深度学习目标检测算法研究

Posted by Jinming Qiao on July 20, 2020

基于YOLO的深度学习目标检测算法研究


论文名称:《基于YOLO的深度学习目标检测算法研究》—2019

指导教师:丁胜

论文作者:熊永平

毕业院校:武汉科技大学


文章内容概要

  1. 简述了计算机视觉领域中目标检测的研究背景和意义以及国内外研究现状
  2. 阐述了一些目标检测技术,包括了传统算法与最新的深度学习算法,总结了这些方法的优缺点
  3. 总结了目标检测中的一些常见技术,分析了目标检测的实际应用意义以及科学研究价值
  4. 基于YOLO算法的不足而提出的一系列优化算法,包括多尺度滑窗、非极大值抑制的改进以及图像去雾
  5. 介绍了目标检测后的候选框校正算法。其中包括轮廓修正算法和类别校正算法

标检测算法分析

  • 传统的目标检测算法步骤主要是先利用先验知识对图像特征如SIFT、HOG等特征进行提取,然后根据这些特征对目标进行定位后再作分类
  • 基于深度学习目标检测算法主要分为两类,一类是两阶段算法,即R-CNN系列,另一类是一阶段算法,即YOLO、SSD系列
  • 目标检测需要解决的核心问题都是一样的,可以分为以下三类:
    1. 目标可能会出现在图像中的任何位置
    2. 目标存在不同的尺度大小
    3. 目标有不同的形状
  • 传统目标检测算法主要还是几年前的LBP、SIFT、HOG、SURF等算法,而基于卷积神经网络的算法主要有R-CNN、YOLO、SSD等算法
  • 最早提出的基于CNN的目标检测算法是R-CNN算法,这个算法首次将卷积神经网络引入到了目标检测领域
  • 利用不同的卷积核在图像不同区域会产生不同响应的特点,提取图像的高低阶特征

基于回归的目标检测

  • 继R-CNN系列提出之后,一种全新的基于回归的目标检测算法问世,其中最为著名的也是第一个提出回归方法目标检测的算法就是YOLO
  • YOLO提供了更直接的思路,在给出目标坐标的同时给出其标签
    1. 将原图缩放到指定大小,然后根据图像下采样的比例将图像分割为指定大小的网格
    2. 通过CNN来提取特征并进行预测。全连接部分会针对每个网格给出2个候选框的坐标和类别
    3. 通过NMS非极大值抑制过滤候选框

基于滑动窗口的多尺度目标检测

  • XGBoost通过计算残差来逐步逼近,梯度提升算法不同的是,该算法在优化参数的时候同时使用了一阶导数和二阶导数,结合多线程、指定分支等方式,大大提升了算法效率和性能
  • XGBoost是基于多棵树的集成来实现的,对于每一棵树来说,每一个输入的样本都会在树中找到对应的分支,而每一棵给定的树都会有特定的权值
  • 采用ResNet网络训练效果远高于XGBoost模型训练效果,ResNet在图像分类方面神经网络有其天然的优势,因此采用ResNet来进行目标类别各向同性修正效果会更好

实验结果图

  • 实验结果图