基于深度学习的小目标检测算法研究

Posted by Jinming Qiao on August 2, 2020

基于深度学习的小目标检测算法研究


论文名称:《基于深度学习的小目标检测算法研究》

指导教师:周小佳

论文作者:王强

毕业院校:电子科技大学


文章内容概要

  • 介绍人工神经网络的基本结构,介绍目标检测中最重要的一个网络——卷积神经网络
  • 介绍了卷积层、池化层和激活函数等。接着是对目标检测中的一些关键技术和通用技术进行介绍
  • 介绍特征提取网络、回归方法、非最大抑制和损失函数,介绍FCOS算法
  • 介绍回归的主要方法和处理过程,之后分析该回归方法存在着对小目标的召回率很低的缺点,并针对该缺点提出改进方法
  • 分析了特征融合网络,介绍多尺度特征融合网络 FPN 和 PANet
  • 介绍在 FCOS 中存在的特征融合网络和其他两种网络的不同和不足之处,提出跨连接和级联的方式来增强特征融合网络的融合能力

神经网络和目标检测相关技术研究

  • 人工神经网络 (Artifial Neural Networks,ANN) 是受生物科学中的神经网络启发得到的,该网络是在理解人脑结构和神经网络响应机制后,通过使用网络拓扑理论来模拟人脑的神经系统对复杂信息处理的一种数学模型
  • 人工神经网络主要有四个基本特点:非线性、非局限性、非常定性、非凸性
    1. 非线性是指可以表达更加复杂的数学模型,实现对复杂函数的拟合
    2. 非局限性是指神经网络的结果不仅仅取决于单个神经元,同时也和多个神经元之间的作用相关
    3. 非常定性是指神经网络在处理信息时并不是一成不变的,而是时刻变化的
    4. 非凸性是指网络可以输出多个满足条件的值,保证了网络的多样性
  • 卷积操作在信号处理和图像处理中具有着很重要的作用,通过将传统的图像卷积过程应用到神经网络中就得到了卷积神经网络
  • 卷积神经网络是一种分层的结构,主要框架和人工神经网络一致。卷积神经网络主要由输入层、输出层和中间层 (隐藏层) 组成
    1. 卷积层和池化层是用来对输入的图像做特征提取,逐渐将图像抽象化
    2. 激励层则是为卷积层做线性或者非线性映射,使得模型能够更好的表达需求
    3. 全连接层或者卷积层用于预测输出
  • 目标检测中常用的技术有特征提取网络、回归策略、损失函数、非最大抑制和评价指标

针对小目标预测方法的研究

  • FCOS 算法是一种全卷积的单阶段目标检测方法
  • 对目标所在的所有网格都进行预测,这种逐像素的预测方式会导致最终预测得到的矩形框质量参次不齐
  • 较大的目标需要顶层的特征图来预测,而较小的目标是用低层的特征图来预测。这种方法的一个好处是增强在目标重叠时的预测能力
  • 增加召回率的方式来提升对小目标的召回率。预测的计算方法和原方法略有不同,不再是使用中心点到边界框的距离,而是同时使用中心点和网格角点到边界框的距离

基于多尺度特征融合网络的研究

  • 不管特征融合网络有多少变化,有一些本质是不会变的,如使用多个骨干网络的特征图、对尺度较小的特征图上采样后再融合
  • FPN 是一种自顶向下的网络连接结构,PANet 在这个基础上又增加了自底向上的网络结构,自顶向下的结构注重于顶层的抽象信息
  • 增加低层的信息来补充顶层的信息,可以使用自底向上的融合路径来补足
  • 级联,即为多个相同的结构之间串联在一起的结构
  • EfficientNet作为一种新的骨干网络,和 ResNet 一样可以作为骨干网络,但是要比 ResNet 网络更加优秀

实验结果图

  • 实验结果图