基于YOLO的双目图像匹配方法研究
论文名称:《基于YOLO的双目图像匹配方法研究》—2019
指导教师:张春蕾
论文作者:牛馨苑
毕业院校:兰州交通大学
文章内容概要
- 介绍了双目系统、图像匹配技术以及深度学习目标检测算法在机器视觉领域的研究背景和意义
- 介绍了图像特征点匹配以及深度学习目标检测技术,并对特征匹配技术和目标检测算法的国内外研究动态和水平进行了大致描述
- 对双目图像特征点匹配技术中的尺度不变特征变换SIFT和局部特征算法SURF这两种非常典型的算法进行了研究
- 介绍并分析了不同双目图像匹配算法各自的基本原理及特点,通过系统仿真验证基于特征点的图像匹配算法性能
- 基于卷积神经网络的深度学习双目图像的目标检测算法进行研究
- 介绍了在图像目标检测领域的几种不同原理的深度学习算法的原理及过程,对卷积神经网络的基本结构、传播过程、训练等进行了深入研究
双目图像匹配及深度学习目标检测
- 图像匹配技术是三维立体重建、相机校准、场景识别、运动追踪等一些计算机视觉应用的关键
- 由于光照、尺度等因素的变化在双目图像匹配中会导致匹配精度下降,出现匹配目标之间有偏差、错误匹配点数较多的情况
- 双目图像在匹配时的基本问题是要选取正确的需要进行匹配的特征点,如果错误匹配点的数越多,那么获得的匹配信息无效的可能性越大,在目标定位和三维立体重建等工作中如果存在双目图像的无效匹配较多会影响定位精度
- 深度学习目标检测算法的不断改进使得基于图像的目标识别准确率随之不断提升。深度学习算法应用在图像领域的核心结构卷积神经网络
- 双目图像匹配算法介绍
- 多量性表现在即使是很少几个物体也可以产生大量的SIFT 特征,在同一参数下较别的特征点采集的数量更多一些,特征信息提取充足
- SURF 是一种基于局部不变特征的描述子,是对SIFT 算法的一种改进,对图像具有尺度、平移还有旋转不变性,用一种更为高效的方式完成特征的提取和描述,计算速度更快
- 特征学习是其核心所在,不同层次的特征信息可以通过多层次结构的网络提取获得,神经网络自主学习和提取特征的特点解决了人工提取特征的麻烦
基于深度学习的双目图像目标检测
- K-means算法对数据集进行聚类,随着迭代次数的增加,候选框的参数也在不断调整来接近真实框
- 算法通过anchor boxes 获得好的IOU,并且IOU 是与box 的尺寸无关的
- YOLO是将物体检测任务看作回归问题来进行处理,每张图像一次性从空间上分割边界框和预测类别概率,直接在输入图像的多个位置上回归出物体的目标框以及其分类类别
- YOLO检测整个系统是单一的网络结构,这种可以进行端到端的优化的模型比传统的目标检测方法能更简单直接的处理图像
- YOLO能够实现端到端的目标检测和识别,这种网络结构可以一次性预测多个目标框的位置和类别,速度快是其最大的优势
- YOLO没有选择滑动窗口或提取推荐的方式训练网络,而是直接用整图训练模型,目的在于可以更好的区分目标和背景区域,不会像Fast R-CNN由于采用推荐训练方式常常把背景区域误检为特定目标
实验结果图
-
实验结果图