基于深度学习的足迹图像分割
论文名称:《基于深度学习的足迹图像分割》
指导教师:曹俊杰
论文作者:赵亚芳
毕业院校:大连理工大学
文章内容概要
- 总结图像分割在信息时代的重要作用,给出了问题定义及分类,并按传统方法和深度学习方法两大类介绍了每类有代表性的分割算法
- 简明地总结了本文的研究内容、提出的算法及其贡献
- 给出了与本文提出的分割模型相关的知识,包括有代表性的分类网络、生成对抗网络的原型与典型的变体
- 分析了几种常用的损失函数以解决种类不均衡的问题。最后描述了本文提出的模型结构,包括生成网络的具体细节以及使模型更加鲁棒的损失函数表达式
- 描述了与实验相关的内容,包括数据集特点、实验参数设置、防止过拟合的策略,还对实验结果做了定性定量地分析说明
- 对模型进行控制变量分析,通过实验证明模型每一部分的有效性。进一步指出当前模型的问题以及可能的原因
基于深度学习的典型分类算法
- VGG16 是2014 年提出的分类模型,后续的很多视觉任务都以它作为迁移学习的对象,该算法得到的一个比较重要的结论是采用3x3 的小卷积核堆叠的方式可以达到大卷积的效果,这样的做法可以减少参数量,模型学习地更快
- 卷积神经网络的分组卷积(Group Convolution)是对平凡卷积的改进,最早是分类网络
- 生成对抗网络可以应用反向传播、dropout、分段线性单元等进行学习,降低生成模型的学习难度,从而推动了生成模型的发展
- CGANs的生成对抗网络从随机噪声生成服从指定分布的样本,样本的生成没有有效的控制手段,如果引入一些额外的相关信息作为模型的条件,可以引导模型生成过程
UGnet模型
- 生成对抗网络同时训练生成网络和对抗网络(分别记为G、D),通过对抗过程来估计生成模型。生成网络G 的作用是学习数据分布,而判别网络D 给出样本属于真实分布的概率
- 模型学习的期望结果是生成网络G 可以恢复出数据的真实分布,判别网络D 对生成样本和真实样本不辨真假。图像领域G、D 一般是由多层卷积神经网络构成,D 是一个卷积分类网络
- 图像分割经典的损失函数是交叉熵,二值分割需要二元交叉熵,但是经过对数据集的分析,图片前景与背景像素比约为1:7,类别不均衡的样本可能导致网络学习偏向负样本,即像素标签更可能预测为背景
防止过拟合的策略
- 重叠项:常见的分割指标包括像素级准确率,平均准确率,平均交并比,加权平均交并比
- 归一化项:用于提取轮廓特征,首先提取掩模的轮廓,然后计算轮廓上的点对中心的平均距离并归一化,再计算轮廓上的点相对中心的距离的方差并归一化
- 交叉相关项:是指分割出的掩模与对应的真值掩模计算归一化的交叉相关系数
实验效果图
-
实验效果图