基于深度学习的图像行为识别研究

Posted by Jinming Qiao on July 1, 2020

基于深度学习的图像行为识别研究


论文名称:《基于深度学习的图像行为识别研究》

指导教师:吴伟

论文作者:闵凡豹

毕业院校:内蒙古大学


文章内容概要
  1. 视觉行为的定义,分析图片识别存在问题,实验数据的收集与整理
  2. 介绍相关深度学习算法与算法研究现状,相关技术理论介绍
  3. 分析进行试验操作,定义视觉行为依据,分析试验数据,统计统计情况
  4. 基于CNN对图像识别模式进行介绍,介绍相关图像行为识别模型
  5. 分析图像行为识别结果,介绍标注准确度与试验分析结果,进行总结
相关技术理论
  • 支持向量机
    1. Support Vector Machine, SVM 二元线性分类器 -> 监督学习
    2. 解决线性可分的二值分类问题 -> 解决非线性可分问题
    3. 决策边界:边界将样本数据划分成两个集合,分别位于边界两侧
    4. 超平面:线性子空间,三维空间的推广
    5. 间隔最大化:所有的点(数据集)都远离超平面
  • 随机森林
    1. Random Forest, RF 分类/回归问题
    2. 决策树:分类回归树,形如二叉树,每个非叶子 树状结构都代表一个特征
    3. 基尼指数:基尼指数越小,分裂之后的 子样本数据不相关度越高
  • 朴素贝叶斯
    1. Naive Bayesian, NB 分类算法
    2. 基于概率贝叶斯定理进行相关分类计算统计
  • 卷积神经网络
    1. Artificial Neural Network,ANN
    2. 基于生物神经网络结构,人工神经网络的一种改进
    3. 由输入层、隐藏层、输出层与相关的神经元节点组成
图像行为识别数据集合
  • 定义视觉行为
  • 收集实验数据
  • 数据预处理
    • 图片编码基本处理,三维矩阵三原色处理
    • 图片大小尺寸处理,统一处理图片像素面积
    • 图片翻转位置设定处理,图像相对位置镜像处理
基于CNN的图像行为识别模型简介
框架名称 开发人员 开发语言 支持系统
DeepLearning4j Skymind Java、Scala、Clojure Linux、Windows、Mac OS X、 Android
Caffe 加州大学 C++、Python、 MATLAB Linux、Mac OS X、Windows
Microsoft Cognitive Toolkit 微软 Python、C++、 BrainScript Linux、Windows
MXNet 学习社区 C++、Python、Julia、 Matlab、Go、R、Scala Linux、Windows、Mac OS X、 Android、iOS
PaddlePaddle 百度 C++、Python Linux、Mac OS X
TensorFlow 谷歌 C++、Python Linux、Mac OS X、Windows Android、iOS
Theano 蒙特利尔大学 Python Linux、Mac OS X、Windows
图像识别模型
  • 图像行为识别模型构建策略
  • 基于AlexNet图像行为识别模型
  • 混合图像行为识别模型