基于深度学习的图像行为识别研究
论文名称:《基于深度学习的图像行为识别研究》
指导教师:吴伟
论文作者:闵凡豹
毕业院校:内蒙古大学
文章内容概要
- 视觉行为的定义,分析图片识别存在问题,实验数据的收集与整理
- 介绍相关深度学习算法与算法研究现状,相关技术理论介绍
- 分析进行试验操作,定义视觉行为依据,分析试验数据,统计统计情况
- 基于CNN对图像识别模式进行介绍,介绍相关图像行为识别模型
- 分析图像行为识别结果,介绍标注准确度与试验分析结果,进行总结
相关技术理论
- 支持向量机
- Support Vector Machine, SVM 二元线性分类器 -> 监督学习
- 解决线性可分的二值分类问题 -> 解决非线性可分问题
- 决策边界:边界将样本数据划分成两个集合,分别位于边界两侧
- 超平面:线性子空间,三维空间的推广
- 间隔最大化:所有的点(数据集)都远离超平面
- 随机森林
- Random Forest, RF 分类/回归问题
- 决策树:分类回归树,形如二叉树,每个非叶子 树状结构都代表一个特征
- 基尼指数:基尼指数越小,分裂之后的 子样本数据不相关度越高
- 朴素贝叶斯
- Naive Bayesian, NB 分类算法
- 基于概率贝叶斯定理进行相关分类计算统计
- 卷积神经网络
- Artificial Neural Network,ANN
- 基于生物神经网络结构,人工神经网络的一种改进
- 由输入层、隐藏层、输出层与相关的神经元节点组成
图像行为识别数据集合
- 定义视觉行为
- 收集实验数据
- 数据预处理
- 图片编码基本处理,三维矩阵三原色处理
- 图片大小尺寸处理,统一处理图片像素面积
- 图片翻转位置设定处理,图像相对位置镜像处理
基于CNN的图像行为识别模型简介
框架名称 | 开发人员 | 开发语言 | 支持系统 |
---|---|---|---|
DeepLearning4j | Skymind | Java、Scala、Clojure | Linux、Windows、Mac OS X、 Android |
Caffe | 加州大学 | C++、Python、 MATLAB | Linux、Mac OS X、Windows |
Microsoft Cognitive Toolkit | 微软 | Python、C++、 BrainScript | Linux、Windows |
MXNet | 学习社区 | C++、Python、Julia、 Matlab、Go、R、Scala | Linux、Windows、Mac OS X、 Android、iOS |
PaddlePaddle | 百度 | C++、Python | Linux、Mac OS X |
TensorFlow | 谷歌 | C++、Python | Linux、Mac OS X、Windows Android、iOS |
Theano | 蒙特利尔大学 | Python | Linux、Mac OS X、Windows |
图像识别模型
- 图像行为识别模型构建策略
- 基于AlexNet图像行为识别模型
- 混合图像行为识别模型