计算机视觉学习路径

成文时间：2020-09-20 00:00:00

计算机视觉(Computer Vision, CV)
机器视觉（Machine Vision, MV）
相同领域间的异同
- 计算机视觉的研究对象主要是映射到单幅或多幅图像上的三维场景，例如三维场景的重建。计算机视觉的研究很大程度上针对图像的内容
- 图像处理与图像分析的研究对象主要是二维图像，实现图像的转化，尤其针对像素级的操作，例如提高图像对比度，边缘提取，去噪声和几何变换如图像旋转。这一特征表明无论是图像处理还是图像分析其研究内容都和图像的具体内容无关，图像处理很多情况下指数字图像处理
- 机器视觉主要是指工业领域的视觉研究，例如自主机器人的视觉，用于检测和测量的视觉。这表明在这一领域通过软件硬件，图像感知与控制理论往往与图像处理得到紧密结合来实现高效的机器人控制或各种实时操作
- 模式识别使用各种方法从信号中提取信息，主要运用统计学的理论。此领域的一个主要方向便是从图像数据中提取信息
相同领域关系图
计算机视觉一般路径
- 图像获取 -> 预处理 -> 特征提取 -> 检测/分割 -> 高级处理
图像处理一般路径
- 图像与视频I/O模块 -> 图像处理基础 -> 图像卷积操作相关 -> 二值图像分析与处理 -> 视频分析与对象跟踪 -> 特征提取与对象检测 -> 深度神经网络DNN模块

python基础与统计相关知识
- numpy库是科学计算的基本库，重在数值计算，是用于多维数组处理的库
- scipy基于numpy，提供了做科学计算的工具集，是更高层次的库
- TensorFlow中使用的为tensor结构，可以通过指定工具包进行显示转换
图像处理与基础变换
- opencv库内部相关模块
机器学习基础
- sklearn相关教程学习

AI技术之间的包含关系

关系图
各部分定义
- 人工智能：研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学，模拟、延伸和扩展人的智能
- 机器学习：用算法解析数据，不断学习，对世界中发生的事做出判断和预测的一项技术，用大量数据和算法“训练”机器，让机器学会如何执行任务
- 神经网络：人学习知识是通过神经元的连接，通过模仿人脑机理发明了人工神经元，多层神经元的连接，就形成了神经网络
- 深度学习：用于建立、模拟人脑进行分析学习的神经网络，并模仿人脑的机制来解释数据的一种机器学习技术，试图模仿大脑的神经元之间传递，处理信息的模式

深度学习图像处理步骤

神经网络的进化

图像预处理的意义

图像处理分类