数字图像处理

Posted by Jinming Qiao on May 3, 2020

数字图像处理


书名:《数字图像处理(第三版)》

作者:Rafael C.Gonzalez; Richard E.Woods

译者:阮秋琦; 阮宇智


什么是数字图像处理

  • 数字图像是由有限数量的元素组成的,每个元素都有一个特定的位置和幅值,这些元素称为像素。 可以定义为二维函数f(X,y),其中,x,y是空间坐标,f(x,y)是点(x,y)的幅值.

  • 灰度图像是一个二维灰度(或亮度)函数f(x,y)
  • 彩色图像(如RGB,HSV)由三个二维灰度(或亮度)函数f(X,y)组成

数字图像处理的基本步骤

  1. 图像获取(第2章) —— 预处理

  2. 图像滤波和增强(第3章和第4章)

  3. 图像复原(第5章) ——改进图像外观的一个处理领域。与图像增强不同,图像增强是主观的,而图像复原是客观的

  4. 彩色图像处理(第6章)

  5. 小波和分辨率处理(第7章)——小波是以不同分辨率来描述图像的基础

  6. 压缩(第8章)——压缩指减少图像存储量或降低传输图像带宽的处理

  7. 形态学处理(第9章)

  8. 分割(第10章)——分割过程将一幅图像划分为它的组成部分或目标

  9. 表示和描述(第11章)

  10. 目标识别(第12章)

图像处理系统的基本组成结构

  • 主要由三大部分组成:
    1. 图像数字化设备,包括数码相机、数码摄像机或手机等
    2. 图像处理设备,包括计算机和存储系统
    3. 图像输出设备,包括打印机,也可以输出到Internet上的其他设备

图像的采样和量化

  • 大多数传感器的输出是连续电压波形
  • 为了产生一副数字图像,需要把连续的感知数据转化为数字形式
  • 这包括两种处理:取样和量化
  • 取样:图像空间坐标的数字化[可以理解为坐标点的选取]
  • 量化:图像函数值(灰度值)的数字化[可以理解为幅值的数字化]
  • 非统一的图像的量化
  • 在边界附近使用较少的灰度级。剩余的灰度级可用于灰度级变化比较平滑的区域
  • 避免或减少由于量化的太粗糙,在灰度级变化比较平滑的区域出现假轮廓现象

图像的质量

  1. 层次:表示图像实际拥有的灰度级的数量,如具有32种不同取值的图像可称该图像具有32个层次。图像数据的实际层次越高,视觉效果越好。

  2. 对比度:是指一幅图像中灰度反差的大小对比度=最大亮度/最小亮度对比度=最大亮度/最小亮度

  3. 清晰度: 与清晰度相关的主要因素:亮度、对比度、尺寸大小、细微层次、颜色饱和度

空间和灰度分辨率

  • 空间分辨率是图像中可分辨的最小细节的度量。

  • 灰度分辨率是指在灰度级可分辨的最小变化。灰度分辨率指的则是用于量化灰度的比特数,比如通常一幅图是256级的图像有8比特灰度分辨率

图像内插

  • 内插是在注入放大、收缩、旋转和几何校正等任务钟广泛应用的工具。

  • 从根本上看,内插是用已知数据来估计未知位置的数值的处理。例如一幅大小为500×500的图像要放大1.5倍到750×750像素。一种简单的放大方法是创建一个假想的750×750的网格。它与原始图像有相同的间隔,然后将其收缩,使其准确地与原图像匹配。显然,收缩后地750×750网格地像素间隔要小于原图像地像素间隔。为了对覆盖地每一个点赋予灰度值,

  • 双线性内插,该方法中,我们用4个最近邻去估计给定位置的灰度。

\[v(x,y)=ax+by+cxy+d\]
  • 其中,4个系数可由4个用(x,y)点最近邻点写出的未知方程确定。双线性内插给出了比最近邻内插好得多得结果,但随之而来的是计算量的增加
  • 双三次内插
\[v(x,y)=\sum_{i=0}^3\sum_{j=0}^3a_{ij}x^iy^j\]

像素间的一些基本关系

  • 相邻像素——4邻域
    • 4邻域:像素p(x,y)的4邻域是:(x+1,y);(x-1,y);(x,y+1);(x,y-1)
  • 相邻像素——D领域
    • D邻域定义:像素p(x,y)的D邻域是:对角上的点(x+1,y+1);(x+1,y-1);(x-1,y+1);(x-1,y-1)
  • 相邻像素——8邻域
    • 8邻域定义:像素p(x,y)的8邻域是:4邻域的点+D邻域的点
  • 像素的连通性——4连通
    • 对于具有值V的像素p和q,如果q在集合N4(p)N4(p)中,则称这两个像素是4则称这两个像素是4连通的
  • 像素的连通性——m连通

    • q在集合N4(p)N4(p)中,或q在集合ND(p)ND(p)中,并且N4(p)N4(p)与N4(q)N4(q)的交集为空(没有值V的像素)

像素的连通性——通路

  • 通路的定义:一条从具有坐标(x,y)的像素p,到具有坐标(s,t)的像素q的通路,是具有坐标(x0,y0),(x1,y1),…,(xn,yn)(x0,y0),(x1,y1),…,(xn,yn)的不同像素的序列。其中,(x0,y0)=(x,y),(xn,yn)=(s,t)(x0,y0)=(x,y),(xn,yn)=(s,t),(xi,yi)(xi,yi)和(xi−1,yi−1)(xi−1,yi−1)是邻接的,1≤i≤n,n是路径的长度。如果(x0,y0)=(xn,yn)(x0,y0)=(xn,yn),则该通路是闭合通路。

像素的连通性——距离

  • 距离或测度必须满足三个条件,则称D是距离函数或度量
    1. D(p,q)≥0(D(p,q)=0,当且仅当p=q)
    2. D(p,q)=D(q,p)
    3. D(p,z)≤D(p,q)+D(q,z)
  • D4D4(城市距离)
    • 像素p(x,y)和q(s,t)之间的D4D4距离定义为:
\[D_4(p,q)=|x-s|+|y-t|\]
  • D8D8(棋盘距离)
    • 像素p(x,y)和q(s,t)之间的D8D8距离定义为:
\[D_8(p,q)=max(|x-s|,|y-t|)\]

空间操作

  • 空间操作分为三大类:(1)单像素操作(2)邻域操作(3)几何空间操作

    1. 单像素操作:s=T(z)其中z是原图像中像素的灰度,s是处理后的图像中相应像素的(映射)灰度。
    2. 邻域操作
    3. 几何空间变换:有尺度变换,旋转变换,平移变换

图像变换

  • 先前的变换操作都是在空间域上进行处理的。但在有些情况下,需要先将图像转换到变化域之后执行指定的任务,然后用反变换返回到空间域效果会更好。

  • 通用的变换形式是:

\[T(u,v)=\sum_{x=0}^{M-1}\sum_{y=0}^{N-1}f(x,y)r(x,y,u,v)\]
  • 该过程能将图像从空间域转换到变换域反变换形式:
\[f(x,y)=\sum_{u=0}^{M-1}\sum_{v=0}^{N-1}T(u,v)s(x,y,u,v)\]