数字图像处理

编辑

在计算机科学中，数字图像处理是使用计算机算法对数字图像进行图像处理。^[1] 作为数字信号处理的一个子类或领域，数字图像处理相对于模拟图像处理有许多优势。它允许在输入数据上进行更丰富的算法处理，同时能避免处理过程中的噪声和信号失真等问题。由于图像是在二维(甚至多维)上定义的，数字图像处理可以多维系统的形式建模。

目录编辑

1 历史编辑

许多数字图像处理技术，或过去通常所说的数字图像处理技术，是在20世纪60年代在喷气推进实验室、麻省理工学院、贝尔实验室、马里兰大学和其他一些研究机构开发出来的，应用于卫星图像、有线电传真标准转换、医学成像、可视电话、字符识别和图像增强等领域。^[2] 然而，那个时代的计算机设备的计算成本相当高。

这在20世纪70年代发生了变化，当时随着更便宜的计算机和专用硬件的出现，数字图像处理激增。然后图像可以被实时处理，用于一些专门的问题，例如电视标准转换。随着通用计算机变得越来越快，除了最专业和计算机密集型的操作之外，它们开始接管专用硬件的角色。随着21世纪快速计算机和信号处理器的出现，数字图像处理已经成为最常见的图像处理形式。因为它不仅是最通用的方法，而且是最便宜的方法。

用于医学应用的数字图像处理技术于1994年被引入空间基金会空间技术名人堂。^[3]

2 任务编辑

数字图像处理允许使用复杂得多的算法，因此可以在简单的任务中展现更智能的效果，也可以实现模拟方法无法实现的方法。

特别是，数字图像处理是以下领域的唯一实用技术:

分类
特征提取
多尺度信号分析
模式识别
规划

数字图像处理中使用的一些技术包括:

各向异性扩散
隐马尔可夫模型
图像编辑
图像恢复
独立成分分析
线性滤波
神经网络
偏微分方程
像素化
点特征匹配
主成分分析
自组织地图
小波

3 数字图像转换编辑

3.1 滤波

数字滤波用于模糊和锐化数字图像。滤波可以通过以下方式执行:

在空间区域利用特定的卷积核进行卷积^[4]
频域的傅里叶变换

以下示例显示了两种方法:^[5]

过滤方式	滤波器或掩码	例子
原象
空间低通
空间高通
傅立叶表示法	伪代码: 图像=棋盘 F =图像的傅里叶变换显示图像:对数(1+绝对值)
傅立叶低通
傅立叶高通

3.2 傅里叶域滤波中的图像填充

图像通常在傅里叶变换之前被填充，下面的高通滤波图像说明了不同填充技术的结果:

零填充	重复填充边缘

请注意，与重复的边缘填充相比，零填充时高通滤波器会显示额外的边缘。

3.3 过滤代码示例

空域高通滤波的MATLAB实例。

img=checkerboard(20);                           % generate checkerboard
% **************************  SPATIAL DOMAIN  ***************************
klaplace=[0 -1 0; -1 5 -1;  0 -1 0];             % Laplacian filter kernel
X=conv2(img,klaplace);                          % convolve test img with
                                                % 3x3 Laplacian kernel
figure()
imshow(X,[])                                    % show Laplacian filtered 
title('Laplacian Edge Detection')

3.4 仿射变换

仿射变换支持基本的图像变换，包括缩放、旋转、平移、镜像和斜切，如下例所示:^[5]

变换名	仿射矩阵	例子
单位变换
翻转
缩放
旋转		where $θ = π6 =30°$
斜切

为了将仿射矩阵应用于图像，图像被转换成矩阵，其中每个项对应于该位置的像素强度。那么每个像素的位置可以表示为指示图像中该像素坐标的向量，[x，y]，其中x和y是图像矩阵中像素的行和列。这允许坐标乘以仿射变换矩阵，该矩阵给出像素值将在输出图像中复制到的位置。

然而，为了允许需要平移变换的变换，需要三维均匀坐标。第三维度通常设置为非零常数，通常为1，因此新坐标为[x，y，1]。这允许坐标向量乘以3乘3矩阵，从而实现平移。所以第三维度，也就是常数1，允许平移。

因为矩阵乘法是关联的，所以多个仿射变换可以通过按变换完成的顺序乘以每个单独变换的矩阵而组合成单个仿射变换。这产生了单个矩阵，当应用于点矢量时，该矩阵给出了与对矢量[x，y，1]依次执行的所有单独变换相同的结果。因此，一系列仿射变换矩阵可以简化为单个仿射变换矩阵。

例如，二维坐标仅允许绕原点(0，0)旋转。但是三维齐次坐标可以用来首先将任何点平移到(0，0)，然后执行旋转，最后将原点(0，0)平移回原始点(与第一次平移相反)。这三个仿射变换可以组合成一个矩阵，从而允许围绕图像中的任何点旋转。^[6]

4 应用编辑

4.1 数码相机图像

数码相机通常包括专门的数字图像处理硬件——专用芯片或其他芯片上的附加电路——以将来自图像传感器的原始数据转换成标准图像文件格式的色彩校正图像。

4.2 电影

Westworld (1973)是第一部使用数字图像处理将照片像素化从而模拟人的视角的故事片。^[7]

参考文献

[1]
^Pragnan Chakravorty, "What Is a Signal? [Lecture Notes]," IEEE Signal Processing Magazine, vol. 35, no. 5, pp. 175-177, Sept. 2018. https://doi.org/10.1109/MSP.2018.2832195.
[2]
^Azriel Rosenfeld, Picture Processing by Computer, New York: Academic Press, 1969.
[3]
^"Space Technology Hall of Fame:Inducted Technologies/1994". Space Foundation. 1994. Archived from the original on 4 July 2011. Retrieved 7 January 2010..
[4]
^quora : What-is-spatial-domain-in-image-processing.
[5]
^Gonzalez, Rafael (2008). Digital Image Processing, 3rd. Pearson Hall. ISBN 9780131687288..
[6]
^House, Keyser (December 6, 2016). "Affine Transformations" (PDF). Clemson. Foundations of Physically Based Modeling & Animation. A K Peters/CRC Press. ISBN 9781482234602. Retrieved 26 March 2019..
[7]
^A Brief, Early History of Computer Graphics in Film Archived 17 7月 2012 at the Wayback Machine, Larry Yaeger, 16 August 2002 (last update), retrieved 24 March 2010.

阅读 78