图像运算指以图像为单位进行的搡作(该操作对图像中的所有像素同样进行),运算的结果是一幅其灰度分布与原来参与运算图像
灰度分布不同的新图像。具体的运算主要包括算术和逻辑运算,它们通过改变像素的值来得到图像增强的效果。
类型
广义的图像运算是对图像进行的处理操作,按涉及的波段,图像运算可分为:①单波段运算;②多波段运算。按运算所涉及的像元范围,图像运算可分为:①点运算;②邻域运算或局部运算;③几何运算;④全局运算等。按计算方法与像元位置的关系可分为:①位置不变运算;②位置可变或位移可变运算。按运算执行的顺序,又可分为:①顺序运算;②迭代运算;③跟踪运算等。狭义图像运算专指图像的代数运算(或算术运算)、逻辑运算和
数学形态学运算。
点运算
点运算是指:输出图像每个像素的灰度值仅仅取决于输入图像中相对应像素的灰度值。也就是说,点运算只涉及到一幅原图像(称为输入图像),运算对象是输入图像像素的灰度值。这种运算具有两个特点:其一,根据某种预先设置的规则,将输入图像各个像素本身的灰度(和该像素邻域内其他像素的灰度无关)逐一转换成输出图像重对应像素的灰度值;其二,点运算不会改变像素的空间位置。因此,点运算也被称为灰度变换。
由于点运算的结果是改变了图像像素的灰度值,因此,也就可能改变了整幅图像的灰度统计分布。这种改变也一定会在图像的
灰度直方图上反映出来。而在实际中,有时可采取逆向操作。例如,首先根据需要设计出输出图像的灰度直方图,然后确定由输入图像灰度直方图改变成输出图像灰度直方图所必须遵循的映射关系,也即灰度转换函数,最后,按此转换函数对输入图像的每一像素逐一执行点运算(灰度变换)。
点运算是图像处理中一项基本而又重要的操作,一般都用于根据特定的要求规划图像的显示。
算术运算
算术运算是指对两幅或两幅以上的输入图像中对应像素的灰度值作加、减、乘或除等运算 后,将运算结果作为输出图像相应像素的灰度值。这种运算的特点在于:其―,输出图像像素的灰度仅取决于两幅或两幅以上的输入图像的对应像素灰度值,和点运算相似,算术运算结果和参与运算像素的邻域内像素的灰度值无关;其二,算术运算不会改变像素的空间位置。
图像的相加或相乘可使某些像素的灰度值超出图像处理系统允许的灰度上限值,而图像的相减可使某些像素灰度值变为负数。实际应用中应充分考虑这些因素,并采取某些限定来避免此类事情的发生。例如,可以预先设定,凡图像相减使灰度值之差为负数时,一律以0(灰度范围的下限)来代替;除数为0的灰度值改为1;等等。
算术运算在图像处理中有许多实用性很强的应用。例如,对多幅图像求平均(包含了图像相加的运算),可以有效地消除或减弱静止图像中随机噪声的影响。除此以外,在分子成像中常常采用高灵敏度的荧光成像模式或核医学成像模式获取研究对象的功能影像,而采用高空间分辨率的X-CT或MRI成像模式获取研究对象的解剖影像,再应用图像融合技术综合两种成像模式分别得到的信息。在图像融合处理中就可能用到图像相加运算。
用图像相减可以检测研究对象的运动状态。间隔一定时间后,对研究对象进行连续摄取,如果研究对象处于静止状态,则这几幅图像完全相同,其差为零;如果研究对象处于活动状态(不论是随机运动还是规律性运动),则这几幅图像差不会为零。因此,图像之差能反映研究对象的运动状态。
几何运算
图像的几何运算是指引起图像几何形状发生改变的变换。与点运符不同的是,几何运算可以看成是像素在图像内的移动过程,该移动过程可以改变图像中物体对象之间的空间关系。虽然几何运算可以不受任何限制,但是通常都需要做出一些限制以保持图像的外观顺序。
逻辑运算
逻辑运算又称为布尔运算。布尔用数学方法研究逻辑问题,成功地建立了逻辑运算,他用等式表示判断,把推理看作等式的变换。这种变换的有效性不依赖人们对符号的解释,只依赖于符号的组合规律。这一逻辑理论被称为布尔代数。逻辑运算通常用来测试真假值。最常见到的逻辑运算就是循环的处理。用来判断是否该离开循环或继续执行循环内的命令。图像的逻辑运算主要应用于图像增强、图像识别、图像复原和区域分割等领域,与代数运算不同,逻辑运算既关注图像像素点的数值变化,又重视位变换的情况,在MATLAB中,提供了一些逻辑运算函数,表6-2给出了这些图像的逻辑运算函数。
应用
图像运算是图像处理中的常用处理方法,它以图像为单位进行操作,运算的结果是一幅新的图像,常常用于图像高级处理(如图像分割、目标的检测和识别等)的前期处理。具体的图像运算包括点运算、代数运算、几何运算以及邻域运算。代数运算常用于医学图像的处理以及图像误差检测;几何运算在图像配准、校正等方面有重要用途;领域运算主要用在图像滤波和形态学运算方面。
图像的运算处理方法在许多领域得到突破性进展。下面举两例说明:
1、模式识别
寻找物体边缘通常是通向物体自动识别的第一步,人眼和脑有非凡的识别能力,可以很好的从物体的粗略轮廓识别物体。要使计算机具有类似的能力,必须研究自动识别的算法并编成计算机程序。通常在边缘检测之后,因为边缘检测获得的边缘经常断断续续,边缘像素过少,所以需要经过膨胀(dilation)和侵蚀(erosion)等步骤,帮助产生计算机可以辨明的物体边界。
建立物体的清晰边界之后,就可以考虑进行物体的鉴别、分类与识别了。在车站、机场 等处对行李进行透视检测的设备就是从事此类工作的。利用目标物体集合中目标物的特征由助于考察这个目标,比如计算物体的面积与周长、研究物体表面的纹理等。对物体进行识别通常将所分析的物体图像与一系列可能存在的候选物进行特征比对,如通过颜色和形状来区分水果。可能存在的物体群越大,群中的物体越相似,所需要的特征数目越大。利用统计方法依赖于给定物体出现于图像中的一系列先验概率,其他一些方法则是用一系列训练图像估计物体的特征分布。另一种流行的
模式识别技术是利用
神经网络(neural network)。
2、图像频谱与应用
图像信号也具有频谱,虽然它的频谱比一般信号有更特别的解释。一般来说,图像频谱 的低频部分指那些灰度缓慢变化的部分,而高频成份意味着快速变化,往往是图像中物体的边缘。
因为是从二维信号获得的频谱,所以包含着两个方向的频率数据。一个沿着图像的行, 一个沿着图像的列,因此,幅度和相位必须用第三维表示。一般在二维图上用不同的颜色强度表示这些量大小,或在三维图中用高度表示。二维DFT是首先沿图像的行作一维DFT,然后再沿中间结果数据的列作一维DFT。为提高计算速度,也存在2D FFT算法。一般要确定一幅图像需要图像的幅度和相位两部分信息,通过逆2D DFT变换即可精确还原图像。对于图像频谱,单独的相位谱往往携带了建立图像摹本的足够信息,而幅度却不能。