图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。它是由
图像处理到图像分析的关键步骤。现有的图像分割方法主要分以下几类:基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法等。从数学角度来看,图像分割是将
数字图像划分成互不相交的区域的过程。图像分割的过程也是一个标记过程,即把属于同一区域的像素赋予相同的编号。
引言
数字图像处理技术是一个跨学科的领域。随着
计算机科学技术的不断发展,图像处理和分析逐渐形成了自己的科学体系,新的
处理方法层出不穷,尽管其发展历史不长,但却引起各方面人士的广泛关注。首先,视觉是人类最重要的感知手段,图像又是视觉的基础,因此,数字图像成为心理学、生理学、计算机科学等诸多领域内的学者们研究
视觉感知的有效工具。其次,图像处理在军事、遥感、气象等大型应用中有不断增长的需求。
1998年以来,
人工神经网络识别技术已经引起了广泛的关注,并且应用于图像分割。基于神经网络的分割方法的基本思想是通过训练多层
感知机来得到线性决策函数,然后用
决策函数对像素进行分类来达到分割的目的。这种方法需要大量的
训练数据。神经网络存在巨量的连接,容易引入空间信息,能较好地解决图像中的噪声和不均匀问题。选择何种
网络结构是这种方法要解决的主要问题。
图像分割是
图像识别和
计算机视觉至关重要的预处理。没有正确的分割就不可能有正确的识别。但是,进行分割仅有的依据是图像中像素的亮度及颜色,由计算机自动处理分割时,将会遇到各种困难。例如,光照不均匀、噪声的影响、图像中存在不清晰的部分,以及阴影等,常常发生分割错误。因此图像分割是需要进一步研究的技术。人们希望引入一些人为的知识导向和人工智能的方法,用于纠正某些分割中的错误,是很有前途的方法,但是这又增加了解决问题的复杂性。
在通信领域中,
图像分割技术对
可视电话等活动图像的传输很重要,需要把图像中活动部分与静止的背景分开,还要把活动部分中位移量不同的区域分开,对不同
运动量的区域用不同的
编码传输,以降低传输所需的
码率。
分割方法
阈值分割
灰度
阈值分割法是一种最常用的并行区域技术,它是图像分割中应用数量最多的一类。阈值分割方法实际上是输入图像f到输出图像g的如下变换:
其中,T为阈值,对于物体的
图像元素g(i,j)=1,对于背景的图像元素g(i,j)=0。
由此可见,阈值分割算法的关键是确定阈值,如果能确定一个合适的阈值就可准确地将图像分割开来。阈值确定后,将阈值与像素点的
灰度值逐个进行比较,而且像素分割可对各像素并行地进行,分割的结果直接给出图像区域。
阈值分割的优点是计算简单、
运算效率较高、速度快。在重视运算效率的应用场合(如用于硬件实现),它得到了广泛应用。
人们发展了各种各样的阈值处理技术,包括全局阈值、自适应阈值、最佳阈值等等。
全局阈值是指整幅图像使用同一个阈值做分割处理,适用于背景和前景有明显对比的图像。它是根据整幅图像确定的:T=T(f)。但是这种方法只考虑像素本身的
灰度值,一般不考虑
空间特征,因而对噪声很敏感。常用的全局阈值选取方法有利用图像
灰度直方图的峰谷法、最小误差法、
最大类间方差法、最大熵自动阈值法以及其它一些方法。
在许多情况下,物体和背景的
对比度在图像中的各处不是一样的,这时很难用一个统一的阈值将物体与背景分开。这时可以根据图像的局部特征分别采用不同的阈值进行分割。实际处理时,需要按照具体问题将图像分成若干子区域分别选择阈值,或者动态地根据一定的
邻域范围选择每点处的阈值,进行图像分割。这时的阈值为自适应阈值。
阈值的选择需要根据具体问题来确定,一般通过实验来确定。对于给定的图像,可以通过分析直方图的方法确定最佳的阈值,例如当直方图明显呈现双峰情况时,可以选择两个峰值的中点作为最佳阈值。
图1(a)和(b)分别为用全局阈值和自适应阈值对经典的Lena图像进行分割的结果。
区域分割
区域生长和分裂
合并法是两种典型的串行区域技术,其分割过程后续步骤的处理要根据前面步骤的结果进行判断而确定。
区域生长的基本思想是将具有
相似性质的像素集合起来构成区域。具体先对每个需要分割的区域找一个种子像素作为生长的起点,然后将种子像素周围邻域中与种子像素有相同或相似性质的像素(根据某种事先确定的生长或
相似准则来判定)合并到种子像素所在的区域中。将这些新像素当作新的种子像素继续进行上面的过程,直到再没有满足条件的像素可被包括进来。这样一个区域就长成了。
区域生长需要选择一组能正确代表所需区域的种子像素,确定在生长过程中的
相似性准则,制定让生长停止的条件或准则。相似性准则可以是
灰度级、彩色、纹理、梯度等特性。选取的种子像素可以是单个像素,也可以是包含若干个像素的小区域。大部分
区域生长准则使用图像的
局部性质。生长准则可根据不同原则制定,而使用不同的生长准则会影响
区域生长的过程。区域生长法的优点是计算简单,对于较均匀的连通目标有较好的分割效果。它的缺点是需要人为确定种子点,对噪声敏感,可能导致区域内有空洞。另外,它是一种串行算法,当目标较大时,分割速度较慢,因此在
设计算法时,要尽量提高效率。
区域生长是从某个或者某些像素点出发,最后得到整个区域,进而实现目标提取。分裂合并差不多是
区域生长的逆过程:从整个图像出发,不断分裂得到各个子区域,然后再把前景区域合并,实现
目标提取。分裂合并的假设是对于一幅图像,前景区域由一些相互连通的像素组成的,因此,如果把一幅图像分裂到像素级,那么就可以判定该像素是否为前景像素。当所有像素点或者子区域完成判断以后,把前景区域或者
像素合并就可得到前景目标。
在这类方法中,最常用的方法是四叉树分解法(如图3所示)。设R代表整个
正方形图像区域,P代表逻辑
谓词。基本分裂合并算法步骤如下:(1)对任一个区域,如果H(Ri)=FALSE就将其分裂成不重叠的四等份;
(2)对相邻的两个区域Ri和Rj,它们也可以大小不同(即不在同一层),如果条件H(Ri∪Rj)=TRUE满足,就将它们合并起来。
(3)如果进一步的分裂或合并都不可能,则结束。
分裂合并法的关键是分裂合并准则的设计。这种方法对复杂图像的分割效果较好,但算法较复杂,计算量大,分裂还可能破坏区域的边界。
边缘分割
图像分割的一种重要途径是通过
边缘检测,即检测灰度级或者结构具有突变的地方,表明一个区域的终结,也是另一个区域开始的地方。这种
不连续性称为边缘。不同的
图像灰度不同,边界处一般有明显的边缘,利用此特征可以分割图像。
图像中边缘处像素的灰度值
不连续,这种不连续性可通过求导数来检测到。对于阶跃状边缘,其位置对应
一阶导数的
极值点,对应
二阶导数的过零点(零交叉点)。因此常用
微分算子进行边缘检测。常用的一阶
微分算子有
Roberts算子、
Prewitt算子和
Sobel算子,二阶微分算子有Laplace算子和Kirsh算子等。在实际中各种微分算子常用小区域模板来表示,微分运算是利用模板和图像
卷积来实现。这些算子对噪声敏感,只适合于噪声较小不太复杂的图像。
由于边缘和噪声都是灰度不连续点,在频域均为
高频分量,直接采用微分运算难以克服噪声的影响。因此用
微分算子检测边缘前要对图像进行
平滑滤波。LoG算子和
Canny算子是具有平滑功能的二阶和一阶微分算子,
边缘检测效果较好,如图4所示。其中LoG算子是采用
Laplacian算子求
高斯函数的
二阶导数,Canny算子是高斯函数的
一阶导数,它在噪声抑制和
边缘检测之间取得了较好的平衡。关于
微分算子的
边缘检测的详细内容可参考文献。
直方图法
与其他图像分割方法相比,基于直方图的方法是非常有效的图像分割方法,因为他们通常只需要一个通过像素。在这种方法中,直方图是从图像中的像素的计算,并在直方图的
波峰和
波谷是用于定位图像中的簇。颜色和强度可以作为衡量。
这种技术的一种改进是
递归应用直方图求法的集群中的形象以分成更小的簇。重复此操作,使用更小的簇直到没有更多的集群的形成。
基于直方图的方法也能很快适应于多个帧,同时保持他们的单通效率。直方图可以在多个帧被考虑的时候采取多种方式。同样的方法是采取一个框架可以应用到多个,和之后的结果合并,山峰和山谷在以前很难识别,但现在更容易区分。直方图也可以应用于每一个像素的基础上,将得到的信息被用来确定的像素点的位置最常见的颜色。这种方法部分基于
主动对象和一个静态的环境,导致在不同类型的
视频分割提供跟踪。
特定理论
图像分割尚无通用的自身理论。随着各学科许多
新理论和新方法的提出,出现了许多与一些特定理论、方法相结合的图像分割方法。
聚类分析
特征空间聚类法进行图像分割是将图像空间中的像素用对应的特征空间点表示,根据它们在特征空间的聚集对特征空间进行分割,然后将它们映射回原图像空间,得到分割结果。其中,K均值、模糊C均值聚类(FCM)算法是最常用的聚类算法。K均值算法先选K个初始类均值,然后将每个像素归入均值离它最近的类并计算新的类均值。迭代执行前面的步骤直到新旧类均值之差小于某一阈值。模糊C均值算法是在模糊数学基础上对K均值算法的推广,是通过最优化一个模糊
目标函数实现聚类,它不像K均值聚类那样认为每个点只能属于某一类,而是赋予每个点一个对各类的
隶属度,用隶属度更好地描述边缘像素亦此亦彼的特点,适合处理事物内在的
不确定性。利用模糊C均值(FCM)非监督
模糊聚类标定的特点进行图像分割,可以减少人为的干预,且较适合图像中存在不确定性和模糊性的特点。
FCM算法对初始参数极为敏感,有时需要人工干预参数的初始化以接近全局
最优解,提高分割速度。另外,传统FCM算法没有考虑
空间信息,对噪声和灰度不均匀敏感。
模糊集理论
模糊集理论具有描述事物不确定性的能力,适合于图像分割问题。1998年以来,出现了许多模糊分割技术,在图像分割中的应用日益广泛。
模糊技术在图像分割中应用的一个显著特点就是它能和现有的许多图像分割方法相结合,形成一系列的集成模糊分割技术,例如模糊聚类、模糊阈值、模糊
边缘检测技术等。
模糊阈值技术利用不同的S型隶属函数来定义模糊目标,通过优化过程最后选择一个具有最小不确定性的S函数。用该函数增强目标及属于该目标的像素之间的关系,这样得到的
S型函数的交叉点为
阈值分割需要的阈值,这种方法的困难在于
隶属函数的选择。基于
模糊集合和逻辑的分割方法是以
模糊数学为基础,利用隶属图像中由于信息不全面、
不准确、含糊、矛盾等造成的不确定性问题。该方法在
医学图像分析中有广泛的应用,如薛景浩等人提出的一种新的基于图像间模糊
散度的阈值化算法以及它在多
阈值选择中的推广算法,采用了
模糊集合分别表达分割前后的图像,通过最小模糊散度准则来实现图像分割中最优阈值的自动提取。该算法针对图像阈值化分割的要求构造了一种新的模糊
隶属度函数,克服了传统S函数带宽对分割效果的影响,有很好的通用性和
有效性,方案能够快速正确地实现分割,且不需事先认定分割类数。实验结果令人满意。
基因编码
把图像背景和目标像素用不同的基因
编码表示,通过区域性的划分,把图像背景和目标分离出来,具有
处理速度快的优点,但算法实现起来比较难。
小波变换
概述
小波变换是2002年来得到了广泛应用的
数学工具,它在时域和
频域都具有良好的局部化性质,而且小波变换具有
多尺度特性,能够在不同尺度上对信号进行分析,因此在
图像处理和分析等许多方面得到应用。
小波变换的分割方法
基于小波变换的阈值图像分割方法的基本思想是首先由
二进小波变换将图像的
直方图分解为不同层次的小波系数,然后依据给定的分割准则和小波系数选择阈值门限,最后利用阈值标出图像分割的区域。整个分割过程是从粗到细,有尺度变化来控制,即起始分割由粗略的L2(R)
子空间上投影的直方图来实现,如果分割不理想,则利用直方图在精细的子空间上的
小波系数逐步细化图像分割。分割算法的计算馈与
图像尺寸大小呈线性变化。
相关应用
(2)组织体积的测量
(3)计算机引导的手术
(4)诊断
(5)治疗方案的定制
已经有了许多各种用途的图像分割算法。对于图像分割问题没有统一的
解决方法,这一技术通常要与相关领域的知识结合起来,这样才能更有效的解决该领域中的图像分割问题。
总结展望
对图像分割算法的研究已有几十年的历史,借助各种理论已提出了上千种各种类型的分割算法。尽管人们在图像分割方面做了许多研究工作。但由于尚无通用分割理论,因此现已提出的分割算法大都是针对具体问题的,并没有一种适合于所有图像的通用的分割算法。但是可以看出,图像分割方法正朝着更快速、更精确的方向发展,通过各种新理论和新技术结合将不断取得突破和进展。