
3.3.2 图像分割的Mumford-Shah模型和Chan-Vese模型
图像分割的目的是将图像中的灰度同质的区域分离出来,并通过各个同质区域的边界来表达.通常基于几何活动轮廓线模型分割图像的方法仅依赖于包围待分割目标或在目标内部的轮廓线所在位置的图像局部信息,难于综合图像区域的全局信息.如果轮廓线位于边缘尖锐度较弱的平滑边缘,则可能越过边缘,出现“冒顶”现象,且不会返回到正确位置.
这里介绍用于图像分割的Mumford-Shah模型和Chan-Vese模型(简称C-V模型).Mumford-Shah模型可以直接对图像进行运算,仅基于图像数据的驱动来完成分割,而不依赖于图像局部梯度信息.Mumford-Shah模型的能量函数包含了对图像区域、边界的描述,并且可以通过优化能量函数,一次获得图像(包括带噪声的)边界、区域以及平滑图像.
1)Mumford-Shah模型
Mumford和Shah[53]提出了一个关于图像分割的目标函数,并且通过泛函优化的方法进行图像分割.设图像I(x, y)的定义域为Ω,当前考察的图像边界C将图像I(x, y)划分为若干近似同值(质)区域,并得到分割图像Io(x, y).Mumford-Shah图像分割模型就是通过寻找真正的图像边界Co,将图像I(x, y)划分为若干同值区域,并且所得分割图像和I的误差比所有分割图像和原图像的误差还小,即最小化如下能量方程:

其中,

式中,λ和μ为正权数;dσ=dxdy为关于面积积分;|C|为曲线C的长度;最小点函数argmin参见式(3-13).当FMS(Io,C)最小时,所得边界Co将图像划分为若干个平滑区域,并且保留了尖锐的边界Co.
2)简化的Mumford-Shah图像分割模型
对于复杂图像边界,长度|C|难以计算,所以Ambrosio等[54-55]提出了改进的能量函数,针对原模型使用各向同性线性扩散做恢复,Teboul等[56]提出利用非线性保边正则化的能量函数.
为方便计算,Chan和Vese提出一种利用水平集方法求解简化的Mumford-Shah模型的图像分割方法,推动了Mumford-Shah模型的应用.Chan和Vese[57-58]提出的简化Mumford-Shah模型原理如下:
假设图像中每个同值区域的灰度值都是常数,对于区域Di⊂(Ω\C),有I(Di)=ci, ci是常数,则最小化能量泛函FMS的目的就是寻找最优化分割线(边界)Co,使得分割图像Io和原图像I之间的差异最小.此即为C-V模型原理.
这里首先引入泛函来理解C-V模型.设原图像I(x, y)被活动轮廓线C划分为目标Ωo=inside (C)和背景Ωb=outside (C)两个区域,模型的拟合能量泛函如下:

式中,C是任意闭合活动轮廓线;co和cb是依赖于C的两个常数.当闭合活动轮廓线C没有位于两个同值区域的边界Co时,F(C)不能达到最小值.
据此,Chan和Vese提出了如下的图像分割能量函数:

式中,|C|是闭合轮廓线C的长度;μ、λo、λb(μ≥0, λo>0, λb>0)是各个能量项的权重系数;F的首项是平滑项.最终分割轮廓线C的位置以及未知数co和cb经最优化式(3-22)得到,即

由于此模型利用了图像全图信息,因此通过最优化能量泛函,可以得到全局最优的图像分割结果.
3)基于水平集求解C-V模型
C-V模型的完整推导也需利用变分法,这里我们简化了理论推导,但其实质还是变分分析过程.
设Φo是根据初始轮廓线Co构造的符号距离函数(signed distance function, SDF),即{Co|Φo(x, y)=0}.并设Φ为内正外负型的SDF,即
Φo[inside (C)]>0, Φo[outside (C)]<0
可以证明,以水平集函数表达的轮廓线C的长度为

上式中的Ω是水平集函数的定义域,赫维赛德(Heaviside)函数H(z)表示如下:

而是狄拉克(Dirac)函数.以水平集函数ϕ表达为

下面关于co、cb和ϕ求F(ϕ, co,cb)的极小值.由于F(ϕ, co,cb)达到极小值时,一定是F(ϕ, co,cb)关于每一个变量的偏导数为零的时刻,因此,将ϕ固定,对能量函数F(ϕ, co,cb)关于co求偏导,得

整理得

即

同样对F(ϕ, co,cb)关于cb求导数,得

整理得

即

现固定co和cb,对F(ϕ, co,cb)关于ϕ求导数,此时有

首先考虑


利用泰勒公式对上式进行展开,有

故有

记div为向量场的散度.由φ的任意性可知


为了计算式(3-17)至(3-23)的解,引入时间变量

式中,

从式(3-28)可看出,偏微分方程右边所涉及的图像函数I(x, y)范围是全图像,而不像测地线活动轮廓模型,仅利用轮廓线C所在位置的图像数据.式中的co和cb也在图像定义域内,具有全局特征.因此,Chan和Vese强调该方法的一个特点就是全局优化,仅使用一条初始闭合轮廓线,就可把带有内部空洞的目标的内部检测出来,不需要为检测内部空洞而另做特别处理.
4)图像分割方法的数值解法
这里采用显式有限差分数值解法而不是C-V模型的隐式解法,对分割做介绍,以期式(3-28)的数值解法更好的稳定性.具体如下:
设h为二维网格步长,(xi, yj)=(ih, jh), i、j(1≤i, j≤M)为网格坐标,则是关于h对ϕ(x, y)在网格上的近似,有n≥0, ϕ0=ϕ0.
引入如下差分格式记号:

根据Osher和Sethian[52]求解水平集的“熵守恒”差分方法,得到如下数值解表达式:

其中

Ki, j是水平集函数在(i, j)处的曲率,通过下式定义:

也可以由中心差分和
近似计算出来.
在实际算法应用中,为避免不必要的迭代计算,给出了如下迭代收敛判断条件:

式中,M是满足的网格点数目.当Q<Qr时,迭代结束,Qr是门限.