然而,单一特征对SAR图像的描述能力有限,如果图像的类间变化较小,而类内变化较大,若只使用一种类型的特征,则可能出现个别类识别准确率较低的现象。
特征向量内不同特征分量的幅度变化较大,而且不同特征向量的物理意义也不同,相似距离的可比性差。因此,在利用多种类型特征进行图像分类时,不仅要对特征向量内部的特征分量进行归一化处理,还需要对不同特征向量再进行归一化,这样才能保证不同特征在同一准则下进行选择。本文所使用的4种特征都经过归一化处理,并依次串接起来作为图像数据的新特征,便于下一步处理。
式中,Sm为已选的特征集合;m为特征个数;c为目标类别;H(fi|c)表示特征fi在目标类别下的信息熵;H(fi)表示j特征fi的信息熵;I(fi,c)为特征fi与目标类别之间的互信息;I(fi,fj)为特征fi与fj之间的互信息。因此,假定已确定特征集Sm,下一步从{S-Sm}中选择第m+1个特征的公式为:
单层SVM算法可通过非线性变换将低维的特征空间映射到高维特征空间,并通过构建判别函数实现对图像的分类。但单层次分类仅仅通过单方面的计算,得到每个像素属于每种类别的概率,然后取其中概率最大的类别,实现对图像的分类。这种分类方法一次性将像素归为具体的类别,对训练样本的选择有很高的要求,而且容易造成错分现象。
本文引用多层的思想,多层分类可以在不同的层次中,使用不同的信息对数据进行处理,分层解决不同的分类需求,对于单层的错分现象也可以进行相应的改善。双层SVM流程图如图1所示,具体步骤为:(1)针对每个类别分别进行特征选择,选择出最适合把该类识别出来的最优特征子集;(2)构造线性判别函数和超平面,将每种类别的最优特征子集分别通过第1层SVM分类器,得到每个像元属于类A、类B…的概率,假设一共有n个类,则每个像元有n个概率α1,α2,…,αn;(3)将每个像素的n个概率作为像素的特征,重新导入第2层SVM分类器中进行训练;(4)根据训练参数,结合概率特征对图像进行分类,得到最终的分类结果。
基于FS-BSVM算法的极化SAR图像分类框架如图2所示。首先,针对单一特征表示图像不能满足分类需要的问题,多种类型的特征被引入到了本文模型中。在本文算法中分别提取了4类特征,分别为:(1)极化分解特征;(2)GMRF;(3)GLCM;(4)基于测量数据的极化特征。由于不同特征的物理意义不同,若基于某个特征计算两图像间的相似距离,其范围的差别比较大,相似距离之间的可比性差。因此,在利用综合特征进行图像检索时,需要对不同特征向量进行归一化处理,以保证不同的特征向量在同一准则下进行选择,以期在进行分类时具有相同的作用。
最后,将不同类别的最优特征子集导入双层SVM。将第1层中得到的每个像素属于各个类别的概率重新串接,作为图像的特征输入到第2层中,得到最终的分类结果。
本文的实验数据为旧金山海湾地区的AIRSAR图像,如图3(a)所示,图像大小为900像素×1024像素。该地区地物地貌类型丰富,包括山地、海洋、湖泊、草坪、建筑等。本文将地物类型设置为山地、水体、建筑和绿地4类,GroundTruth为ARCGIS软件针对同一时期的旧金山地区的真实地表进行的人工判读和标注,如图3(b)所示。
本文在实验数据的每一类中分别选取10%作为训练数据,另外90%作为测试数据。
特征选择的维数设置对分类精度有较大影响。特征维数的增加虽能在一定程度上提高分类精度,但计算代价更高。本文经过空间金字塔后的特征总维数为51×21=1071维,通过综合考虑实验精度和计算复杂度并反复实验,最终将实验数据中每种类别的最优特征子集维数设置为200维。
为了验证该算法在极化SAR图像分类中的有效性,设置对比实验1为基于极化分解特征和单层SVM的分类,对比实验2为基于极化分解特征和特征选择双层SVM的分类,对比实验3为基于特征融合和单层SVM的分类。通过不同组实验结果的相互比较,可分别验证特征融合方法相比于单个类型的特征、双层SVM相比于单层SVM的优越性。
本文通过分析实验数据中建筑、绿地、水体、山地的分类准确率来评价对比算法及FS_BSVM算法的分类精度,如图3和表2所示。
1)对比实验1中,绿地很大一部分被错分到了建筑中,准确率仅为48.52%,而山地也有一部分被错分为建筑,因而加权平均准确率最低。
2)对比实验2和3中,绿地和山地的分类准确率相比于实验1逐渐改善,但仍明显低于FS_BSVM。
3)FS_BSVM的分类结果中,除了建筑区域0.02%的差距,其余类别的分类准确度均优于对比实验。
对本文提出的方案和对比实验方案的结果进行分析:(1)对比实验1是建立在问题的复杂度和结构风险最小原理基础上的,提取的特征比较单一,而本文的样本的数目相对越小,因此导致较低的分类准确率。(2)对比实验3融合了SAR图像的4种类型的特征,能更全面地描述图像,因此分类准确率较对比实验1明显提高。(3)对比实验2和FS_BSVM算法是分别在对比实验1、3的基础上由单层SVM变为双层SVM,从实验结果可看出,双层SVM比单层SVM的分类准确率要高,表明双层SVM确实能提高图像的分类准确率。(4)本文所提出的基于特征选择双层SVM的分类方法,综合了各类特征,同时针对每个类别选取最优特征子集,确保不同的特征子集在特定类别中获得较高的分类准确率,最后双层SVM引入了多层的思想,能够对SAR图像实现较精确的分类。从图3可明显看出FS_BSVM算法的优越性。
本文提出了一种基于特征选择双层SVM的特征融合算法,通过mRMR方法能对不同目标类别选取最优的特征子集,且充分利用空间金字塔中不同尺度下的特征,并构建了一个双层SVM模型实现极化SAR图像的分类。相比于单一特征和单层SVM,该算法可极大程度地利用极化SAR图像中的有用信息,而且稳定性较高。实验结果验证了该算法的优越性。下一步的研究方向将考虑此算法效率的优化。