HTML
-
实验平台的配置为Intel Core i7-8700k CPU 3.70GHz,32GB,GPU NVIDIA GeForce GTX 1070,基于Windows 10为操作系统,开发语言是基于Tensorflow后端的Keras库和Python。
-
本文中使用的数据集分别是Indian Pines和Pavia University。Indian Pines数据集中的图像尺寸为145×145,可用波段数量为200个,包含16种土地覆盖类别,具体的地物覆盖类别数量信息如表 1所示。Pavia University数据集中的图像尺寸为610×340,可用波段数量为103个,包含9种土地覆盖类别,具体的地物覆盖类别数量信息如表 2所示。
color name number color name number — — Oats 20 Alfalfa 46 Soybean-notill 972 Corn-notill 1428 Soybean-mintill 2455 Corn-mintill 830 Soybean-clean 593 Corn 237 Wheat 205 Grass-pasture 483 Woods 1265 Grass-trees 730 Buildings-Grass-Trees-Drives 386 Grass-pasture-mowed 28 Stone-Steel-Towers 93 Hay-windrowed 478 Table 1. Category information of Indian Pines
color name number color name number — — Painted metal sheels 1122 Asphalt 5472 Bare Soil 4572 Meadows 13750 Bitumen 981 Gravel 1331 Self-Blocking Bricks 3363 Trees 2573 Shadows 776 Table 2. Category information of Pavia University
2.1. 实验平台
2.2. 实验数据集
-
实验中需要对原始高光谱图像进行数据预处理。首先,实验中采用的是PCA法来减少频谱冗余信息,在Indian Pines数据集中选取了30个主成分,在Pavia University数据集中选取了15个主成分。之后,将Indian Pines数据集进行切块处理,对于两个不同的数据集,作者采用相同的空间尺寸25作为3维立方体的空间尺寸输入。Indian Pines数据集中使用的3维数据立方体尺寸为25×25×30,Pavia University数据集中使用的3维数据立方体尺寸为25×25×15。此外,实验中的迭代训练次数设置为100,批次大小为128,学习率为0.001。之后再使用Adam优化器的反向传播算法通过softmax函数训练该模型。
在第1个分支中,它主要包括两个3-D卷积层和两个2-D卷积层。两个3-D卷积层的卷积核是(3, 3, 7)和(3, 3, 5),相对应的滤波器的数量是8, 16。两个2-D卷积层的卷积核是(3, 3)和(3, 3),采用的滤波器的数目都为64。在第2个分支中,使用3D-CNN来提取光谱和空间特征,该分支包含3个3维卷积层和3层池化层。这3个3-D卷积层的卷积内核分别是(3, 3, 7)和(3, 3, 5)和(3, 3, 3),相对应的滤波器的数目分别是8, 16和32。在这两个分支中,均采用的是最大池化,在3维卷积层之后的最大池化尺寸为(2, 2, 1),在2维卷积层之后的最大池化尺寸是(2, 2)。之后使用多尺度特征融合策略,将该双分支CNN得到的特征进行融合,可有效保证模型提取到特征的完整性。同时,ReLU和dropout的组合使用旨在缓解过度拟合的问题,有效提高了模型的鲁棒性和泛化性能。为了验证该算法的分类效果,实验中使用的训练样本数目占比为20%,测试样本数目占比为80%。实验中采用的评价指标分别是平均分类准确度(average accuracy, AA),kappa系数和整体分类准确度(overall accuracy, OA),在高光谱图像分类领域中,通常使用这些指标值的高低进行验证不同模型之间的性能差异。这些指标(AA,kappa,OA)的值越高,表明相对应算法模型的分类性能越有竞争优势。
表 3和表 4中分别给出了在不同数据集上不同方法得到的AA,kappa和OA的结果值。为了全面验证模型的性能,将该方法模型与未使用多尺度特征融合的方法(Proposed-1)支持向量机(support vector machine, SVM)[21],2D-CNN[18],3D-CNN[17],SSUN[8]等算法进行了对比。
methods SVM 2D-CNN 3D-CNN SSUN Proposed-1 HY-CNN AA/% 83.15±1.1 82.70±1.0 89.07±0.6 97.12±0.1 98.93±0.1 99.24±0.1 kappa/% 84.27±0.45 85.01±1.6 93.09±0.3 97.52±0.1 98.96±0.1 99.35±0.1 OA/% 86.24±0.38 86.90±1.3 93.95±0.4 97.86±0.1 99.06±0.1 99.36±0.1 Table 3. Classification evaluation index value(Indian Pines)
methods SVM 2D-CNN 3D-CNN SSUN Proposed-1 HY-CNN AA/% 93.60±0.14 95.10±0.1 96.54±0.5 99.90±0.0 99.75±0.1 99.91±0.03 kappa/% 93.63±0.17 96.04±0.3 97.10±0.3 99.72±0.1 99.80±0.05 99.90±0.05 OA/% 95.20±0.13 96.02±0.4 97.81±0.2 99.76±0.1 99.82±0.05 99.95±0.05 Table 4. Classification evaluation index value (Pavia University)
从表 3中的数据分析可知,在Indian Pines数据集上,该方法相比于SSUN而言具有很大的性能优势,3种评价指标OA,AA和kappa的值均增加了约2%;该方法相比于传统的神经网络2D-CNN和3D-CNN而言具有明显的性能优势,它能够更好地利用空间和光谱-空间信息;同时该方法相比于监督分类方法SVM而言也表现出了极大的竞争优势,分类性能有了明显的提升。从表 3可知,该方法的波动幅度相对较小,性能表现相对较稳定。由于使用了特征融合使得该方法能够捕捉细粒度的空间细节信息,降低了特征信息损失,因此使用多尺度特征融合策略的HY-CNN方法模型相比于不使用多尺度特征融合的方法模型(Proposed-1), 具有较好的性能。
从表 4中的数据分析可知,在Pavia University数据集中,该方法相比于传统的卷积网络3D-CNN而言,OA和kappa的值增加了约2%,AA的值增加了约3%。相比于2D-CNN,OA和kappa的值增加了约3%,AA的值增加了约4%。同时相比于先进的SSUN算法也表现出竞争优势,并且在该数据集上也表明了使用多尺度特征融合策略的HY-CNN方法具有性能优势且相对于其它方法性能较稳定。从表 3和表 4中的分类精度结果可知,在两个数据集上, 本文中提出的HY-CNN方法模型均进一步改善了高光谱图像的分类精度,并且也都表现出了较平稳的效果。
为了更加全面地验证HY-CNN方法的分类性能,在表 5中也给出了在不同数据集上该方法的空间增强分支和光谱-空间分支各自的分类结果,其中空间增强分支作为其第1个分支,光谱-空间分支作为其第2个分支。
Indian Pines Pavia University the first branch the second branch HY-CNN the first branch the second branch HY-CNN AA/% 97.82±0.4 97.76±0.6 99.24±0.1 99.34±0.2 99.46±0.1 99.91±0.03 kappa/% 98.27±0.2 98.33±0.2 99.35±0.1 99.46±0.2 99.56±0.1 99.90±0.05 OA/% 98.36±0.3 98.64±0.2 99.36±0.1 99.54±0.1 99.75±0.05 99.95±0.05 Table 5. Classification evaluation index values of different sub-branch
从表 5中的数据分析可知,在Indian Pines数据集中,HY-CNN方法与自身的空间增强分支和光谱-空间分支相比较而言,AA增加了约2%,kappa增加了约1%,OA增加了约1%。在Pavia University数据集中,HY-CNN方法与自身的空间增强分支和光谱-空间分支相比较而言,AA和kappa的两个评估指标增加了约0.5%,OA增加了约0.4%。同时在表 4中也给出了未使用多尺度特征融合的方法模型(Proposed-1)的分类结果,表 4和表 5中的数据均能够证明HY-CNN方法具有一定的分类性能优势。
传统的图像一般包含3个通道,高光谱遥感图像不同于传统的图像,具有丰富的光谱信息,波段数较多,且它存在“休斯现象”和“同物异谱”、“异物同谱”,容易受到外界复杂的空间分布和环境变化的影响,导致高光谱遥感图像的分类精度不理想。针对具有3维结构的高光谱遥感图像,将本文中的方法与一般的图像分类方法(ResNet50,DenseNet169等)进行了对比分析。表 6中给出了这两个方法在不同数据集上的AA,kappa和OA的结果值。可以看出: HY-CNN方法也表现出一定的性能优势。
Indian Pines Pavia University ResNet50 DenseNet169 HY-CNN ResNet50 DenseNet169 HY-CNN AA/% 96.41±0.2 97.36±0.4 99.24±0.1 99.57±0.2 99.32±0.1 99.91±0.03 kappa/% 97.32±0.4 97.71±0.6 99.35±0.1 99.63±0.1 99.70±0.05 99.90±0.05 OA/% 97.56±0.4 97.62±0.2 99.36±0.1 99.65±0.1 99.75±0.1 99.95±0.05 Table 6. Comparative analysis of the results of different methods
图 2和图 3中分别给出了在Indian Pines和Pavia University两个数据集上实验所得到的混淆矩阵。
图 2和图 3中的右侧是一个色度带,每个类相应的样本数量用相对应的颜色显示。从图 2和图 3可以看出,使用HY-CNN方法模型在Indian Pines和Pavia University不同数据集上实验得到的混淆矩阵中误分类现象较少。通过以上混淆矩阵效果图可以直观看出该方法的分类性能,它的主对角线上的元素越多,表示该方法分类性能越好。同时,还可以便于分析每个类别中是否存在误分类现象以及相应不同地物类别的分类效果差异。
图 4和图 5分别是在两个不同数据集上(20%训练样本,80%测试样本)相应方法的分类可视化图(Indian Pines,Pavia University)。
从图 4c和图 5c可以看出,3D-CNN方法模型存在一些误分类问题,分类性能相对不佳。图 4d、图 4e和图 5d、图 5e相比于3D-CNN方法而言,性能有了极大提升,减少了一些误分类现象。由于使用了多尺度特征融合策略,使得提取到的特征具有更强的表示能力,因此,图 4e和图 5e相比于图 4d和图 5d而言,其分类性能有了进一步改善,且分类结果图具有较平滑和清晰的视觉效果。从图 4和图 5中的结果分析可知,该方法针对高光谱图像的分类表现结果具有竞争优势,在两个数据集上本文中所提出的HY-CNN方法显示出了先进的效果。