Study on vegetation camouflage exposure in Relief-F screening band
摘要: 为了快速揭露植被伪装,基于Relief-F算法进行了高光谱波段选择,将高光谱研究问题转化为多光谱应用问题。首先以常见植物云杉模拟植被伪装目标,利用HH2地物光谱仪采集实验数据,然后引入Relief-F算法筛选特征波段子集,与其它两种常用算法得到的波段子集进行了分类实验。结果表明,使用Relief-F算法筛选特征波段子集分类精度达96.4%,高于其它两种算法。该研究对于揭露植被伪装问题是有帮助的。Abstract: In order to quickly expose vegetation camouflage and transform the hyperspectral research problem into the multi-spectral application problem, the hyperspectral band was selected based on the Relief-F algorithm was selected for the study of vegetation camouflage. First, the common plant spruce was used to simulate vegetation camouflage targets, and the HH2 ground-object spectrometer was used to collect experimental data. Then, the author introduced the Relief-F algorithm to screen the subset of feature bands, and conducted classification experiments with the subset of band obtained by other two common algorithms.The results show that the classification accuracy of using the Relief-F algorithm to choose the feature band subset is up to 96.4%, which is higher than the other two algorithms. This research is helpful for exposing the camouflage problem of vegetation.
针对上述问题,作者提出基于过滤式特征选择扩展(relevant feature, Relief-F)算法进行高光谱波段选择,用于进行揭露植被伪装问题的研究。通过模拟一个植被伪装目标作为研究对象,分析不同时间段下伪装目标光谱特征的变化。一方面通过观察光谱数据,定性分析变化较大的波段范围及变化幅度;另一方面,引入Relief-F算法分析伪装目标与周围环境的光谱波段的差异性,结合子空间划分的思想进行波段选择。最后与传统的波段选择方法进行对比,验证Relief-F算法在这一问题上的有效性。
1. 实验
1.1 设置伪装目标
1.2 光谱数据采集与预处理
本实验中采用ASD公司生产的Hand Held 2(HH2)便携式地物光谱仪进行数据采集,光谱波长范围为325nm~1075nm,波长精度±1nm,光谱分辨率小于3.0nm。分别对新鲜采集的植物样本、在自然环境下放置24h, 48h和72h的3个伪装目标进行光谱数据采样,对每一种样本采集50个样本数据,共200个光谱数据,如表 1所示。
Table 1. Spectral data sampling tablespectral data collection sample number of collected data/piece vegetation environment
(freshly collected spruce leaf samples)50 vegetation camouflage 1
(spruce leaf samples collected 24h later)50 vegetation camouflage 2
(spruce leaf samples collected 48h later)50 vegetation camouflage 3
(spruce leaf samples collected 72h later)50 为了降低周围环境中散射光对光谱数据质量的影响,实验人员统一着深色服装。采集数据时,首先对光谱仪采集暗电流、定标,然后将仪器垂直向下对准目标,距离目标约1m,确保实验人员面向太阳,目标上无阴影。采集数据过程中,每经过10min,需要对光谱仪再次定标。
1.3 Relief-F算法
假设存在数据集D={(xi, yi)}, i=1, …, n,其中xi代表第i个样本,yi代表第i个样本标签。首先从数据集中随机选择一个样本xi,随后从该样本的同类样本中寻找k个距离最近样本Hi,其中|Hi|=k,从异类样本中寻找k个距离最近样本Mi,|Mi|=k。对于每一个样本xi定义一个平均间隔向量ρi:
\overline{\boldsymbol{\rho}}_{i}=\frac{1}{k}\left(\sum\limits_{\boldsymbol{x}_{n} \in \boldsymbol{M}_{i}}\left|\boldsymbol{x}_{i}-\boldsymbol{x}_{n}\right|-\sum\limits_{x_{n} \in \boldsymbol{H}_{i}}\left|\boldsymbol{x}_{i}-\boldsymbol{x}_{n}\right|\right) (1) 在得到每一个样本的平均间隔向量后,利用下式来更新特征权重向量w:
\max \limits_{\boldsymbol{w}} \sum\limits_{i=1}^{n} \boldsymbol{w}^{\mathrm{T}} \overline{\boldsymbol{\rho}}_{i}, \left(\|\boldsymbol{w}\|_{2}^{2}=1, \boldsymbol{w} \geqslant 0\right) (2) 式中, ‖·‖表示范数。连续迭代一定次数,最终得到各个特征的权重向量w。
1.4 实验流程
2. 结果与分析
2.1 各类样本采集的光谱特征
图 1是对各类样本采集到的光谱数据。每一种样本的光谱曲线取50个样本数据平均值。
通过观察图 1可以发现,与刚采集的云杉叶相比,植被伪装的时间越长,在第130波段~第250波段以及第300波段~第500波段的光谱曲线变化程度越多,这两处波段范围对应的波长范围分别是455nm~575nm和625nm~825nm波长范围内,处于水吸收波段和红光及红外波段范围。这一范围正是植物的水吸收区和“红边”的两个区域,表明植被伪装的中植被的水分和叶绿素随着时间推移在不断减少,导致对应波段范围内的光谱曲线发生相应改变。同时观察图 1还可以发现,当云杉采集24h、48h和72h后,光谱特征的变化幅度不相同。从24h~48h这段时间,在455nm~575nm和625nm~825nm波长范围内的光谱特征变化幅度明显增大。综上所述,当利用植被伪装军事目标时,短时间内伪装效果比较好,长时间之后,伪装效果会迅速下降。
2.2 基于Relief-F算法的特征波段提取
利用Relief-F算法对植被环境、植被伪装1、植被伪装2和植被伪装3共4种样本的数据进行特征权重分析,如图 2所示。
从图 2中可以看出, 在权重较高,对应点波长范围分别是425nm~525nm和575nm~785nm,与从图 1中观察所得结果略有出入,但总体上是相同的。波段的权重系数越高,说明植被环境与伪装目标之间在该波段内差异越大。其中单波段权重系数最高的是第432波段,对应的波长为767nm,波段位于“红边”位置。
2.3 算法性能对比
为了验证Relief-F在揭露植被伪装的性能,将Relief-F算法与常用的波段选择算法进行对比,常用的算法包括最佳指数法、自动子空间划分法。使用3种算法选择10个波段,波段选择结果如表 2所示。
Table 2. Subset of bands selected by three algorithmsband selection method band subset optimum index factor 412,357,58,133,134,531,532,533,441,215 auto subspace partition 67,68,69,70,133,134,135,136,137,138 Relief-F 432,417,443,357,323,137,151,160,148,149 验证3种波段选择算法所得的波段子集的分类精度,具体方法为:对所测200条光谱数据利用k均值算法进行无监督分类,将其分为植被环境、植被伪装1、植被伪装2和植被伪装3共4类,其中总体分类精度代表被正确分类的样本占所有样本数的比例。分类结果如表 3所示。
Table 3. Classification accuracy of three algorithmsoptimum index factor/% auto subspace partition/% Relief-F/% vegetation environment 90.3 93.1 95.6 vegetation camouflage 1 89.5 92.4 96.3 vegetation camouflage 2 91.3 93.5 96.5 vegetation camouflage 3 91.6 93.4 97.2 overall classification similarity 90.4 93.1 96.4 从表 3中的分类结果可以发现,利用Relief-F算法选择的特征波段分类精度高于其它两种算法,表明Relief-F提取到的特征波段子集在揭露植被伪装方面具有一定优越性。再利用余弦相似度将3种算法分类结果同地物真实分类标记结果比较,余弦值如表 4所示。值越接近于1,表明相似程度越高。
Table 4. Cosine similarity between the classification results of three algorithms and the real classificationoptimum index factor auto subspace partition Relief-F vegetation environment 0.8742 0.9325 0.9534 vegetation camouflage 1 0.8892 0.9367 0.9595 vegetation camouflage 2 0.9031 0.9410 0.9778 vegetation camouflage 3 0.9246 0.9462 0.9853 overall classification similarity 0.8978 0.9391 0.9690 由表 4中的余弦相似度可知,通过Relief-F算法比较波段权重系数选择的特征波段分类结果相似度比其它两种筛选波段的算法略高,说明该算法可以应用于揭露植被伪装的实践中。
3. 结论
