-
余弦相似度理论作用于空间向量,通过向量夹角的余弦值来判定向量间夹角的大小,从而判断向量之间的接近程度。该理论在文章检测和相似度分析方面有着广泛的应用[11]。若a=[x1,y1,z1],b=[x2,y2,z2], 则a与b夹角余弦值为:
$ {\rm{cos}}\theta = \frac{{{x_1}{x_2} + {y_1}{y_2} + {z_1}{z_2}}}{{\sqrt {{x_1}^2 + {y_1}^2 + {z_1}^2} ·\sqrt {{x_2}^2 + {y_2}^2 + {z_2}^2} }} $
(1) 式中, a, b分别表示两空间向量,x1,y1,z1; x2,y2,z2为空间向量的分量,θ为空间向量的夹角。
当a与b的大小分别为a和b、夹角对边大小为c时,有:
$ {\rm{cos}}\theta = \frac{{{{a}^2} + {b^2} - {c^2}}}{{2ab}}{\rm{ }} $
(2) 结合余弦相似度理论的原理,目标与背景之间的相似性判断符合该方法的计算要求,但需要构造能够表征目标和背景信息的特征向量。图像的表征特征有视觉特征、统计特征、变换系数特征以及代数特征等[12],较为常用的是视觉特征中的亮度信息和统计特征中的直方图信息[13]。基于此,本文中选取视觉特征中具有代表性的图像特征指标,通过图像直方图和亮度空间分布进行图像之间信息的比对,对伪装效果进行评估,以此来阐释该方法的操作性和可行性,对于其它的特征以及相应的指标只需采取相关的方法进行选取,然后利用该方法进行伪装效果的评估即可。
RGB颜色空间以红、绿、蓝3种基本色为基础,通过3种基本色不同程度的叠加,形成丰富而广泛的颜色空间[14]。每一种基本色根据其亮度的不同,可以划分为256个等级,则3种基础色在进行颜色混合叠加的时候会有256×256×256种组合,可以涵盖人眼能够分辨的所有颜色[15]。HSV颜色空间和RGB颜色空间之间可相互转换[16],转换后的h, s, v分别代表色度、饱和度、亮度,以另一种形式记录图像的信息[17]。大多数成像设备以像素为单位对图像进行显示,软件中图像分析时以像素点为基本单元进行处理,图像在存储时以像素为最小单元,在内存中记录每一个像素点的信息,因此每一个像素点可看成一个信息包,整张图像组成一个信息库。图像对比以及图像识别就是对像素点所包含信息进行处理和对比的过程。进行目标与背景相似度分析的流程如图 1所示。
将目标图像特征向量记作fRGB, 1和fHSV, 1,相应分量为r1, g1, b1和h1, s1, v1;背景图像特征向量记作fRGB, 2和fHSV, 2,相应分量为r2, g2, b2和h2, s2, v2。则有:
$ \left\{ {\begin{array}{*{20}{c}} {{\mathit{\boldsymbol{f}}_{{\rm{RGB, 1}}}} = \left( {{r_1}, {g_1}, {b_1}} \right)}\\ {{\mathit{\boldsymbol{f}}_{{\rm{HSV, 1}}}} = ({h_1}, {s_1}, {v_1})} \end{array}} \right. $
(3) $ \left\{ {\begin{array}{*{20}{c}} {{\mathit{\boldsymbol{f}}_{{\rm{RGB, 2}}}} = ({r_2}, {g_2}, {b_2})}\\ {{\mathit{\boldsymbol{f}}_{{\rm{HSV, 2}}}} = \left( {{h_2}, {s_2}, {v_2}} \right)} \end{array}} \right. $
(4) 式中,θ1, θ2分别记作目标与背景的颜色特征向量夹角和亮度特征向量夹角,则有:
$ \left\{ {\begin{array}{*{20}{c}} {{\rm{cos}}{\theta _1} = \frac{{{r_1}{r_2} + {g_1}{g_2} + {b_1}{b_2}}}{{\sqrt {{r_1}^2 + {g_1}^2 + {b_1}^2} \cdot \sqrt {{r_2}^2 + {g_2}^2 + {b_2}^2} }}}\\ {{\rm{cos}}{\theta _2} = \frac{{{h_1}{h_2} + {s_1}{s_2} + {v_1}{v_2}}}{{\sqrt {{h_1}^2 + {s_1}^2 + {v_1}^2} \cdot \sqrt {{h_2}^2 + {s_2}^2 + {v_2}} }}} \end{array}} \right. $
(5) 军事目标伪装的目的在于降低目标被发现和定位的概率,增加军事目标的生存能力,美军打击叙利亚过程中,叙方伪装措施的采用使得其部分设施存活率提升了30%,这是对伪装作用发挥的最好例证。一般地,当目标与背景的相似度达到0.8以上时,有理由说明目标的伪装起到了伪装效果。从而利用余弦相似度方法得到目标与背景的相似度,可以借鉴进而加以判别。
-
针对余弦相似度理论在可见光中的应用原理,提取图像各特征作为图像特征向量的分量,为了达到好的评估效果,该类图像选取须遵循以下原则:
(1) 评估对象为RGB图像类型。将原图像和转换后图像分解为r, g, b, h, s, v等6个通道,决定了评估对象目标和背景需具备彩色特征。而对于二值图像或者灰度图像,可另取图像特征作为向量分量,例如统计特征、代数特征等。
(2) 评估图像目标和背景可识别。评估过程中,加以比较的是目标和背景的图像特征向量,因而要求目标和背景能够被系统识别才能得到参与比较的图像特征向量。
-
为了验证本文中提出方法的科学性和合理性,凸显该方法在伪装效能评估领域的实用价值,拟用实例开展验证。以图 2为研究对象,进行目标的提取和背景的分割,实现图像信息的采集和处理,通过目标与背景的特征向量之间的关系来量化伪装的效果。
图 2中,背景为典型的林地背景,颜色以浅绿色为主,混合杂色斑点。目标身着林地迷彩伪装服,颜色为绿色和褐色相间,头部以深绿色为主,武器装备以黑色为主。颜色体系中,目标与背景的颜色处于相似位置,在一定距离上其伪装效果较好。同时,目标的褐色斑点与背景的阴影部位同属于暗色系,具有极大的相似性,融合效果较好。基于此,在可见光范围内,目标与背景的融合效果较好,能够发挥好的伪装效果。
-
伪装的本质是处理目标与背景之间的关系,重点是目标相对于背景的融合程度。本文中以目标为中心,其四周为目标融合的背景,从而对目标与背景进行特征提取。为了保证所选背景的全面性,在图 2背景区域中选取右上部分、右下部分、左上部分、左下部分四部分(分别记作背景1、背景2、背景3和背景4)分别进行处理,获取特征的平均值,相应地作为颜色特征向量的分量。区域划分具体情况如图 3所示。
划分的单个背景与目标加以对比,目标与各个背景之间的显著性差异不尽相同,采用背景区域平均值处理作为背景的特征向量,与目标的特征向量进行比较。
-
利用MATLAB软件对各区域像素进行提取和处理。在获取颜色直方图之前,先对图像进行灰度化处理,将RGB图像类型转换为灰度图像类型,所得结果如图 4所示。
颜色直方图是以图像中某一颜色出现的频数为指标做出的颜色频数分布图,反映了图像的基本色调,能从整体上展现出图像颜色的分布,对于图像整体上的匹配具有显著的指导意义[18]。通过直方图,可以很明显地看出图像中所包含的主色调和次主色调等信息,能够辅助对两张图片对比分析。但缺点在于颜色直方图只是图像整体颜色的频率分布[19],对于颜色的空间分布难以描述。利用相关软件对所得图像进行颜色直方图的提取,所得结果如图 5所示。横坐标为无量纲灰度级,纵坐标为对应灰度级像素个数。
图中,目标主色调分布在0~50灰度值之间,次主色调分布在100~150灰度值之间,背景主色调分布有两类,分别为100~150之间和150~200之间。在图 5a和图 5c中,目标与背景在0~150之间颜色分布差异较大,在150~255之间颜色分布差异较小,尤其是5c中,这一点表现得尤为突出;在图 5b和图 5d中,颜色分布差异较大。结合图 3a、图 3c和图 3e,目标和背景的颜色整体上呈现暗绿色,目标与背景的相似性较高,融合性较好,图 3c和图 3e的融合性更为突出;结合图 3b、图 3d和图 3e,目标整体呈现暗绿色,而背景整体上呈现出浅绿色和浅黄色,视觉直观上可以发现目标和背景的融合度不高。通过以上分析可知,由直方图所得结论和视觉观察所得结论相一致。
-
通过绘图软件将图像像素和像素对应的HSV空间中v分量对应存储,以空间位置为坐标变量作出图像的亮度分布,所得结果如图 6所示。其中x,y表示图像像素空间位置,色柱表示像素点亮度v大小,单位为cd/m2。
综合图 6a、图 6b、图 6d,目标与背景的亮度分布总体上较为均匀,目标图像中亮度分布均匀,图 6b中高亮度分布密度和目标中的高亮度分布密度较为接近,图 6d中低亮度分布密度与目标中的分布密度较为接近,这两者背景与目标整体上亮度接近程度较高,融合效果较好。从图 6a、图 6c、图 6e分析可知,图 6c、图 6e中亮度分布不均匀,高亮度分布密度大,低亮度的分布密度较小,且其均与目标的亮度密度分布存在差异,尤其是图 6c、图 6e中低亮度在像素点(100, 250)附近分布缺失,取而代之的是高亮度的集中分布,这与目标低亮度的分布不相符,也即目标与此二者背景之间的融合程度较低。由亮度分布所得结论与前面的视觉直观分析的结果相一致。
-
以图像的各个特征作为分量,将其按照一定的顺序排列,构成所需要的特征向量[20]。该向量在形式上为一个有序数组,其可以是图像的特征所组成的有序数组,也可以是某一像素特征所组成的有序数组; 其可以表示图像整体的信息,也可以表示单个像素的信息。
本文中所用图像特征向量为RGB颜色空间中r通道、g通道和b通道以及HSV颜色空间中h分量、s分量和v分量所组成的有序数组,分别表征图像的基础色(r, g, b)的含量以及图像色调h、饱和度s和亮度v。各背景图像中所有像素的特征量值的平均值为该图像的特征的综合体现。将4个背景图像的平均值进行平均处理,即得到背景的综合特征量值。利用相关工具得到目标与背景图像的特征向量的分量如表 1和表 2所示。
Table 1. RGB components of target and background features
target background 1 background 2 background 3 background 4 mean
valuer 104.4 136.2 156.6 113.6 145.8 138.05 g 101.67 133.0 149.2 119.9 142.8 136.23 b 59.77 64.8 89.2 60.9 87.3 75.55 Table 2. HSV components of target and background features
target background
1background
2background
3background
4mean
valueh/(°) 0.177 0.161 0.148 0.188 0.165 0.166 s 0.500 0.585 0.474 0.543 0.474 0.519 v/
(cd·m-2)0.421 0.547 0.623 0.475 0.590 0.559 -
经过对目标与背景图像中每一像素数据的采集与提取,得到:
$ \left\{ {\begin{array}{*{20}{c}} {{\mathit{\boldsymbol{f}}_{{\rm{RGB, 1}}}} = \left( {104.4, 101.67, 59.77} \right)}\\ {{\mathit{\boldsymbol{f}}_{{\rm{HSV, 1}}}} = \left( {0.177, 0.500, 0.421} \right)} \end{array}} \right. $
(6) $ \left\{ {\begin{array}{*{20}{c}} {{\mathit{\boldsymbol{f}}_{{\rm{RGB, 2}}}} = \left( {138.05, 136.23, 75.55} \right)}\\ {{\mathit{\boldsymbol{f}}_{{\rm{HSV, 2}}}} = \left( {0.166, 0.519, 0.559} \right){\rm{ }}} \end{array}} \right. $
(7) 利用(5)式,计算得到目标与背景之间余弦相似度为:cosθ1=0.9998,cosθ2=0.9917。由于HSV颜色空间所包含信息要优于RGB颜色空间,则对这二者余弦相似度进行加权平均值处理,所得结果cosθ=0.4cosθ1+0.6cosθ2,经计算,结果为0.9982。专家评判法得到结果为0.98,本文中提出方法得到的判别效果与之相近,说明了该方法在光学伪装效能评估领域能够得到应用。
为了进一步说明该方法的可行性,另取样本对象(见图 7a和图 7b)分别进行相同操作, 结果如表 3和表 4所示。其中表 3为正反验证对象的r, g, b值,表 4为正反验证对象的h, s, v值。
Table 3. RGB component of validation object
target background 1 background 2 background 3 background 4 mean vuale r 120.4 162.2 158.4 156.4 145.3 155.6 a (Fig. 7a) g 113.1 157.4 146.2 154.6 140.3 149.6 b 94.0 124.2 117.4 125.3 111.0 119.5 r 95.3 186.3 175.3 171.9 189.0 180.6 b (Fig. 7b) g 82.3 186.3 176.2 173.9 188.8 181.3 b 70.0 190.5 182.9 180.3 192.3 186.5 Table 4. HSV component of validation object
target background 1 background 2 background 3 background 4 mean vuale h/(°) 0.1407 0.1434 0.1192 0.1485 0.1494 0.1401 a (Fig. 7a) s 0.2877 0.2710 0.3091 0.2418 0.3048 0.2817 v/(cd·m-2) 0.4753 0.6411 0.6244 0.6234 0.5762 0.6163 h/(°) 0.0818 0.6427 0.6589 0.6283 0.6423 0.6432 b (Fig. 7b) s 0.2861 0.0247 0.0445 0.0479 0.0195 0.0342 v/(cd·m-2) 0.3739 0.7470 0.7171 0.7071 0.7543 0.7314 将表中结果代入(5)式,得到验证对象a(对应图 7a)和b(对应图 7b)的目标与背景之间的余弦相似度为:0.9821和0.7324。经过专家评判法判得对象a中伪装效果较好,利用本文中提出的方法得到余弦相似度为较高,与专家评判法的到结论一致;对于验证对象b,图背景与目标明显差距太大,伪装效果不理想,本文中的方法所得到的余弦相似度值也较小。验证对象a与b对比分析表明, 本文中提出的方法对伪装效果的判定具有明显的作用。
将实例分析和验证分析相结合可以发现,专家评判法能够给出伪装效果的整体感知,但不能定量地说明伪装程度;余弦相似度法可以定量地给出伪装效果的优劣,对专家评判法形成良好的补充。
基于余弦相似度的光学伪装效能评估分析[
Evaluation and analysis of optical camouflage efficiency based on cosine similarity
-
摘要: 为了解决伪装效能评估手段单一、量化分析手段不足的问题,引入了余弦相似度原理开展模拟评估,对可见光伪装效能评估理论分析进行了优化。基于颜色光学数据特征,利用颜色直方图展现了目标与背景颜色频率分布,研究了样本目标与背景的颜色融合差异性;采用亮度空间分布图展现了亮度空间特征,探索了样本目标与背景的亮度差异性;并对目标和背景图像的像素数据进行采集和计算,量化研究了目标和背景的融合效果;以典型验证实例为依托,正反对比分析验证了评估方法的正确性。结果表明,用文中的评估方法对图像进行计算评估,目标与背景的图像特征向量之间的夹角余弦值达到了0.9982;正反对比得到目标与背景之间的余弦相似度0.9821和0.7324的融合效果。定性分析与定量计算表明余弦相似度理论能为伪装效能判定提供相关的算法支撑,具有一定的实用价值和使用价值。Abstract: In order to solve the problems of single camouflage effectiveness evaluation method and insufficient quantitative analysis method, the cosine similarity principle was introduced to carry out simulation evaluation, and the theoretical analysis of visible light camouflage effectiveness evaluation was optimized. Based on the characteristics of color optical data, color histogram was used to show the color frequency distribution of target and background, and the difference of color fusion between sample target and background was studied. The luminance spatial characteristics were shown by luminance spatial distribution map, the luminance difference between the sample target and the background was explored. By collecting and calculating the pixel data of the target and the background image, the fusion effect of the target and the background was quantified. Based on the typical verification example, the correctness of the evaluation method was verified through the positive and negative comparative analysis. The results show that the cosine of the included angle between the image feature vector of the target and the background is 0.9982, and the fusion effect of the cosine similarity between the target and the background is respectively 0.9821 and 0.7324 by positive and negative comparison. Qualitative analysis and quantitative calculation show that cosine similarity theory can provide relevant algorithm support for camouflage effectiveness judgment and has certain practical value and application value.
-
Key words:
- image processing /
- camouflage effectiveness /
- cosine similarity /
- color histogram /
- image brightness
-
Table 1. RGB components of target and background features
target background 1 background 2 background 3 background 4 mean
valuer 104.4 136.2 156.6 113.6 145.8 138.05 g 101.67 133.0 149.2 119.9 142.8 136.23 b 59.77 64.8 89.2 60.9 87.3 75.55 Table 2. HSV components of target and background features
target background
1background
2background
3background
4mean
valueh/(°) 0.177 0.161 0.148 0.188 0.165 0.166 s 0.500 0.585 0.474 0.543 0.474 0.519 v/
(cd·m-2)0.421 0.547 0.623 0.475 0.590 0.559 Table 3. RGB component of validation object
target background 1 background 2 background 3 background 4 mean vuale r 120.4 162.2 158.4 156.4 145.3 155.6 a (Fig. 7a) g 113.1 157.4 146.2 154.6 140.3 149.6 b 94.0 124.2 117.4 125.3 111.0 119.5 r 95.3 186.3 175.3 171.9 189.0 180.6 b (Fig. 7b) g 82.3 186.3 176.2 173.9 188.8 181.3 b 70.0 190.5 182.9 180.3 192.3 186.5 Table 4. HSV component of validation object
target background 1 background 2 background 3 background 4 mean vuale h/(°) 0.1407 0.1434 0.1192 0.1485 0.1494 0.1401 a (Fig. 7a) s 0.2877 0.2710 0.3091 0.2418 0.3048 0.2817 v/(cd·m-2) 0.4753 0.6411 0.6244 0.6234 0.5762 0.6163 h/(°) 0.0818 0.6427 0.6589 0.6283 0.6423 0.6432 b (Fig. 7b) s 0.2861 0.0247 0.0445 0.0479 0.0195 0.0342 v/(cd·m-2) 0.3739 0.7470 0.7171 0.7071 0.7543 0.7314 -