HTML
-
水果的颜色是由果实发育过程中各种不同色素含量多少所决定的,并且在阳光、温度,水分等有不同的环境因素下,也造成了水果颜色的不同。而西红柿番茄红素含量的多少也在一定程度上反映了西红柿的成熟情况。本实验中采用了Lab颜色模型对西红柿进行颜色描述。Lab是一种色彩空间,也即一种颜色模型,是在1931年国际照明委员会制定的颜色度量国际标准的基础上建立的,在1976年又经修订并被命名为CIE Lab。这是一种与设备无关的颜色系统,也是一种基于生理特性的颜色系统,以数字化方式来描述人的视觉感应。它适用于一切光源色体或物体色的表示与计算。在Lab颜色空间中,一种颜色由L值、a值、b值3种参量表征,其满足公式:
式中, Δa表示红绿色相,+a表示偏红,-a表示偏绿;Δb表示黄蓝色相,+b表示偏黄,-b表示偏蓝;Δl表示明暗,+表示偏深,-表示偏浅;ΔE表示总色差。
在实验过程中,通过CR-10色差计采集了每个西红柿各个标定面的色差信息,即ΔE, L, a, b 4组色差数据,按3:1的比例将样品数据分为建模集和预测集,其统计结果如表 1所示。
parameter data set number of sample minimum maximum mean threshold 1 threshold 2 L calibration set 301 -54.1 -27.1 -42.45 -34 -42 validation set 99 -54.4 -27.9 -42.73 a calibration set 301 -9.5 33.9 13.32 -2.5 8 validation set 99 -8.7 33 13.21 b calibration set 301 8.0 34.2 19.44 29 21 validation set 99 10.1 36.9 19.44 ΔE calibration set 301 39.1 63.4 51.88 45.5 51 validation set 99 37.8 62.6 52.07 Table 1. Characteristics of calibration and prediction sets of tomato samples
由表 1可知,西红柿的亮度整体上偏暗(均为负值),Lab值数据范围都较大,可见能够较好地区分西红柿的红、绿颜色,即选用Lab颜色模型对西红柿的颜色采集是合理可行的。通过数据分析可知,阈值1为未成熟果与半成熟果的界限,而阈值2表示半成熟果和成熟果的界限。
记录样品对应的类别标签,其中未成熟果为1.0;半成熟果为2.0;成熟果为3.0,选用建模集的Lab及ΔE数据和标签建立数学模型,其结果见图 1。
图 1为a颜色指标与其对应类别标签建立的散点模型。结果表明:半成熟和成熟样品果的区分效果明显,即能很好地判别成熟果和其它两类果;而未成熟和半成熟样品果的分类效果不明显,半成熟果与未成熟果的颜色数据相互包含现象严重。结合其它3个颜色指标对应的散点模型情况,并经由计算分析,西红柿样品建模集类与类之间的误判情况如表 2所示。
parameter total number of sample number of sample number of misjudged misjudgment rate /% L immature 301 88 44 50 semi-mature 32 11 34.38 mature 181 1 0.55 a immature 301 88 2 2.27 semi-mature 32 11 34.38 mature 181 0 0 b immature 301 88 45 51.14 semi-mature 32 11 34.38 mature 181 0 0 ΔE immature 301 88 34 38.64 semi-mature 32 22 68.75 mature 181 4 2.21 Table 2. Misjudgment situation of calibration set samples
通过综合比较可知,a值对应的建模效果最好,其在识别未成熟和成熟样品果时,误判率远远低于其它指标所建立的模型。但是,由表 2也能看出,区分未成熟和半成熟果时都存在误判情况,原因可能是一些人为测量误差和样品颜色模型不明显导致的。
-
从西红柿样品中随机挑出一个成熟、一个半成熟以及一个未成熟共3个实验样品,其对应的光谱信息如图 2所示。
从图 2中可以明显看出, 成熟果光谱与未成熟、半成熟果光谱具有明显差异,而半成熟果与未成熟果的光谱之间没有太大的区别,只是在最大值上未成熟果略大。首先,成熟果的能量谱较未成熟果以及半成熟果更高,其中成熟果能量谱的最高值可以达到5500光子数,而未成熟果的光谱能量最高值仅为1700光子数,半成熟果的光谱能量最高值仅为1385光子数,产生这种差异的原因可能是成熟果内部果肉组织较未成熟果更软,使得成熟果的透光性也相对更高;而由于样本的限制,半成熟果与未成熟果差距不大。3条光谱均存在波峰,且位置基本一致,都是在700nm~800nm附近,而在750nm处存在波谷;成熟果还在600nm~700nm存在波峰,在650nm~700nm存在波谷,此波长段对应红色光。
-
偏最小二乘回归建模算法是基于全波段光谱进行主成分分析,充分利用了全波段的有效信息,其建模效果一般好于多元线性回归方法。故本实验中应用偏最小二乘回归校正算法对西红柿颜色的原始吸收光谱进行建模分析,其结果见图 3。
Figure 3. Correlation diagram of NIRS modeling of color index and true value for tomato by partial least square method
图 3是应用偏最小二乘回归方法建立的近红外光谱模型。图中的两条平行直线为上述表 1中所给出的阈值。结果表明:利用偏最小二乘回归法建立的近红外光谱模型分类效果良好,尤其是在识别成熟果上表现优异,基本不发生误判,但区分未成熟果与半成熟果实的结果和上述散点模型类似,误判情况明显,其结果见表 3。
parameter number of sample number of misjudged misjudgment rate /% L immature 88 53 60.22 semi-mature 32 13 40.62 mature 181 1 0.55 a immature 88 31 35.22 semi-mature 32 20 62.5 mature 181 0 0 b immature 88 65 73.86 semi-mature 32 9 28.12 mature 181 1 0.55 Δ E immature 88 32 36.36 semi-mature 32 20 62.5 mature 181 1 0.55 Table 3. Misjudgement of near infrared spectrum model of tomato color and lustre index
表 3结果表明,4种颜色指标建立的近红外光谱模型都存在误判情况,其结果大致和上述散点模型类似:成熟果识别准确,而识别未成熟果和半成熟果时都存在误判;但综合比较,利用a指标建立的近红外模型效果最好。
-
经过上述分析,选择a指标对应的近红外模型作为定标模型,为了检验定标模型的可靠性和准确性,用这一模型对99个未知样品的颜色进行预测分析,结果见图 4。
将结果和标准颜色模型的预测情况进行对比,结果见表 4。
model number of sample number of misjudged misjudgment rate/% standard color model immature 28 0 0 semi-mature 12 4 33.33 mature 59 0 0 NIRS model immature 28 9 32.14 semi-mature 12 6 50 mature 59 0 0 Table 4. Comparison of the prediction of near infrared spectroscopy and standard model
从结果分析来看,近红外光谱模型在识别成熟果时预测效果较理想,但和真值建立的标准颜色模型相比,在识别其它两类时都存在较高的误判率,这可能是由于颜色指标分布过于集中而导致聚类现象不明显造成的。尽管近红外光谱模型在误判率上不如颜色模型,但是它具有以下两点优势:(1)标准颜色模型是基于采集的颜色数据,即每做一次分选,数据都要重新采集,而利用近红外光谱模型对西红柿进行分选,光谱采集速度远远快于颜色数据采集速度,这将大大节约分选时间以及成本; (2)近红外光谱模型具有更加好的稳定性,数据采集更加准确,而颜色数据往往会因为实验人员的测量方式而影响数据采集的准确性。并且从实际角度考虑,分选的目的往往是需要检测出成熟的西红柿,从这点来看,近红外光谱模型能够很好地实现对西红柿成熟果的检测。