-
实验中所用样品为贡梨,购买于南昌某水果市场,购买果径大小分别为70 mm~80 mm、80 mm~90 mm和90 mm~100 mm的样品各160个,购买的样品表面均光滑且没有污渍;实验前把样品编号并放在室温为25 ℃的室内储存24 h。定义果径大小为70 mm~80 mm的贡梨为小果、80 mm~90 mm的贡梨为中果、90 mm~100 mm的贡梨为大果。
将小果的160个样本用Kennard-Stone(K-S)算法分为两部分,其中第一部分含120个样本用于开发贡梨SSC预测模型,第二部分含40个样本用于验证模型的预测性能。中果和大果的样本同理分配。
通过挤压样品获取贡梨的汁液,并将其滴到日本东京ATAGO有限公司生产的数字折光仪PAL-1上,以测量SSC值,绕赤道部位相隔90°,为每个样品收集4个SSC值,将4个值的平均值作为参考值。
-
样品的近红外漫反射光谱由自主搭建的漫反射光学装置测得,采用漫反射方式并在每个样品的赤道部位采集光谱。图 1为环型光源漫反射检测系统和实验效果图。水果托盘下面标有精度为0.1 mm的刻度,其中使用的检测光纤为集合光纤,能够同时传递光源和接收反射信息,光源光纤与检测光纤环状分布,光谱仪为Ocean Optics公司的QE65PRO光谱仪,光源为12 V、100 W的单个卤钨灯,采用稳压电源供电。
图 1 a—环型光源漫反射检测系统 b—实验效果图
Figure 1. a—diffuse reflection detection system for ring light source b—experimental renderings
漫反射光谱信息采集水果表层信息,ZHANG等人[9]的研究表明, 漫反射光射入梨的果肉中从而获取样品的果肉近红外光谱信息。漫反射采集到的贡梨光谱信息包含了果皮与果肉的信息,反映出整个贡梨的SSC信息。小果、中果和大果中的最大果的半径分别为40 mm、45 mm和50 mm,为了在实验过程中防止果实表面触碰到光纤探头,分别根据小果、中果和大果3个等级中的最大果的果径设定5个光源位置,即光源与各个等级最大果的表面距离分别为0 mm、2.5 mm、5 mm、7.5 mm和10 mm。小果光谱数据采集:分别采集光源距离水果托盘中心为40 mm、42.5 mm、45 mm、47.5 mm和50 mm(定义为A1、A2、A3、A4和A5)的漫反射光谱;中果光谱数据采集:分别采集光源距离水果托盘中心为45 mm、47.5 mm、50 mm、52.5 mm和55 mm(定义为B1、B2、B3、B4和B5)的漫反射光谱;大果光谱数据采集:分别采集光源距离水果托盘中心为50 mm、52.5 mm、55 mm、57.5 mm和60 mm(定义为C1、C2、C3、C4、C5)的漫反射光谱。
-
偏最小二乘回归(partial least squares regression,PLSR)是一种无监督的多变量统计分析方法[10],具有较强的抗干扰性。图 2为实验验证方案,校正集用正方形表示,预测集用椭圆形表示;分别找出小果、中果和大果中预测效果最好的模型并定义其位置为A、B和C,而A、B和C所对应的光源位置分别为测量小果、中果和大果的5个位置中的最优光源位置;基于A、B、C的校正集数据建立贡梨可溶性固形物尺寸通用模型;分别使用小果、中果和大果的预测集对各模型进行验证。
-
根据校准和预测的相关系数rc和rp、校准的均方根误差(calibration of root mean square error, RMSEC)Rc、预测的均方根误差(root mean square error of prediction, RMSEP)Rp来评估校准模型的性能[11]。rc、rp、Rc和Rp的计算定义如下:
$ r_{\mathrm{c}}=\sqrt{\sum\limits_{i=1}^{n_{\mathrm{c}}}\left(y_{\mathrm{p}, i}-y_{\mathrm{m}, i}\right)^2} / \sqrt{\sum\limits_{i=1}^{n_{\mathrm{c}}}\left(y_{\mathrm{p}, i}-y_{\text {mean }}\right)^2} $
(1) $ r_{\mathrm{p}}=\sqrt{\sum\limits_{i=1}^{n_{\mathrm{p}}}\left(y_{\mathrm{p}, i}-y_{\mathrm{m}, i}\right)^2} / \sqrt{\sum\limits_{i=1}^{n_{\mathrm{p}}}\left(y_{\mathrm{p}, i}-y_{\text {mean }}\right)^2} $
(2) $ R_{\mathrm{c}}=\sqrt{\frac{1}{n_{\mathrm{c}}} \sum\limits_{i=1}^{n_{\mathrm{c}}}\left(y_{\mathrm{p}, i}-y_{\mathrm{m}, i}\right)^2} $
(3) $ R_{\mathrm{p}}=\sqrt{\frac{1}{n_{\mathrm{p}}} \sum\limits_{i=1}^{n_{\mathrm{p}}}\left(y_{\mathrm{p}, i}-y_{\mathrm{m}, i}\right)^2} $
(4) 式中,yp, i为水果个数i中SSC的预测值,ym, i为水果个数i中SSC的实测值,ymean为校准集或预测集中SSC的平均值,nc和np分别为校准集和预测集中水果个数。
-
如图 3所示, 分别从小果、中果和大果中随机选一个果,在5个位置获得了近红外漫反射原始光谱。不管是小果、中果还是大果,位置2均为光谱能量最强的位置,这个现象可能是光源与样品表面的距离大小所导致,但位置1的光谱能量比位置2小,其原因可能是位置1的距离太近且样品的表面不够均匀而导致漫反射光不能被完全吸收;所采集的光谱形状相同,但是光强的大小有差异,它们在750 nm附近存在波谷,在710 nm与800 nm附近各有一个波峰。贡梨的主要成分为水分、果糖、蔗糖和葡萄糖等,其在710 nm处的波峰主要与C—H和O—H键的倍频伸缩振动有关[12],在800 nm处的波峰主要与C—H键及N—H键的二倍频吸收有关[13],750 nm附近的波谷可能由O—H三倍频伸缩振动导致[14]。
-
以小果为例,分别用位置A1、A2、A3、A4和A5的120个校正集光谱建立PLSR模型,再分别通过自身40个预测集对模型进行验证,其中预测效果最好的模型所对应的位置即为小果的最优光源位置;中果和大果同理找出相应的最优光源位置。
使用光谱预处理方法是为了让原始数据变得更容易观察分析[15]。表 1、表 2和表 3中分别记录小果、中果和大果使用标准正态变量变换(standard normal variable, SNV)[16]和高斯滤波平滑(Gaussian filtering smoothing, GFS)[17]预处理后结合PLSR算法建立的模型以及预测结果。从表中可以发现,使用SNV预处理后建立的SSC模型效果不稳定,甚至导致有些原本拟合性较好的模型出现过拟合现象,如B2使用SNV预处理后建立的SSC模型的rc < rp,而B2通过原始光谱建立的贡梨SSC模型rc与rp比较接近, 且rc>rp;使用GFS预处理后建立的PLSR模型,没有出现让原本拟合性能较好的模型出现过拟合现象,并且经过GFS预处理后建立的PLSR模型,其rc和rp大都更为接近,拟合性能变得更好,GFS的效果更稳定,因此选用GFS预处理方法。
表 1 小果在5个位置处建立的模型
Table 1. Model of small fruit at five positions
position pretreatment calibration prediction rc Rc rp Rp A1 raw 0.988 0.168 0.874 0.607 SNV 0.931 0.390 0.860 0.602 GFS 0.983 0.195 0.888 0.573 A2 raw 0.963 0.290 0.905 0.466 SNV 0.976 0.233 0.827 0.413 GFS 0.954 0.322 0.914 0.447 A3 raw 0.909 0.448 0.931 0.418 SNV 0.936 0.380 0.944 0.378 GFS 0.904 0.461 0.930 0.422 A4 raw 0.977 0.230 0.835 0.405 SNV 0.933 0.387 0.825 0.434 GFS 0.994 0.118 0.850 0.365 A5 raw 0.930 0.395 0.947 0.344 SNV 0.950 0.336 0.951 0.359 GFS 0.924 0.412 0.956 0.344 表 2 中果在5个位置处建立的模型
Table 2. Model of medium fruit at five positions
position pretreatment calibration prediction rc Rc rp Rp B1 raw 0.928 0.381 0.893 0.547 SNV 0.914 0.415 0.895 0.533 GFS 0.961 0.283 0.897 0.497 B2 raw 0.947 0.328 0.929 0.436 SNV 0.892 0.463 0.901 0.522 GFS 0.940 0.351 0.930 0.434 B3 raw 0.918 0.405 0.842 0.651 SNV 0.953 0.311 0.856 0.628 GFS 0.988 0.156 0.871 0.586 B4 raw 0.964 0.271 0.832 0.427 SNV 0.962 0.278 0.816 0.473 GFS 0.956 0.299 0.836 0.415 B5 raw 0.927 0.356 0.933 0.426 SNV 0.945 0.269 0.960 0.425 GFS 0.931 0.371 0.934 0.424 表 3 大果在5个位置处建立的模型
Table 3. Model of big fruit at five positions
position pretreatment calibration prediction rc Rc rp Rp C1 raw 0.898 0.455 0.611 0.949 SNV 0.734 0.702 0.576 0.996 GFS 0.866 0.517 0.602 0.576 C2 raw 0.961 0.287 0.906 0.508 SNV 0.991 0.259 0.813 0.786 GFS 0.968 0.135 0.917 0.487 C3 raw 0.937 0.362 0.805 0.707 SNV 0.961 0.286 0.849 0.645 GFS 0.975 0.229 0.827 0.679 C4 raw 0.982 0.196 0.880 0.565 SNV 0.988 0.160 0.755 1.009 GFS 0.975 0.228 0.860 0.544 C5 raw 0.991 0.137 0.801 0.531 SNV 0.981 0.200 0.894 0.545 GFS 0.986 0.172 0.807 0.511 对GFS预处理后建立的PLSR模型分析比较。对于小果,A3和A5的rc均小于rp,出现过拟合现象;A1和A4的rc分别为0.983和0.994,但是它们的rp分别为0.888和0.850,拟合性较差;A2的rc和rp分别为0.954和0.914,A2的rc相对于A3和A5略小,但拟合性更好,因此确定A2为小果的最优光源位置,定义为A。对中果和大果同理分析确定了B2和C2分别为它们各自的最优光源位置,定义为B和C。小果、中果和大果的最优光源位置均在位置2。在A、B和C处建立的模型为各自的局部尺寸模型,图 4为局部尺寸模型的SSC预测散点图。
-
使用A、B和C的360个校正集数据建立贡梨SSC尺寸通用模型,依次对A、B和C的预测集数据进行预测。如表 4所示,使用预处理方法后建立的SSC尺寸通用模型的rc和Rc分别为0.964和0.431,A、B和C的预测集rp和Rp分别为0.892、0.937、0.889和0.524、0.417和0.551,可以看出, 通用模型对小果、中果和大果均有较好的预测效果。
表 4 贡梨SSC预测尺寸通用模型及预测结果
Table 4. General model and prediction results of gorgpear SSC size prediction
model pretreatment calibration prediction A B C rc Rc rp Rp rp Rp rp Rp A+B+C raw 0.966 0.419 0.891 0.497 0.936 0.419 0.887 0.557 GFS 0.964 0.431 0.892 0.446 0.937 0.417 0.889 0.551 -
将A、B和C的预测集数据分别对小果、中果和大果的局部尺寸模型和通用模型进行预测,根据模型预测效果评估模型的准确性。如表 5所示,小果、中果和大果的局部尺寸模型预测自身等级的SSC效果好,但预测另外两个尺寸等级的SSC效果差,例如小果的局部尺寸模型预测中果、大果的rp和Rp分别为0.644、0.828和4.351、1.003,Rp均超过1°糖度,预测精度低,且rp与rc相差较大,拟合性能差;中果和大果的局部尺寸模型均存在类似情况;而通用模型预测小果、中果和大果的rp分别为0.892、0.937、0.889,Rp分别为0.524、0.417、0.551,Rp均在0.5左右,精度高,且rp与rc相差不大,拟合性能较好;因此可以说明通用模型适用于预测小果、中果和大果的SSC。图 5为通用模型的SSC预测散点图。
表 5 局部尺寸模型和通用模型对小果、中果和大果的预测结果
Table 5. Prediction results of small, medium and large fruit by local size models and general model
model calibration prediction A B C rc Rc rp Rp rp Rp rp Rp A+B+C 0.964 0.431 0.892 0.524 0.937 0.417 0.889 0.551 A 0.954 0.322 0.914 0.447 0.644 4.351 0.828 1.003 B 0.940 0.351 0.250 1.233 0.930 0.434 0.628 4.433 C 0.968 0.259 0.715 1.595 0.499 0.084 0.917 0.487
贡梨尺寸差异对可溶性固形物模型的适用性研究
Study on the applicability of gongpear size difference to soluble solid model
-
摘要: 为了降低贡梨自身尺寸差异造成其可溶性固形物含量预测模型的精度不高问题, 采用近红外漫反射光谱技术和偏最小二乘回归算法, 建立近红外光谱模型和尺寸通用模型, 进行了理论分析和实验验证, 取得了小果、中果、大果3个尺寸等级的局部尺寸模型和尺寸通用模型, 预测了不同尺寸等级贡梨可溶性固形物含量的数据。结果表明, 局部尺寸模型预测自身等级的贡梨可溶性固形物含量的效果好, 预测其它等级的效果差; 通用模型预测小果、中果、大果的预测相关系数分别为0.892、0.937、0.889, 预测均方根误差分别为0.524、0.417、0.551, 通用模型无论预测哪一个尺寸等级的贡梨都有较好的结果。尺寸通用模型能够减小尺寸差异带来的不良影响, 适用于检测不同尺寸等级的贡梨可溶性固形物含量。Abstract: In order to reduce the low accuracy of the prediction model of soluble solid content caused by the size difference of gongpear, a general size model was proposed. Near-infrared diffuse reflection spectroscopy and partial least squares regression algorithm modeling method of the near-infrared spectrum were adopted, and the theoretical analysis and experimental verification were respectively carried out. Gongpear soluble solids content of data were obtained by a local size prediction model of the small fruit, middle fruit and big fruit size grades and a universal size model with different size grade. The results show that, the local size model is good at predicting the soluble solid content of gongpears with its own grade, but poor at predicting other grades. The correlation coefficient were 0.892, 0.937, 0.889 and root mean square error of small fruit, medium fruit and large fruit predicted by the general model were 0.524, 0.417, 0.551. The general size model could reduce the adverse effects of size difference and was suitable for the determination of soluble solid content of gongpear with different size grades.
-
表 1 小果在5个位置处建立的模型
Table 1. Model of small fruit at five positions
position pretreatment calibration prediction rc Rc rp Rp A1 raw 0.988 0.168 0.874 0.607 SNV 0.931 0.390 0.860 0.602 GFS 0.983 0.195 0.888 0.573 A2 raw 0.963 0.290 0.905 0.466 SNV 0.976 0.233 0.827 0.413 GFS 0.954 0.322 0.914 0.447 A3 raw 0.909 0.448 0.931 0.418 SNV 0.936 0.380 0.944 0.378 GFS 0.904 0.461 0.930 0.422 A4 raw 0.977 0.230 0.835 0.405 SNV 0.933 0.387 0.825 0.434 GFS 0.994 0.118 0.850 0.365 A5 raw 0.930 0.395 0.947 0.344 SNV 0.950 0.336 0.951 0.359 GFS 0.924 0.412 0.956 0.344 表 2 中果在5个位置处建立的模型
Table 2. Model of medium fruit at five positions
position pretreatment calibration prediction rc Rc rp Rp B1 raw 0.928 0.381 0.893 0.547 SNV 0.914 0.415 0.895 0.533 GFS 0.961 0.283 0.897 0.497 B2 raw 0.947 0.328 0.929 0.436 SNV 0.892 0.463 0.901 0.522 GFS 0.940 0.351 0.930 0.434 B3 raw 0.918 0.405 0.842 0.651 SNV 0.953 0.311 0.856 0.628 GFS 0.988 0.156 0.871 0.586 B4 raw 0.964 0.271 0.832 0.427 SNV 0.962 0.278 0.816 0.473 GFS 0.956 0.299 0.836 0.415 B5 raw 0.927 0.356 0.933 0.426 SNV 0.945 0.269 0.960 0.425 GFS 0.931 0.371 0.934 0.424 表 3 大果在5个位置处建立的模型
Table 3. Model of big fruit at five positions
position pretreatment calibration prediction rc Rc rp Rp C1 raw 0.898 0.455 0.611 0.949 SNV 0.734 0.702 0.576 0.996 GFS 0.866 0.517 0.602 0.576 C2 raw 0.961 0.287 0.906 0.508 SNV 0.991 0.259 0.813 0.786 GFS 0.968 0.135 0.917 0.487 C3 raw 0.937 0.362 0.805 0.707 SNV 0.961 0.286 0.849 0.645 GFS 0.975 0.229 0.827 0.679 C4 raw 0.982 0.196 0.880 0.565 SNV 0.988 0.160 0.755 1.009 GFS 0.975 0.228 0.860 0.544 C5 raw 0.991 0.137 0.801 0.531 SNV 0.981 0.200 0.894 0.545 GFS 0.986 0.172 0.807 0.511 表 4 贡梨SSC预测尺寸通用模型及预测结果
Table 4. General model and prediction results of gorgpear SSC size prediction
model pretreatment calibration prediction A B C rc Rc rp Rp rp Rp rp Rp A+B+C raw 0.966 0.419 0.891 0.497 0.936 0.419 0.887 0.557 GFS 0.964 0.431 0.892 0.446 0.937 0.417 0.889 0.551 表 5 局部尺寸模型和通用模型对小果、中果和大果的预测结果
Table 5. Prediction results of small, medium and large fruit by local size models and general model
model calibration prediction A B C rc Rc rp Rp rp Rp rp Rp A+B+C 0.964 0.431 0.892 0.524 0.937 0.417 0.889 0.551 A 0.954 0.322 0.914 0.447 0.644 4.351 0.828 1.003 B 0.940 0.351 0.250 1.233 0.930 0.434 0.628 4.433 C 0.968 0.259 0.715 1.595 0.499 0.084 0.917 0.487 -
[1] 黄玉萍, 刘英, 杨雨图, 等. 空间分辨光谱和可见/近红外光谱的番茄颜色等级判别[J]. 光谱学与光谱分析, 2019, 39(11): 3585-3591. HUANG Y P, LIU Y, YANG Y T, et al. Discrimination of tomato color grade by spatial resolution spectroscopy and visible/near infrared spectroscopy[J]. Spectroscopy and Spectral Analysis, 2019, 39(11): 3585-3591(in Chinese). [2] SUN X, SUBEDI P, WALSH K B. Achieving robustness to temperature change of a NIRS-PLSR model for intact mango fruit dry matter content[J]. Postharvest Biology and Technology, 2020, 162: 111117. doi: 10.1016/j.postharvbio.2019.111117 [3] XIA Y, HUANG W, FAN S, et al. Effect of spectral measurement orientation on online prediction of soluble solids content of apple using Vis/NIR diffuse reflectance[J]. Infrared Physics & Technology, 2019, 97: 467-477. [4] GUO Z, HUANG W, PENG Y, et al. Color compensation and comparison of shortwave near infrared and long wave near infrared spectroscopy for determination of soluble solids content of 'Fuji'apple[J]. Postharvest Biology and Technology, 2016, 115: 81-90. doi: 10.1016/j.postharvbio.2015.12.027 [5] YAO Y, CHEN H, XIE L, et al. Assessing the temperature influence on the soluble solids content of watermelon juice as measured by visible and near-infrared spectroscopy andchemometrics[J]. Journal of Food Engineering, 2013, 119(1): 22-27. doi: 10.1016/j.jfoodeng.2013.04.033 [6] XIA Y, FAN S, LI J, et al. Optimization and comparison of models for prediction of soluble solids content in apple by online Vis/NIR transmission coupled with diameter correction method[J]. Chemometrics and Intelligent Laboratory Systems, 2020, 201: 104017. doi: 10.1016/j.chemolab.2020.104017 [7] CEN H, LU R, MENDOZA F, et al. Relationship of the optical absorption and scattering properties with mechanical and structural properties of apple tissue[J]. Postharvest Biology and Technology, 2013, 85: 30-38. doi: 10.1016/j.postharvbio.2013.04.014 [8] van BEERS R, AERNOUTS B, WATTÉ R, et al. Effect of maturation on the bulk optical properties of apple skin and cortex in the 500-1850 nm wavelength range[J]. Journal of Food Engineering, 2017, 214: 79-89. doi: 10.1016/j.jfoodeng.2017.06.013 [9] 张欣欣, 李尚科, 李跑, 等. 近红外漫反射光对水果的穿透能力研究[J]. 中国食品学报, 2022, 22(1): 298-305. ZHANG X X, LI Sh K, LI P, et al. Effects of near-infrared diffuse light on fruit penetration[J]. Chinese Journal of Food Science, 2022, 22(1): 298-305(in Chinese). [10] 黄建军, 李雪梅, 滕宏泉. 基于偏最小二乘法的黄土湿陷性评价模型[J]. 灾害学, 2021, 36(2): 60-64. HUANG J J, LI X M, TENG H Q. Evaluation model of loess collapsibility based on partial least square method[J]. Journal of Disaster Science, 2021, 36(2): 60-64(in Chinese). [11] 刘燕德, 王军政, 姜小刚, 等. 多模式可调节光学机构的苹果可溶性固形物近红外光谱检测[J]. 光谱学与光谱分析, 2021, 41(7): 2064-2070. LIU Y D, WANG J Zh, JIANG X G, et al. Detection of soluble solids in apple by near infrared spectroscopy with multi-mode adjustable optical mechanism[J]. Spectroscopy and Spectral Analysis, 2021, 41(7): 2064-2070(in Chinese). [12] MCDEVITT R M, GAVIN A J, ANDRÉS S, et al. The ability of visible and near infrared reflectance spectroscopy to predict the chemical composition of ground chicken carcasses and to discriminate between carcasses from different genotypes[J]. Hispania, 2005, 13(3): 109-117. [13] ZHOU L J, WU H, LI J T, et al. Determination of fatty acids in broiler breast meat by near-infrared reflectance spectroscopy[J]. Meat Science, 2012, 90(3): 658-664. doi: 10.1016/j.meatsci.2011.10.010 [14] 刘燕德, 朱丹宁, 吴明明, 等. 玉露香梨可溶性固形物近红外漫透射光谱在线检测[J]. 食品与机械, 2016, 32(10): 115-119. LIU Y D, ZHU D N, WU M M, et al. Online detection of soluble solids in yulu pear by near-infrared diffuse transmission spectroscopy[J]. Food and Machinery, 2016, 32(10): 115-119(in Chinese). [15] 黎丽莎, 刘燕德, 胡军, 等. 近红外无损检测技术在水果成熟度判别中的应用研究[J]. 华东交通大学学报, 2021, 38(6): 95-105. LI L Sh, LIU Y D, HU J, et al. Application of near infrared nondestructive testing technology in fruit maturity discrimination[J]. Journal of East China Jiaotong University, 2021, 38(6): 95-105(in Chinese). [16] 肖仕杰, 王巧华, 李春芳, 等. 傅里叶变换中红外光谱的牛奶品质无损检测分级[J]. 光谱学与光谱分析, 2022, 42(4): 1243-1249. XIAO Sh J, WANG Q H, LI Ch F, et al. Nondestructive testing classification of milk quality by Fourier transform infrared spectroscopy[J]. Spectroscopy and Spectral Analysis, 2022, 42(4): 1243-1249(in Chinese). [17] 曹鹏涛, 张敏, 李振春. 基于广义S变换及高斯平滑的自适应滤波去噪方法[J]. 石油地球物理勘探, 2018, 53(6): 1128-1136. CAO P T, ZHANG M, LI Zh Ch. Adaptive filtering denoising method based on generalized S-transform and Gaussian smoothing[J]. Oil Geophysical Prospecting, 2018, 53(6): 1128-1136(in Chinese). [18] 张锦龙, 辛明, 樊琳琳, 等. 基于近红外光谱在皮瓣移植术后的监测系统[J]. 激光技术, 2020, 44(1): 91-95. ZHANG J L, XIN M, FAN L L, et al. Monitoring system based on near infrared spectroscopy after skin flap transplantation[J]. Laser Technology, 2020, 44(1): 91-95(in Chinese).