高级检索

ISSN1001-3806CN51-1125/TN 网站地图

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于SPA-PSO-BP的花生高光谱图像分类方法研究

杨洋 徐熙平 薛航 张宁 张越 索科

引用本文:
Citation:

基于SPA-PSO-BP的花生高光谱图像分类方法研究

    通讯作者: 徐熙平, xxp@cust.edu.cn
  • 中图分类号: O433;TP391.4

Research on peanut hyperspectral image classification method based on SPA-PSO-BP

    Corresponding author: XU Xiping, xxp@cust.edu.cn ;
  • CLC number: O433;TP391.4

  • 摘要: 为了提高可见-近红外(VNIR)高光谱花生图像分类的准确率和减少分类检测的运算时间,提出了基于连续投影算法(SPA)融合粒子群算法优化后向传播神经网络(PSO-BP)的分类检测模型。利用高光谱成像系统采集了7个花生品种样本的VNIR光谱数据,并进行了背景分割和光谱信息的提取,去除受噪声和杂散光影响大的波段后,运用Savitzky-Golay卷积平滑对400 nm~900 nm范围的波长进行预处理;采用SPA降维及均方根误差值选择了25个特征波长,同时利用PSO-BP神经网络的初始权重和阈值,构建PSO-BP模型作为分类器进行了实验,取得了测试集识别准确率为98.7%、kappa系数为0.98及遗漏误差为3的数据。结果表明,相较4个对比方法构建的分类模型,该模型的准确率分别提高了2.1%、8.6%、3.9%和4.3%。该方法在基于高光谱成像的花生品种分类技术中具有很好的应用前景,为花生品种的高精度、快速无损分类提供了新思路。
  • 图 1  BPNN结构图

    Figure 1.  BPNN structure diagram

    图 2  PSO优化BPNN步骤

    Figure 2.  Steps of BPNN optimization by PSO

    图 3  高光谱成像系统的组成

    Figure 3.  Composition of hyperspectral imaging system

    图 4  高光谱图像分割过程

    Figure 4.  Process of segmentation in hyperspectral image

    图 5  7种花生样本的光谱反射值

    Figure 5.  Spectral reflectance of seven peanut samples

    图 6  黑花生典型样本预处理前后的光谱曲线

    Figure 6.  Spectral curves of Black peanut samples before and after pretreatment

    图 7  彩衣仙子典型样本预处理前后的光谱曲线

    Figure 7.  Spectral curves of Colorful cloth peanut samples before and after pretreatment

    图 8  冀花5号典型样本预处理前后的光谱曲线

    Figure 8.  Spectral curves of Jihua No.5 peanut samples before and after pretreatment

    图 9  华一罗汉典型样本预处理前后的光谱曲线

    Figure 9.  Spectral curves of Huayiluohan peanut samples before and after pretreatment

    图 10  双冠白沙典型样本预处理前后的光谱曲线

    Figure 10.  Spectral curves of Double crown white sand peanut samples before and after pretreatment

    图 11  优品红沙典型样本预处理前后的光谱曲线

    Figure 11.  Spectral curves of Excellent red peanut samples before and after pretreatment

    图 12  鲁花1号典型样本预处理前后的光谱曲线

    Figure 12.  Spectral curves of Luhua No.1 peanut samples before and after pretreatment

    图 13  基于SPA选择的特征波长

    Figure 13.  Characteristic wavelengths selected based on SPA

    图 14  基于SPA-PSO-BP方法的判别结果

    Figure 14.  Discriminant results based on SPA-PSO-BP

    图 15  4种对比判别算法的识别结果

    Figure 15.  Results of four contrast discriminant algorithms

    表 1  4种对比判别算法的参数设置、预测结果及kappa系数

    Table 1.  Parameter settings, prediction results and kappa coefficients of four comparative discriminative algorithms

    recognition algorithm parameter omission error prediction accuracy/% kappa coefficient
    BP hidden layer: 10 8 96.6 0.96
    RF trees: 60 leaf: 3 23 90.1 0.89
    RBF spread: 100 12 94.8 0.94
    SVM c: 10 kernel function: linear 13 94.4 0.94
    下载: 导出CSV
  • [1] 张智猛, 戴良香, 李美, 等. 花生种子产业现状与发展对策[J]. 中国农业科技导报, 2013, 15(1): 30-37.

    ZHANG Zh M, DAI L X, LI M, et al. Current situation and development countermeasures of peanut seed industry[J]. China Agricultural Science and Technology Bulletin, 2013, 15(1): 30-37(in Ch-inese). 
    [2] 李万伦, 甘甫平. 矿山环境高光谱遥感监测研究进展[J]. 国土资源遥感, 2016, 28(2): 1-7.

    LI W L, GAN F P. Research progress of hyperspectral remote sensing monitoring of mine environment[J]. Remote Sensing of Land and Resources, 2016, 28(2): 1-7(in Chinese). 
    [3]

    FENG Y Z, SUN D W. Application ofhyperspectral imaging in food safety inspection and control: A review[J]. Critical Reviews in Food Science & Nutrition, 2012, 52(11): 1039-1058.
    [4]

    ZHU M, HUANG D, HU X J, et al. Application of hyperspectral technology in detection of agricultural products and food: A review[J]. Food Science & Nutrition, 2020, 8(10): 5206-5214.
    [5]

    ZHOU Q, HUANG W Q, TIAN X, et al. Identification of the variety of maize seeds based on hyperspectral images coupled with convolutional neural networks and subregional voting[J]. Journal of the Science of Food and Agriculture, 2021, 101(11): 4532-4542. doi: 10.1002/jsfa.11095
    [6]

    JIN B Ch, ZHANG Ch, JIA L Q, et al. Identification of rice seed varieties based on near-infrared hyperspectral imaging technology combined with deep learning[J]. ACS Omega, 2022, 7(6): 4735-4749. doi: 10.1021/acsomega.1c04102
    [7] 刘璐, 邵慧, 孙龙, 等. 利用高光谱激光雷达检测木材的霉变与含水量[J]. 激光技术, 2023, 47(5): 620-626. doi: 10.7510/jgjs.issn.1001-3806.2023.05.007

    LIU L, SHAO H, SUN L, et al. Detection of mildew and moisture content in timber by hyperspectral LiDAR[J]. Laser Technology, 2023, 47(5): 620-626(in Chinese). doi: 10.7510/jgjs.issn.1001-3806.2023.05.007
    [8] 邵慧, 靳培龙, 王程, 等. 基于高光谱指数分割的草莓硬度预测与研究[J]. 激光技术, 2024, 48(3): 365-372. doi: 10.7510/jgjs.issn.1001-3806.2024.03.011

    SHAO H, JIN P L, WANG Ch, et al. Prediction and study of strawberry hardness based on hyperspectral index segmentation[J]. Laser Technology, 2024, 48(3): 365-372(in Chinese). doi: 10.7510/jgjs.issn.1001-3806.2024.03.011
    [9]

    SEKI H, MA T, MURAKAMI H, et al. Visualization of sugar content distribution of white strawberry by near-infrared hyperspectral imaging[J]. Foods, 2023, 12(5): 931. doi: 10.3390/foods12050931
    [10] 梁栋, 刘娜, 张东彦, 等. 利用成像高光谱区分冬小麦白粉病与条锈病[J]. 红外与激光工程, 2017, 46(1): 50-58.

    LIANG D, LIU N, ZHANG D Y, et al. Distinguishing winter wheat powdery mildew from stripe rust using imaging hyperspectral[J]. Infrared and Laser Engineering, 2017, 46(1): 50-58(in Chinese). 
    [11]

    XUE H, YANG Y, XU X P, et al. Application of near infrared hyperspectral imaging technology in purity detection of hybrid maize[J]. Applied Sciences, 2023, 13(6): 3507. doi: 10.3390/app13063507
    [12] 朱潘雨, 黄敏, 赵鑫. 基于SMOTE-UVE-SVM的小麦种子纯度高光谱图像检测[J]. 激光技术, 2024, 48(2): 281-287. doi: 10.7510/jgjs.issn.1001-3806.2024.02.021

    ZHU P Y, HUANG M, ZHAO X. Hyperspectral image detection of wheat seed purity based on SMOTE-UVE-SVM[J]. Laser technology, 2024, 48(2): 281-287(in Chinese). doi: 10.7510/jgjs.issn.1001-3806.2024.02.021
    [13] 陈彬, 刘阁, 张贤明. 连续投影算法的润滑油中含水量的近红外光谱分析[J]. 红外与激光工程, 2013, 42(12): 3168-3174.

    CHEN B, LIU G, ZHANG X M. NIR spectral analysis of water content in lubricating oil by continuous projection algorithm[J]. Infrared and Laser Engineering, 2013, 42(12): 3168-3174(in Ch-inese). 
    [14] 白丽敏, 李粉玲, 常庆瑞, 等. 结合SPA和PLS法提高冬小麦冠层全氮高光谱估算的精确度[J]. 植物营养与肥料学报, 2018, 24(5): 1178-1184.

    BAI L M, LI F L, CHANG Q R, et al. Increasing accuracy of hyperspectral remote sensing for total nitrogen of winter wheat canopy by use of SPA and PLS methods[J]. Journal of Plant Nutrition and Fertilizers, 2018, 24(5): 1178-1184 (in Chinese). 
    [15] 葛艳, 刘杏杏, 谢俊标. 改进粒子群优化BP神经网络的轮毂分类算法[J]. 中国科技论文, 2019, 14(7): 773-777.

    GE Y, LIU X X, XIE J B. Improved particle swarm optimization BP neural network for wheel classification algorithm[J]. China Science and Technology Paper. 2019, 14(7): 773-777 (in Chinese). 
    [16] 孟庆龙, 张艳, 尚静. 高光谱成像结合BP网络无损检测李子的硬度[J]. 激光与红外, 2019, 49(8): 968-973.

    MENG Q L, ZHANG Y, SHANG J. Hyperspectral imaging combined with BP neural network for non-destructive detection of plum hardness[J]. Laser and Infrared, 2019, 49(8): 968-973(in Ch-inese). 
    [17] 许兆美, 刘永志, 杨刚, 等. 粒子群优化BP神经网络的激光铣削质量预测模型[J]. 红外与激光工程, 2013, 42(9): 2370-2374.

    XU Zh M, LIU Y Zh, YANG G, et al. Laser milling quality prediction model with particle swarm optimized BP neural network[J]. Infrared and Laser Engineering, 2013, 42(9): 2370-2374(in Chinese). 
    [18] 李东年, 周以齐. 采用改进粒子群优化粒子滤波的三维人手跟踪[J]. 光学精密工程, 2014, 22(10): 2870-2878.

    LI D N, ZHOU Y Q. 3-D manual tracking using improved particle swarm optimized particle filtering[J]. Optics and Precision Engineering, 2014, 22(10): 2870-2878(in Chinese). 
    [19] 刘青, 李阳. 基于多尺度径向基函数的时变系统辨识[J]. 北京航空航天大学学报, 2015, 41(9): 1722-1728.

    LIU Q, LI Y. Identification of time-varying systems using multi-scale radial basis function[J]. Journal of Beijing University of Aeronautics and Astronautics, 2015, 41(9): 1722-1728(in Chinese). 
    [20] 朱晓琳, 李光辉, 张萌. 基于CARS-MIV-SVR的库尔勒香梨可溶性固体含量预测方法[J]. 光谱学与光谱分析, 2019, 39(11): 3547-3552.

    ZHU X L, LI G H, ZHANG M. Prediction method of soluble solid content of Korla Pear based on CARS-MIV-SVR[J]. Spectroscopy and Spectral Analysis, 2019, 39(11): 3547-3552(in Chinese). 
  • [1] 殷贤华刘昱贺微奉慕霖石玉林 . 基于MPSO-SVM的硫化橡胶及助剂的太赫兹光谱分类识别. 激光技术, 2021, 45(1): 7-12. doi: 10.7510/jgjs.issn.1001-3806.2021.01.002
    [2] 王晓蒙王会峰姚乃夫 . 基于粒子群算法的激光位移传感器参量优化. 激光技术, 2018, 42(2): 181-186. doi: 10.7510/jgjs.issn.1001-3806.2018.02.008
    [3] 齐艺超陈伟穆春元祝宁华 . 基于粒子群自整定PID算法的激光器温度控制系统. 激光技术, 2019, 43(5): 650-654. doi: 10.7510/jgjs.issn.1001-3806.2019.05.012
    [4] 戴璨王元庆徐帆 . 基于粒子群算法的3维激光雷达回波分解. 激光技术, 2016, 40(2): 284-287. doi: 10.7510/jgjs.issn.1001-3806.2016.02.028
    [5] 陈斯祺张海洋赵长明张子龙王文鑫张明 . 基于天牛须改进粒子群算法的点云配准方法. 激光技术, 2020, 44(6): 678-683. doi: 10.7510/jgjs.issn.1001-3806.2020.06.005
    [6] 谢日华何建军胡娟王莉周鼎富陈涌周杰陈春利 . 基于修正灰色残差算法的风廓线质量控制. 激光技术, 2017, 41(4): 573-577. doi: 10.7510/jgjs.issn.1001-3806.2017.04.023
    [7] 关世豪杨桄李豪付严宇 . 3维卷积递归神经网络的高光谱图像分类方法. 激光技术, 2020, 44(4): 485-491. doi: 10.7510/jgjs.issn.1001-3806.2020.04.015
    [8] 周聪张玲陈根余邓辉蔡颂 . 激光修锐砂轮工艺参量的预测和优化算法. 激光技术, 2015, 39(3): 320-324. doi: 10.7510/jgjs.issn.1001-3806.2015.03.008
    [9] 王强辉华文深黄富瑜严阳张炎索文凯 . 基于光谱角背景纯化的高光谱异常检测算法. 激光技术, 2020, 44(5): 623-627. doi: 10.7510/jgjs.issn.1001-3806.2020.05.016
    [10] 葛一凡陆旭刘玉柱 . 基于激光诱导击穿光谱和神经网络的蛋壳研究. 激光技术, 2022, 46(4): 532-537. doi: 10.7510/jgjs.issn.1001-3806.2022.04.015
    [11] 魏柏林陈国庆徐建才闫冠峰马超群朱拓高淑梅 . 荧光光谱结合概率神经网络用于无醇啤酒的识别. 激光技术, 2010, 34(6): 794-797. doi: 10.3969/j.issn.1001-3806.2010.06.020
    [12] 刘沐涵陈国庆肖榕阳徐煜杰陈哲涵蔡纪元 . 基于3维荧光光谱技术的含乳饮料分类研究. 激光技术, 2021, 45(3): 303-306. doi: 10.7510/jgjs.issn.1001-3806.2021.03.006
    [13] 陆俊高淑梅熊婕杨幼益陈国庆 . 女性尿液荧光光谱学特性及机理分析. 激光技术, 2010, 34(1): 45-47,84. doi: 10.3969/j.issn.1001-3806.2010.01.013
    [14] 杨桄田张男李豪关世豪 . 基于线性解混的高光谱图像目标检测研究. 激光技术, 2020, 44(2): 143-147. doi: 10.7510/jgjs.issn.1001-3806.2020.02.001
    [15] 朱潘雨黄敏赵鑫 . 基于SMOTE-UVE-SVM的小麦种子纯度高光谱图像检测. 激光技术, 2024, 48(2): 281-287. doi: 10.7510/jgjs.issn.1001-3806.2024.02.021
    [16] 赵佳乐王广龙周冰应家驹王强辉李秉璇 . 基于边缘剔除的陆基高光谱图像噪声评估方法. 激光技术, 2023, 47(1): 121-126. doi: 10.7510/jgjs.issn.1001-3806.2023.01.019
    [17] 殷贤华郭超奉慕霖贺微 . 基于Tchebichef图像矩的氧化锌太赫兹光谱定量研究. 激光技术, 2019, 43(6): 747-752. doi: 10.7510/jgjs.issn.1001-3806.2019.06.003
    [18] 宗鹏飞王志斌张记龙陈媛媛 . 基于红外被动测距的基线拟合算法研究. 激光技术, 2013, 37(2): 174-177. doi: 10.7510/jgjs.issn.1001-3806.2013.02.009
    [19] 王坤屈惠明 . 基于改进最小噪声分离变换的异常检测算法. 激光技术, 2015, 39(3): 381-385. doi: 10.7510/jgjs.issn.1001-3806.2015.03.022
    [20] 李竹曼高向东张南峰 . 大功率碟片激光焊接状态多特征融合分析法. 激光技术, 2017, 41(5): 764-768. doi: 10.7510/jgjs.issn.1001-3806.2017.05.029
  • 加载中
图(15) / 表(1)
计量
  • 文章访问数:  813
  • HTML全文浏览量:  393
  • PDF下载量:  4
  • 被引次数: 0
出版历程
  • 收稿日期:  2023-07-05
  • 录用日期:  2023-10-07
  • 刊出日期:  2024-07-25

基于SPA-PSO-BP的花生高光谱图像分类方法研究

    通讯作者: 徐熙平, xxp@cust.edu.cn
  • 1. 长春理工大学 光电工程学院, 长春 130022, 中国
  • 2. 北华大学 电子与信息工程学院, 吉林 132021, 中国

摘要: 为了提高可见-近红外(VNIR)高光谱花生图像分类的准确率和减少分类检测的运算时间,提出了基于连续投影算法(SPA)融合粒子群算法优化后向传播神经网络(PSO-BP)的分类检测模型。利用高光谱成像系统采集了7个花生品种样本的VNIR光谱数据,并进行了背景分割和光谱信息的提取,去除受噪声和杂散光影响大的波段后,运用Savitzky-Golay卷积平滑对400 nm~900 nm范围的波长进行预处理;采用SPA降维及均方根误差值选择了25个特征波长,同时利用PSO-BP神经网络的初始权重和阈值,构建PSO-BP模型作为分类器进行了实验,取得了测试集识别准确率为98.7%、kappa系数为0.98及遗漏误差为3的数据。结果表明,相较4个对比方法构建的分类模型,该模型的准确率分别提高了2.1%、8.6%、3.9%和4.3%。该方法在基于高光谱成像的花生品种分类技术中具有很好的应用前景,为花生品种的高精度、快速无损分类提供了新思路。

English Abstract

    • 快速、无损且精准的花生品质检测在农业工程的发展中具有战略价值。作为一种营养和经济价值都非常高的植物,花生品种的品质在培育、种植、生产加工和销售等方面都有极其重要的作用。优良的花生品种具有更好的价值和市场竞争力,可以增强我国食用油的供应能力,保障我国粮食产量与质量安全[1]。所以,开发出高精度、稳定的花生分类鉴别模型是迫切且有重大意义的。

      目前,高光谱成像(hyperspectral imaging,HSI)技术作为一项前沿的快速、无损且高效的检测方法,在地质检测[2]、食品安全检测[3]、农产品品种鉴别[4-6]、木材[7]及水果[8]等领域得到广泛应用。高光谱图像涵盖了特定波长的像素点分布信息和每个像素的光谱信息[9]。当物质分子发生振动或能级跃迁时,会产生具有独特光谱吸收峰的现象,但不同分子在物质中的组成和含量有差异,它们的光谱吸收峰在位置和强度上也存在区别。通过采集物体的高光谱图像,可以获取其光谱特征,进而实现对不同品种或物质的分类和识别。越来越多的机器学习算法与HSI结合使用,以对样本进行分类、回归等。2017年,LIANG等人[10]利用主成分分析法(principal components analysis,PCA)对小麦光谱数据降维,通过使用支持向量机(support vector machine,SVM)构建了基于敏感波段筛选的判别模型,区分了白粉病和条锈病,结果显示,该模型在病害区分上的精度达到92%,但该模型只识别了两种病害,且精度偏低。2022年,XUE等人[11]使用PCA降维,结合8种机器学习算法对5种玉米种子的近红外光谱数据建模识别,分类准确率在80.8%~98.4%之间,结果证明了不同判别算法建模效果有差异,可以对其进行优化和改进。2023年,ZHU等人[12]提出了一种融合合成少数类过采样技术(synthetic minority oversampling technique, SMOTE)、非信息变量消除法(uninformative variables elimination,UVE)和SVM的种子纯度高光谱检测模型,结果表明,5类小麦种子的平均准确率、精确率和负样本检出率分别达到95.98%、94.94%和89.32%,该模型减小了样本不均衡及波段信息冗余问题造成的纯度检测精度低的影响,但使用传统判别方法SVM建模,检测准确率偏低。光谱数据与待测成分通常呈现非线性关系,传统的线性建模方法难以充分反映二者之间的关联。

      为了提高可见-近红外波段的花生高光谱图像分类的精度和减少分类检测时间,利用图像背景分割和Savitzky-Golag(SG)卷积平滑对原始光谱数据进行预处理,采用连续投影算法(successive projections algorithm,SPA)获取特征波长,同时使用粒子群优化(particle swarm optimization, PSO)算法寻找反向传播神经网络(back propagation neural network,BPNN)初始权值和阈值的最优解,基于反向传播(back propagation, BP)的最优建模参数结合SPA构建分类模型。选择BPNN、随机森林(random forest,RF)、径向基函数(radial basis function,RBF)及SVM共4种机器学习分类判别算法与本文中提出的SPA-PSO-BP算法作对比实验。结果表明,SPA-PSO-BP方法是5种方法中分类检测效果最好的。

    • SPA是一种基于连续投影原理的特征波长选择方法,通过将每个波长投影在其它波段上计算出投影向量的值,选择具有最低冗余信息和最小共线性的特征波长[13-14],从而减少运算时间,并提高模型分类精度。

      设光谱矩阵为Xmn,其中m为样本数,n为列向量波长数。任选Xmn的一列向量xj记为xk(n)。算法实现步骤如下。

      (a) 确定N为选择的波长数,N={j, j∈{k(0), …, k(n-1)}};

      (b) 确定S为未被选的波长数,S={j, j∉{k(0), …, k(n-1)}};

      (c) 根据下式计算xjS的向量投影Pxj

      $\boldsymbol{P}_{\boldsymbol{x}_j}=\boldsymbol{x}_j-\left[\boldsymbol{x}_j{ }^{\mathrm{T}} \boldsymbol{x}_{k(n-1)}\right] \boldsymbol{x}_{k(n-1)}\left[\boldsymbol{x}_{k(n-1)}{ }^{\mathrm{T}} \boldsymbol{x}_{k(n-1)}\right]^{-1}$

      (1)

      (d) 根据下式筛选出最大Pxj的波长序号:

      $k(n)=\arg \left(\max \left\|\boldsymbol{P}_{x_j}\right\|\right), (j \in S)$

      (2)

      (e) 令xj=Pxjn=n+1,当nN,返回步骤(b)继续计算,否则算法结束;

      (f) 最后得到所选波长序列为{k(n)=0, 1, 2, …, N-1}。

      SPA通过上述步骤提取出所选中的波长序列{k(n)=0, 1, 2, …, N-1},对确定的每一对k(0)和N波长变量子集,通过多元线性回归构建的模型进行交叉验证获取均方根误差值(root mean square error,RMSE),选择最小的RMSE值所对应的波长变量组合就是SPA的最优选择结果。

    • BPNN是一种基于误差反向传播算法的监督学习算法。它由输入层、隐藏层和输出层组成,被广泛应用于分类识别[15]、质量检测[16]等任务。网络的训练过程分为前向传播和反向传播两个阶段。在前向传播中,输入信号经过每一层的神经元处理,传递到输出层产生模型的预测结果。然后,通过比较预测结果与实际输出,计算误差。反向传播阶段利用这一误差信息,沿着网络的反方向调整连接权重,以减小误差,实现网络的学习和优化。网络的每个节点都接收一组输入信号,对这些输入信号进行加权和求和,并通过一个激活函数(例如sigmoid函数)进行非线性变换,生成节点的输出。合理增加隐藏层的数量能有效拟合非线性函数,并处理复杂的输出问题。

      本文中采用的BPNN为3层,输入层对应选定的特征波长数,即25个输入节点;输出层对应类别数,有7个节点。为了有效应对梯度消失问题,加速网络的收敛,选择修正线性单元(rectified linear unit, ReLU)函数作为隐藏层的激活函数。同时,为了将输出映射为概率分布以表示各个类别的概率,输出层的激活函数确定为softmax函数。设置网络训练参数:学习率为0.01;目标误差为10-5;训练次数为500次。最后调试模型确定网络结构为25(输入层)-6 (隐藏层)-7(输出层)进行预测,其网络结构如图 1所示。

      图  1  BPNN结构图

      Figure 1.  BPNN structure diagram

      输入层的样本为Xi,隐藏层的节点输入为Bj

      $B_j=\sum\limits_i^M H_{i j} X_i-\theta_j$

      (3)

      式中:Hijθj分别为输入层与隐藏层第j个神经元的连接权值和阈值;M为输入层的节点数。

      输出层的节点输入Ck为:

      $C_k=\sum\limits_j^L S_{k j} b_j-\alpha_k$

      (4)

      式中:Skjαk分别为输出层与隐藏层第k个神经元的连接权值和阈值;bjBj在隐藏层神经元中经激励函数运算后的输出;L为隐藏层节点数。

    • PSO选择合适的参数是一个不断试验和调整的复杂、优化问题,它具有精度高、收敛快的特点,已广泛应用在质量预测[17]、目标跟踪[18]、参数辨识[19]等领域。应用PSO优化BP神经网络时,主要任务是搜索BPNN的全局最优初始权重和阈值,如图 2所示。

      图  2  PSO优化BPNN步骤

      Figure 2.  Steps of BPNN optimization by PSO

      PSO通过迭代的方式逐渐优化解的质量,种群规模越大搜索范围也越大,有利于探索到全局最优解,但数量过多也会消耗计算资源,通常将种群规模设置在10~50之间,本文中设置为30;为了避免粒子速度增长过快或过慢,设置vmaxvmin为速度的上、下界,取值在[-1, 1]之间;为了确保解在粒子位置合理的范围内,避免越界,设置zmaxzmin为位置的上、下界,取值在[-2, 2]之间。PSO优化BPNN的步骤见下。

      (a) 首先初始化n个粒子组成的种群z=(z1, z2, …, zn),种群z中的每一项代表1个粒子。粒子的位置表示BP的参数(权重和偏置),第i个粒子在D维度空间的位置向量为zi=(zi, 1, zi, 2, …, zi, D)T,(i=1, 2, …, n),其速度向量为 vi=(vi, 1, vi, 2, …, vi, D)T

      (b) 使用数据集训练BP神经网络,并选择目标函数(例如均方误差)作为粒子的适应度值。1个粒子在D维空间中所能发现的最佳位置记为Fi=(Fi, 1, Fi, 2, …, Fi, D)T,种群全局在D维空间中的最佳位置记为Fg=(Fg, 1, Fg, 2, …, Fg, D)T

      (c) 粒子的速度和位置在迭代时会更新,根据FiFg按照以下公式进行更新:

      $\begin{gathered} v_{i, j}{ }^{(t+1)}=\omega_{i, j}{ }^{(t)}+c_1 r_1\left(F_{i, j}{ }^{(t)}-z_{i, j}{ }^{(t)}\right)+ \\ c_2 r_2\left(F_{\mathrm{g}, j}{ }^{(t)}-z_{i, j}{ }^{(t)}\right) \end{gathered}$

      (5)

      $ z_{i, j}{ }^{(t+1)}=z_{i, j}{ }^{(t)}+v_{i, j}{ }^{(t+1)}$

      (6)

      式中:上标t代表当前为第t次迭代,在每一次迭代中,粒子群会更新速度和位置,寻找更好的解,为保证连续迭代达到收敛状态,本文中t取50;j=1, 2, …, Dω为惯性权重,本文中选用自适应调整的线性递减惯性权重,经典惯性权重值一般ωmax=0.9,ωmin=0.4,本文中取初始ω=0.8;c1表示个体学习因子,c2表示社会学习因子,用于调整粒子速度更新,c1c2在取值0和4两端时,迭代次数较大,通常取值在区间[0, 4], 本文中取c1=c2=2;r1r2为分布在区间[0, 1]的随机数。

    • 实验中选择正常良好的华一罗汉、鲁花一号、双冠白沙、优品红沙、冀花五号、黑花生和彩衣仙子共7个品种,每种100粒,共700粒花生样本。数据采集时,将样本分为7组,每组为同一品种的100粒样本,整齐排列在位移台上按照系统设置参数进行拍摄。此高光谱成像系统的主要组成有线扫描光谱仪(ImSpector N10E,400 nm~1000 nm)、14 bits的1600 pixel×1200 pixel的电荷耦合器件(charge-conpled device, CCD)相机、双侧150 W卤素灯线性光源(IT3900)、1维位移台(IRCP-0076-400)等。该系统的光谱分辨率为5 nm,图像分辨率为696 pixel×520 pixel。采集前,调整光学系统的物距、曝光时间、焦距和移动速度,保证采集到的花生图像形状清晰准确。经过多次实验,设定参数为:镜头焦距调整到30 cm~40 cm时,得到实际的采集线宽10 cm~13 cm;曝光时间为10 ms;平台移动速率为7 mm/s时,满足拍摄要求。高光谱成像系统组成如图 3所示。

      图  3  高光谱成像系统的组成

      Figure 3.  Composition of hyperspectral imaging system

      在采集图像过程中,要获取黑白噪声进行黑白校正,以减少或消除采集过程中高光谱摄像头中存在的暗电流、杂散光和电荷耦合器件的噪声干扰等影响[20]。校正公式为:

      $\boldsymbol{R}=\frac{\boldsymbol{I}_{\text {raw }}-\boldsymbol{I}_{\text {dark }}}{\boldsymbol{I}_{\text {white }}-\boldsymbol{I}_{\text {dark }}}$

      (7)

      式中:R为校正后图像;Iraw为原始光谱图像;Iwhite为标准白板图像;Idark为暗场图像。

      完成黑白校正后,利用阈值分割将高光谱图像划分成不同的区域集合,使每个区域具有相似的特征或属性,具有提高目标识别的准确性,降低背景干扰和噪声等效果。对图像在370.38 nm~930.23 nm之间的反射值分析,看到背景光谱与样本光谱反射值差异在641.25 nm~780.47 nm波长范围内最大,因此,使用这个波长范围的方差图进行阈值分割生成二值图像,然后将二值图像作为掩模应用于高光谱图像进行背景分割,分割后的图像背景光谱反射值则为0。由于成像系统获得的高光谱数据是通过光源照射到样本再反射到相机的反射值,所以可以把光谱数据值称为光谱反射值。单粒花生样本的背景分割过程如图 4所示。

      图  4  高光谱图像分割过程

      Figure 4.  Process of segmentation in hyperspectral image

      完成分割后,使用软件对图像感兴趣区域内的有效光谱信息进行提取。该成像系统的图像分辨率为696 pixel×520 pixel,故获得了样本在370.38 nm~930.23 nm波长范围内的共有700行和520列的高光谱图像数据矩阵。矩阵的行代表样本数,列代表光谱波长值及对应的特征。去除370.38 nm~399.81 nm和901.36 nm~930.23 nm这两个波长范围内的受噪声和杂散光影响较大的57列波长数据后,整合剩下在400.83 nm~900.25 nm范围内的光谱波长数据为一个700行463列的新矩阵,得到7种样本光谱平均反射值,如图 5所示。

      图  5  7种花生样本的光谱反射值

      Figure 5.  Spectral reflectance of seven peanut samples

      在利用光谱矩阵构建模型前,采用SG算法拟合局部数据点的多项式来去除数据中的高频噪声和干扰信号,在不破坏原有特征的情况下对光谱数据进行平滑处理,可有效提高数据的信噪比,增强模型的鲁棒性及分类精度。SG算法多项式阶数的取值范围在[0, 4]之间,本文中取2;拟合的窗口长度应根据数据的特征和噪声水平进行选择,窗口长度应该足够大以覆盖数据中的特征,并且可以平滑噪声的影响,同时也避免过度平滑导致信号变得模糊,本文中取13。对所有图像数据进行SG预处理后,选取每个品种的5个典型样本的光谱曲线展示,如图 6~图 12所示。图 6~图 12分别为黑花生、彩衣仙子、冀花5号、华一罗汉、双冠白沙、优品红沙以及鲁花1号共7种花生样品预处理前后的曲线。

      图  6  黑花生典型样本预处理前后的光谱曲线

      Figure 6.  Spectral curves of Black peanut samples before and after pretreatment

      图  7  彩衣仙子典型样本预处理前后的光谱曲线

      Figure 7.  Spectral curves of Colorful cloth peanut samples before and after pretreatment

      图  8  冀花5号典型样本预处理前后的光谱曲线

      Figure 8.  Spectral curves of Jihua No.5 peanut samples before and after pretreatment

      图  9  华一罗汉典型样本预处理前后的光谱曲线

      Figure 9.  Spectral curves of Huayiluohan peanut samples before and after pretreatment

      图  10  双冠白沙典型样本预处理前后的光谱曲线

      Figure 10.  Spectral curves of Double crown white sand peanut samples before and after pretreatment

      图  11  优品红沙典型样本预处理前后的光谱曲线

      Figure 11.  Spectral curves of Excellent red peanut samples before and after pretreatment

      图  12  鲁花1号典型样本预处理前后的光谱曲线

      Figure 12.  Spectral curves of Luhua No.1 peanut samples before and after pretreatment

      结合图 5图 6~图 12可知,品种为冀花五号的样本在波长范围400.83 nm~650.82nm之间反射值较高,品种为彩衣仙子的样本在波长范围687.97 nm~900.25 nm之间反射值最高,与其它品种花生的光谱曲线差异较为明显,这些差异主要是由于花生中的蛋白质、脂肪、叶绿素和水的成分含量不同而在光谱的不同波长区间的反射值不同造成的。

    • 原始光谱数据庞大,在光谱波长之间存在共线性和冗余,会使模型运算时间变长、分类准确度降低。为解决这些问题,使用SPA来选择最具信息性、最少冗余和最小共线性的特征波长。在SPA应用中,波长数选择范围设定为5~40,同时进行数据缩放,可得到预测集的RMSE值(见图 13a)以及特征波长的索引位置分布(见图 13b)。

      图  13  基于SPA选择的特征波长

      Figure 13.  Characteristic wavelengths selected based on SPA

      图 13a可知,当选择的特征波长数为25时,对应的RMSE取得最佳值为0.9342。特征波长的位置分布如图 13b所示。这些特征波长值从400.83 nm~900.25 nm,主要集中在828.10 nm~899.14 nm范围之间。在模型开发之前,为了使模型减少过拟合的风险,增强泛化能力,也同时避免样本差异带来影响,把7个品种的700粒花生样本数据集打乱,按照比例为2∶1随机划分为两组,训练集为467粒,测试集为233粒。采用SPA-PSO-BP方法建模识别的结果如图 14所示。图 14a为模型识别准确率;图 14b为模型迭代误差变化。

      图  14  基于SPA-PSO-BP方法的判别结果

      Figure 14.  Discriminant results based on SPA-PSO-BP

      图 14b可观察到,在模型训练的过程中,当粒子群迭代次数增加时,BPNN的适应度值(即错误率)逐渐减少,并且当迭代次数达到15时,模型实现收敛,适应度值为0.004,足够小,代表BP也完成了优化迭代求解,最终在预测集上达到了准确率为98.7%,kappa系数为0.98,遗漏误差为3的结果。RF可以处理大规模、不平衡的数据集,但对于线性模型解释困难;SVM适用于小样本和高维数据,但模型容易过拟合且对于参数调节比较敏感;RBF神经网络优点是能够处理非线性问题,模型具有较好的泛化能力。但是缺点比较明显:需要调节的超参数较多、对参数敏感、训练时间长等。基于SPA-PSO-BP方法构建模型的25个特征波长,与4种对比判别算法识别的结果如图 15所示。

      图  15  4种对比判别算法的识别结果

      Figure 15.  Results of four contrast discriminant algorithms

      图 15a可知,经典BP算法的识别检测准确率为96.6%,比基于PSO-BP方法的识别准确率低2.1%,且RF、RBF和SVM分类判别算法的识别准确率也分别比PSO-BP低了8.6%、3.9%和4.3%。结果证实了经PSO对BP的初始权值和阈值优化后,基于SPA-PSO-BP方法对于有差异、复杂的样本能很好地进行分类判别,且精度更高,模型泛化能力强。本文中使用准确率、kappa系数及遗漏误差作为模型结果评价指标,kappa系数公式定义为:

      $\kappa=\frac{p_{\mathrm{o}}-p_{\mathrm{e}}}{1-p_{\mathrm{e}}}$

      (8)

      式中:po是每一类正确分类的样本数量之和除以总样本数,即为观察到的精确度;pe为期望的精确度。κ的取值范围为[-1, 1],取值越接近1代表评估性能越好。对4种对比判别算法的评价指标、预测结果和相关参数的设置如表 1所示。表中,c为SVM算法中的惩罚系数;kernel函数运用线性。

      表 1  4种对比判别算法的参数设置、预测结果及kappa系数

      Table 1.  Parameter settings, prediction results and kappa coefficients of four comparative discriminative algorithms

      recognition algorithm parameter omission error prediction accuracy/% kappa coefficient
      BP hidden layer: 10 8 96.6 0.96
      RF trees: 60 leaf: 3 23 90.1 0.89
      RBF spread: 100 12 94.8 0.94
      SVM c: 10 kernel function: linear 13 94.4 0.94

      由表中数据可知,在4种对比判别算法中,BP的识别准确率最高为96.6%,但仍然比基于PSO-BP的识别准确率低2.1%,这代表PSO优化了BP的初始权重和阈值,增强了其对于高光谱图像的分类能力,证实SPA可以减少或消除原始光谱数据波长间的冗余信息、共线性等问题,说明了基于SPA-PSO-BP方法构建的模型应用在可见光-近红外波长区间的高光谱图像分类具有很好的预测准确率和鲁棒性。

    • 基于可见-近红外高光谱成像技术,对采集的7种花生样本的高光谱数据进行定性分析,构建基于特征波长的SPA-PSO-BP的分类检测模型。结果证明,去除受噪声和杂散光影响大的部分波段,使用SG卷积平滑和图像分割对400.83 nm~900.25 nm之间的光谱数据进行预处理,可以减少光谱数据中的干扰因素带来的影响。利用SPA从463个波长变量中选择25个特征波长,有效地减少了模型运算时间,降低了检测模型的复杂度。利用PSO对BP的初始权重和阈值优化来寻找最优解,可以提高SPA-PSO-BP模型的分类性能,增强模型鲁棒性。最后预测集的模型准确率、kappa系数与遗漏误差分别为98.7%、0.98和3,相较4种对比分类判别模型也验证了SPA-PSO-BP分类模型的高精度和稳定性。综上所述,基于可见-近红外光谱结合SPA-PSO-BP可以实现不同花生品种的快速、无损及高精度的分类鉴别,为花生品质检测的进一步研究提供方法和参考依据。

参考文献 (20)

目录

    /

    返回文章
    返回