高级检索

ISSN1001-3806CN51-1125/TN 网站地图

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于MPSO-SVM的硫化橡胶及助剂的太赫兹光谱分类识别

殷贤华 刘昱 贺微 奉慕霖 石玉林

引用本文:
Citation:

基于MPSO-SVM的硫化橡胶及助剂的太赫兹光谱分类识别

    作者简介: 殷贤华(1974-),男,副教授,主要研究领域为太赫兹检测技术。E-mail:yxh4417@guet.edu.cn.
  • 基金项目:

    广西自动检测技术与仪器重点实验室主任基金资助项目 YQ19102

    国家自然科学基金资助项目 61841502

    广西自然科学基金资助项目 2018GXNSFAA281341

  • 中图分类号: O433.4; TN209

Classification and recognition of vulcanized rubber and its auxiliary based on MPSO-SVM

  • CLC number: O433.4; TN209

  • 摘要: 为了加强硫化橡胶及其助剂的检测分析,对外表、气味或者特性相似的橡胶及其助剂准确分类,将改进的粒子群优化支持向量机的建模方法引入到太赫兹光谱的定性分析中。结果表明,针对不同的数据集,本研究算法最低的综合分类正确率为81.25%;相较于传统粒子群优化的支持向量机算法,本算法在识别时间上也有所提高,时间耗费整体小于9.40s。该方法针对不同数据集可以稳定、准确地分类,为硫化橡胶及其助剂的定性分析提供了新的研究思路。
  • Figure 1.  Basic process of MPSO-SVM

    Figure 2.  Absorbance spectrum of different substances

    Figure 3.  Confusion matrix of classification results for four kinds of vulcanized rubber

    Figure 4.  Confusion matrix of classification results of three kinds of vulcanization accelerators

    Table 1.  Types and quantities of experimental sample set 1 and set 2

    sample set experimental sample number of each sample total number of samples
    set 1 NBR 36 144
    CR 36
    IIR 36
    SBR 36
    set 2 DTDM 36 108
    MBT 36
    TMTM 36
    下载: 导出CSV

    Table 2.  Selection results of SVM model parameters based on three algorithm

    classification model penalty parameter C kernel function parameter σREF
    set 1 set 2 set 1 set 2
    SVM 2.00 2.00 1.00 1.00
    PSO-SVM 5.69 17.80 0.01 0.01
    MPSO-SVM 9.03 19.81 0.01 0.01
    下载: 导出CSV

    Table 3.  The recall and precision of the classification results for the three algorithms

    sample type recall ratio/% precision ratio/%
    SVM PSO-SVM MPSO-SVM SVM PSO-SVM MPSO-SVM
    set 1 NBR 33.33 25.00 25.00 100 100 100
    CR 100 100 100 63.16 60.00 60
    IIR 100 91.67 100 75 100 92.31
    SBR 75.00 100 100 100 85.71 100
    set 2 DTDT 91.67 100 100 91.67 92.31 100
    MBT 100 100 100 100 100 100
    TMTM 91.67 91.67 100 91.67 100 100
    下载: 导出CSV

    Table 4.  Comprehensive evaluation of three algorithms after running 20 times

    classification model the accuracy of training set/% the accuracy of prediction set/% classification recognition time/s
    set 1 set 2 set 1 set 2 set 1 set 2
    SVM 100 100 77.08 94.44 0.64 0.25
    PSO-SVM 95.83 100 79.17 97.22 9.44 4.74
    MPSO-SVM 95.83 100 81.25 100 9.40 4.06
    下载: 导出CSV
  • [1]

    AN J, HAN Y, LIU B Y. Progress in greening process of rubber vulcanization accelerator MBT[J]. China Rubber, 2015, 31(10): 46-48(in Chinese).
    [2]

    WANG Zh, LI H L, JIA T X, et al. Preparation and spectral analysis of tetra sulfide thiuram vulcanized rubber vulcanization accelerator[J]. Spectroscopy and Spectral Analysis, 2015, 35(07): 1875-1878 (in Chinese).
    [3]

    LIAN J S. Application of vulcanizing agent DTDM in rubber[J]. World Rubber Industry, 2003, 60(3): 14-16 (in Chinese).
    [4]

    ZHANG Zh, MENG K, ZHU L G, et al. Study on terahertz wave absorption characteristics of ischemic rat brain tissue[J]. Laser Technology, 2016, 40(3): 372-376 (in Chinese).
    [5]

    OUYANG A G, CAI H Zh, LI B, et al. Quantitative detection of te-rahertz in benzoic acid in corn flour[J]. Laser Technology, 2020, 44(4): 478-484(In Chinese).
    [6]

    ZHANG H, LI Z, HU F, et al. Sensitive distinction between herbs by terahertz spectroscopy and a metamaterial resonator[J]. Spectro-scopy Letters, 2018, 51(4): 174-178. doi: 10.1080/00387010.2018.1442357
    [7]

    PETERS O, SCHWERDTFEGER M, WIETZKE S, et al. Terahertz spectroscopy for rubber production testing[J]. Polymer Testing, 2013, 32(5): 932-936. doi: 10.1016/j.polymertesting.2013.05.003
    [8]

    LOCKHARTL P, RAMOTOWSKI T, RICE M. Terahertz frequency optical properties of acoustic materials[J]. Polymer Testing, 2014, 34(4): 140-145.
    [9]

    MIAO Q, TIAN L, ZHAO K, et al. Terahertz spectroscopic investigations of three kinds of rubber materials[J]. Modern Scientific Instruments, 2011, 37(5): 110-113(in Chinese).
    [10]

    ZHANG X Sh, Ch T Y, CUI H L, et al. Terahertz dielectric spectrum in thermal aging of natural vulcanized rubber[J]. Infrared and Laser Engineering, 2018, 47(10): 291-296(in Chinese).
    [11]

    SIQUEIRA L F S, MORAIS C L M, ARAU'JO JU'NIOR R F, et al. SVM for FT-MIR prostate cancer classification: An alternative to the traditional methods[J]. Journal of Chemometrics, 2018, 32(12): 12-14.
    [12]

    PASADAS D J, RAMOS H G, FENG B, et al. Defect classification with SVM and wideband excitation in multilayer aluminum plates[J]. IEEE Transactions on Instrumentation and Measurement, 2020, 69(1): 241-248. doi: 10.1109/TIM.2019.2893009
    [13]

    LIU Z, ZHOU F, QIN Z, et al. Classification of stellar spectra with SVM based on within-class scatter and between-class scatter[J]. Astrophysics and Space Science, 2018, 363(7): 140-145. doi: 10.1007/s10509-018-3366-2
    [14]

    QIN B Y. Application of terahertz spectroscopy combined with stoichiometry in rapid detection of crop pesticide residues[D]. Xi'an: Xidian University, 2018: 67-68(in Chinese).
    [15]

    CHANG B, TSAI H, YEN C. SVM-PSO based rotation-invariant image texture classification in SVD and DWT domains[J]. Engineering Applications of Artificial Intelligence, 2016, 52(6): 96-107.
    [16]

    WANG X, GUAN S, HUA L, et al. Classification of spot-welded joint strength using ultrasonic signal time-frequency features and PSO-SVM method[J]. Ultrasonics, 2019, 91(1): 161-169.
    [17]

    CHEN T, CAI Zh H, HU F R, et al. Terahertz time-domain spectroscopy study of structurally similar monosaccharide and disaccharide molecules[J]. Spectroscopy and Spectral Analysis, 2019, 39(3): 686-692(in Chinese).
    [18]

    QIN B, LI Z, CHEN T, et al. Identification of genetically modified cotton seeds by terahertz spectroscopy with MPGA-SVM[J]. Optik, 2017, 142: 576-582. doi: 10.1016/j.ijleo.2017.06.030
    [19]

    KUANG F J, XU Y H, ZHANG S Y. Hybrid kernel SVM parameter optimization based on improved chaotic particle swarm and its application[J]. Application Research of Computers, 2014, 31(3): 671-674(In Chinese).
    [20]

    WANG X M, WANG H F, YAO N F. Parametric optimization of laser displacement sensor based on particle swarm optimization algorithm[J]. Laser Technology, 2018, 42(2): 181-186(in Chin-ese).
    [21]

    DENG X, LIU Q, DENG Y, et al. An improved method to construct basic probability assignment based on the confusion matrix for classification problem[J]. Information Sciences, 2016, 340/341(9): 250-261.
  • [1] 冯玮王玉德张磊 . 加权联合降维的深度特征提取与分类识别算法. 激光技术, 2018, 42(5): 666-672. doi: 10.7510/jgjs.issn.1001-3806.2018.05.016
    [2] 魏柏林陈国庆徐建才闫冠峰马超群朱拓高淑梅 . 荧光光谱结合概率神经网络用于无醇啤酒的识别. 激光技术, 2010, 34(6): 794-797. doi: 10.3969/j.issn.1001-3806.2010.06.020
    [3] 熊羽左小清黄亮陈震霆 . 基于多特征组合的彩色遥感图像分类研究. 激光技术, 2014, 38(2): 165-171. doi: 10.7510/jgjs.issn.1001-3806.2014.02.005
    [4] 戴璨王元庆徐帆 . 基于粒子群算法的3维激光雷达回波分解. 激光技术, 2016, 40(2): 284-287. doi: 10.7510/jgjs.issn.1001-3806.2016.02.028
    [5] 王晓蒙王会峰姚乃夫 . 基于粒子群算法的激光位移传感器参量优化. 激光技术, 2018, 42(2): 181-186. doi: 10.7510/jgjs.issn.1001-3806.2018.02.008
    [6] 齐艺超陈伟穆春元祝宁华 . 基于粒子群自整定PID算法的激光器温度控制系统. 激光技术, 2019, 43(5): 650-654. doi: 10.7510/jgjs.issn.1001-3806.2019.05.012
    [7] 陈斯祺张海洋赵长明张子龙王文鑫张明 . 基于天牛须改进粒子群算法的点云配准方法. 激光技术, 2020, 44(6): 678-683. doi: 10.7510/jgjs.issn.1001-3806.2020.06.005
    [8] 杨睿杨瑞峰郭晨霞吴耀 . 双圈同轴型光纤传感器结构的优化与试验验证. 激光技术, 2019, 43(3): 324-328. doi: 10.7510/jgjs.issn.1001-3806.2019.03.007
    [9] 关世豪杨桄李豪付严宇 . 3维卷积递归神经网络的高光谱图像分类方法. 激光技术, 2020, 44(4): 485-491. doi: 10.7510/jgjs.issn.1001-3806.2020.04.015
    [10] 史院平朱拓陈国庆高淑梅郑磊马超群 . 运用荧光光谱特征参量识别五粮液白酒. 激光技术, 2011, 35(5): 684-687. doi: 10.3969/j.issn.1001-3806.2011.05.029
    [11] 陆俊高淑梅熊婕杨幼益陈国庆 . 女性尿液荧光光谱学特性及机理分析. 激光技术, 2010, 34(1): 45-47,84. doi: 10.3969/j.issn.1001-3806.2010.01.013
    [12] 王强辉华文深黄富瑜严阳张炎索文凯 . 基于光谱角背景纯化的高光谱异常检测算法. 激光技术, 2020, 44(5): 623-627. doi: 10.7510/jgjs.issn.1001-3806.2020.05.016
    [13] 陈亮游利兵王庆胜尹广玥褚状状方晓东 . 紫外激光诱导击穿光谱的应用与发展. 激光技术, 2017, 41(5): 619-625. doi: 10.7510/jgjs.issn.1001-3806.2017.05.001
    [14] 王可王慧琴殷颖毛力张毅 . 基于光谱重建技术的壁画颜色复原与评价. 激光技术, 2019, 43(2): 280-285. doi: 10.7510/jgjs.issn.1001-3806.2019.02.024
    [15] 叶勇刘莹孙松 . 硫氰酸铵溶液的喇曼光谱理论与实验研究. 激光技术, 2015, 39(2): 280-283. doi: 10.7510/jgjs.issn.1001-3806.2015.02.028
    [16] 谷玲黄奇峰马超群史院平陈国庆高淑梅 . 液态纯牛奶的3维荧光光谱特性与成分分析. 激光技术, 2011, 35(6): 742-744,769. doi: 10.3969/j.issn.1001-3806.2011.06.005
    [17] 周聪张玲陈根余邓辉蔡颂 . 激光修锐砂轮工艺参量的预测和优化算法. 激光技术, 2015, 39(3): 320-324. doi: 10.7510/jgjs.issn.1001-3806.2015.03.008
    [18] 付奎娄本浊孙彦清龙姝明黄朝军 . Zn0.95-xBe0.05MnxSe稀磁半导体的光谱特性分析. 激光技术, 2015, 39(1): 135-139. doi: 10.7510/jgjs.issn.1001-3806.2015.01.027
    [19] 徐永浩宋彪陈晓帆黄梅珍 . 微型近红外光谱仪在苹果糖度测量中的应用研究. 激光技术, 2019, 43(6): 735-740. doi: 10.7510/jgjs.issn.1001-3806.2019.06.001
    [20] 张进姜红刘峰段斌 . 差分喇曼光谱结合化学计量学检验烟用内衬纸. 激光技术, 2021, 45(1): 61-66. doi: 10.7510/jgjs.issn.1001-3806.2021.01.011
  • 加载中
图(5) / 表(4)
计量
  • 文章访问数:  461
  • HTML全文浏览量:  423
  • PDF下载量:  1
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-03-04
  • 录用日期:  2020-03-27
  • 刊出日期:  2021-01-25

基于MPSO-SVM的硫化橡胶及助剂的太赫兹光谱分类识别

    作者简介: 殷贤华(1974-),男,副教授,主要研究领域为太赫兹检测技术。E-mail:yxh4417@guet.edu.cn
  • 1. 桂林电子科技大学 电子工程与自动化学院,桂林 541004
  • 2. 广西自动检测技术与仪器重点实验室,桂林 541004
基金项目:  广西自动检测技术与仪器重点实验室主任基金资助项目 YQ19102国家自然科学基金资助项目 61841502广西自然科学基金资助项目 2018GXNSFAA281341

摘要: 为了加强硫化橡胶及其助剂的检测分析,对外表、气味或者特性相似的橡胶及其助剂准确分类,将改进的粒子群优化支持向量机的建模方法引入到太赫兹光谱的定性分析中。结果表明,针对不同的数据集,本研究算法最低的综合分类正确率为81.25%;相较于传统粒子群优化的支持向量机算法,本算法在识别时间上也有所提高,时间耗费整体小于9.40s。该方法针对不同数据集可以稳定、准确地分类,为硫化橡胶及其助剂的定性分析提供了新的研究思路。

English Abstract

    • 丁腈橡胶(nitrile butadiene rubber,NBR)、氯丁橡胶(chloroprene rubber,CR)、丁基橡胶(isobutylene isoprene rubber,IIR)和丁苯橡胶(styrene butadiene rubb-er,SBR)是4种使用比较广泛的通用橡胶,主要用来制造各种轮胎和一般橡胶制品。2-硫醇基苯并噻唑(2-mercaptobenzothiazole,MBT)是橡胶工业中广泛使用的硫化促进剂,常常作为其它硫化促进剂的母体原料[1];一硫化四甲基秋兰姆(tetramethyl thiuram monosulfide,TMTM)可以降低硫化橡胶的拉伸强度,适用于工程车辆[2];4,4′-二硫代二吗啉(4, 4-dithiodimorpholine,DTDM)可以使硫化胶拉伸强度和耐疲劳性能平衡,同时耐热、耐老化性能也比较好,适用于小轿车[3]。随着橡胶工业的发展,对橡胶及其助剂的有效检测具有重要的研究意义。目前主要的检测方法有气相色谱法、燃效实验法和红外光谱法等,由于这些方法耗时且准确性低,无法高效地实现橡胶材料的区分,寻找一种高效无损的检测方法至关重要。

      太赫兹(terahertz,THz)波作为一种频率处于0.1THz~10THz之间的电磁辐射[4],其量子能量低、散射效应较弱,对环境辐射不敏感[5],基于太赫兹技术的时域光谱(terahertz time-domain spectroscopy,THz-TDS)系统逐渐应用在许多领域。橡胶及多数助剂属于高分子化合物,在太赫兹波段的吸收和谐振很强,显示出“指纹”特性[6],这使得基于太赫兹的橡胶及其助剂的检测研究成为可能[7]。近年来,国内外学者针对橡胶及其助剂的太赫兹吸收特性展开了研究[8-10]。研究结果表明,部分橡胶及助剂在太赫兹波段展现出独有的吸收特性,具有一定的研究意义。目前的研究中主要针对橡胶和添加剂在太赫兹频段的吸收特性,却很少使用具体的算法来对吸收峰接近或者重叠的橡胶或者助剂建立分类模型。所以,通过太赫兹检测技术进行吸收峰相似的橡胶和助剂的精确分类识别具有重要意义。

      支持向量机(support vector machines,SVM)作为经典的分类算法,成功地应用在各种分类场景[11-13]。但是在SVM模型中,其惩罚参量C和径向基核函数参量σREF对分类结果影响较大,如何优化这两个参量,关系到分类模型的优劣[14]。粒子群算法(particle swarm optimization,PSO)作为一种群体智能寻优算法,在工程计算中广泛应用。部分学者将PSO应用在SVM的参量寻优,实现了相对较好的效果[15-16]。本文中针对PSO容易陷入局部最优、搜索范围窄的缺点,将随机权重策略和异步学习因子同时引入到PSO算法中,提出改进的粒子群算法(majorization particle swarm optimization,MPSO)。针对物理特性相似、特征吸收峰相近的橡胶和硫化促进剂,将MPSO与SVM结合建立精确分类模型,提高橡胶和硫化促进剂的识别准确率。

    • 实验中以NBR, CR, IIR和SBR 4种常用的硫化橡胶,以及MBT, TMTM和DTDM 3种硫化促进剂为实验对象。选用的4种硫化橡胶由国家橡胶及橡胶制品质量监督中心(广西)提供,为纯度为94%以上的原生橡胶粉末经过混炼、返炼、硫化3步制作而成,然后对橡胶质检所提供的橡胶样片裁剪成满足实验系统测试要求的实验样片;3种硫化促进剂购于东莞市百亿塑料制品有限公司(纯度均在96%以上),首先按照设计好的样本配置比例进行称量,然后将样本在研钵中进行充分的研磨混合,最后利用压片机在49000N的压力下压制成片。每个样片厚度1mm左右,直径12mm左右,重量约180mg。每种样片制作了36个实验样品,其中4种硫化橡胶共144个实验样品,3种硫化促进剂共108个实验样品。为减少空气水分对实验样品的影响,样本压制前后,分别将原材料和压制好的样片放入YB-1A真空恒温干燥箱中在50℃下干燥2h左右。实验样品具体信息见表 1所示。

      Table 1.  Types and quantities of experimental sample set 1 and set 2

      sample set experimental sample number of each sample total number of samples
      set 1 NBR 36 144
      CR 36
      IIR 36
      SBR 36
      set 2 DTDM 36 108
      MBT 36
      TMTM 36
    • 实验设备主要由飞秒激光器(德国TOPTICA公司生产)和太赫兹时域光谱系统(美国Zomega公司生产)组成。其中飞秒激光器进光功率约为120mW,脉冲持续时间为100fs,中心波长为780nm,重复频率为80MHz。实验时,将室内温度控制在25℃左右,为减少空气湿度对实验的影响,将THz-TDS实验箱中充入干燥空气,使箱内空气湿度降到1%以内,具体的设备原理图见参考文献[17]。

    • THz-TDS检测的主要目标是获得表征材料特征的宏观光学常数,一般包括复折射率、电导率和吸收系数等。利用透射式THz-TDS在获得参考信号Eref(T)和样品信号Esam(T)后,经过傅里叶变换得到对应的频域信号Eref(ω)和Esam(ω),其中, T表示时间,ω为太赫兹波振动的角频率。吸光度表示太赫兹波被材料吸收的程度,其为无量纲的相对量。使用吸光度来描述样品的吸收特性,可以减少样本厚度不均匀对光谱分析产生的影响。吸光度A(ω)的计算公式如下所示[18]:

      $ A(\omega ) = - \lg {\left| {\frac{{{\mathit{\boldsymbol{E}}_{{\rm{sam}}}}(\omega )}}{{{\mathit{\boldsymbol{E}}_{{\rm{ref}}}}(\omega )}}} \right|^2} $

      (1)
    • 粒子群算法[19]作为一种群智能优化算法,因其优良的寻优特性,被应用在各种工程实践中。PSO的数学原理为[20]:假设存在一个n维搜索空间,由m个粒子组成的种群X={x1, x2, …, xm},其中第i个粒子的位置xi和速度vi表示为:

      $ \left\{ {\begin{array}{*{20}{l}} {{\mathit{\boldsymbol{x}}_i} = {{\left( {{x_{i1}}, {x_{i2}}, \cdots , {x_{in}}} \right)}^{\rm{T}}}}\\ {{\mathit{\boldsymbol{v}}_i} = {{\left( {{v_{i1}}, {v_{i2}}, \cdots , {v_{in}}} \right)}^{\rm{T}}}} \end{array}} \right. $

      (2)

      假设第i个粒子搜索到的最优位置为pi=(pi1, pi2, …, pin)T,种群的全局最优位置为pg=(pg1, pg2, …, pgn)T,那么第d维的粒子xi的速率和位置更新公式如下所示:

      $ \begin{array}{l} v_{id}^{(t + 1)} = wv_{id}^{(t)} + {c_1}{r_1}\left( {p_{id}^{(t)} - x_{id}^{(t)}} \right) + \\ \;\;\;\;\;\;\;\;\;\;{c_2}{r_2}\left( {p_{gd}^{(t)} - x_{id}^{(t)}} \right) \end{array} $

      (3)

      $ x_{id}^{(t + 1)} = x_{id}^{(t)} + x_{id}^{(t + 1)} $

      (4)

      式中, d=1, 2, …, n, 表示粒子维数; i=1, 2, …, m, 表示第i个粒子; t表示当前迭代次数,t+1表示下一代迭代数; w表示惯性权重,c1c2表示学习因子; r1r2表示[0, 1]上服从均匀分布的伪随机数。

      面对PSO算法容易出现陷入局部极值或者过早停止收敛的现象,将随机权重策略和异步学习因子加入到PSO算法中。随机权重策略的引入有两个优点:首先,如果在进化初期接近最好点,随机权重策略可能产生相对较小的w值,加快算法的收敛速度。另外,w的随机生成可以有效避免迭代初期最优值的错失,提高寻优的准确率。w的描述如下式所示:

      $ \left\{ {\begin{array}{*{20}{l}} {w = \mu + \sigma \times N(0, 1)}\\ {\mu = {\mu _{\min }} + \left( {{\mu _{\max }} - {\mu _{\min }}} \right) \times r(0, 1)} \end{array}} \right. $

      (5)

      式中,N(0, 1)表示标准正太分布的随机数,r(0, 1)表示0~1之间的随机数, μ表示均值,μminμmax分别表示均值μ可以取到的最小值和最大值, σ表示均方差。

      面对PSO算法固定学习因子带来的收敛速度慢、寻优范围窄的权限,将随着迭代而变化的学习因子(异步学习因子)引入到PSO中可以增强了迭代初始阶段的全局搜索能力,有利于收敛到全局最优。异步学习因子的变化公式为:

      $ {{c_1} = {c_{1, {\rm{ begin }}}} + \frac{{{c_{1, {\rm{ end }}}} - {c_{1, {\rm{ begin }}}}}}{{{t_{{\rm{max }}}}}} \times t} $

      (6)

      $ {{c_2} = {c_{2, {\rm{ begin }}}} + \frac{{{c_{2, {\rm{ end }}}} - {c_{2, {\rm{ begin }}}}}}{{{t_{{\rm{max }}}}}} \times t} $

      (7)

      式中,c1, beginc2, begin表示学习因子初值,c1, endc2, end表示学习因子终值,tmax表示最大迭代次数。

      通过MPSO与SVM的结合,提出改进的粒子群优化支持向量机(MPSO-SVM)分类模型。以分类准确率作为适应度函数对SVM的惩罚参量C和径向基核函数参量σREF进行迭代寻优,从而提高SVM模型的分类正确率。MPSO-SVM的基本流程如图 1所示。

      Figure 1.  Basic process of MPSO-SVM

      迭代开始前对基本参量进行初始化:学习因子初值设置为2.5,学习因子终值设置为0.5,均值μmax取为0.8,均值μmin取为0.5,方差σ取为0.2,tmax取为100,种群数量设置为20,惩罚因子C和核函数参量σREF的初值范围设置为[10-2, 102];

    • 混淆矩阵作为一种机器学习中经典的可视化指标,可以较直观地衡量一个分类器分类的准确程度。混淆矩阵行对应的类别表示样本的真实类别,每一行的实验样本总数为该行对应的类别的真实样本数;各列类别为预测类别,每一列的实验样本总数为预测为该类的样本总数[21]。其中,基于混淆矩阵的查全率(recall ratio)R和查准率(precision ratio)P是两个比较常用的指标,其计算公式如下所示:

      $ {{R_h} = \frac{{{N_{hh}}}}{{\sum\limits_{j = 1}^k {{N_{hj}}} }}} $

      (8)

      $ {{P_h} = \frac{{{N_{hh}}}}{{\sum\limits_{j = 1}^k {{N_{jh}}} }}} $

      (9)

      式中,查全率Rh表示被模型正确预测为第h类的实验样本数与第h类实验样本真实数量之比,衡量分类模型识别相关种类能力的尺度;查准率Ph表示被模型正确预测为第h类的实验样本数与被模型预测为第h类的实验样本总数之比,表示模型识别某个种类的精确度;Nhh, Nhj, Njh分别表示混淆矩阵中第h行第h列、第h行第j列、第j行第h列所对应的数值。

    • 本研究中利用太赫兹时域光谱系统分别对NBR, CR, IIR和SBR 4种硫化橡胶,以及MBT, DTDM和TMTM 3种硫化促进剂进行多次测量取平均后,分别得到7种物质的纯净物吸光度图谱,如图 2a图 2b所示。

      Figure 2.  Absorbance spectrum of different substances

      由于不同物质分子振动模式的不同,各物质在太赫兹频段显示出特有的“指纹”特性,使得不同物质在不同频率点具有特定的吸收峰。从图 2a可以看出,在0.3THz~1.6THz频段内,4种硫化橡胶具有各自独特的特征吸收峰:丁腈橡胶(NBR)在0.92THz, 1.22THz和1.39THz处有3个的特征吸收峰; 氯丁橡胶(CR)在1.24THz和1.39THz处具有两个明显的特征吸收峰; 丁基橡胶(IIR)在1.08THz和1.48THz处存在两个特征吸收峰; 丁苯橡胶(SBR)在1.09THz和1.52THz处有明显特征吸收峰。从图 2b可以看出,3种硫化促进剂的特征吸收峰较明显,DTDM在1.51THz处有明显的特征吸收峰,MBT在0.92THz和1.40THz处存在特征吸收峰,TMTM在1.48THz处存在一个明显的特征吸收峰。

      可以看出,4种硫化橡胶的特征吸收峰位置较接近,如果受噪声或者误差的影响,吸收峰存在偏移而发生重叠,则很难对4种橡胶做出准确判断;3种硫化促进剂中,MBT的吸收峰较独特,可以明显区分,但是DTDM和TMTM的吸收峰位置接近,难以直观地准确区分。所以针对4种硫化橡胶和3种硫化促进剂,需要借用一定的分类算法来进行建模区分。

    • 为了更加准确地对4种硫化橡胶和3种硫化促进剂进行分类,采用MPSO-SVM来进行精确分类识别。如表 1所示,4种硫化橡胶144个样本数据中,96个样本数据进行模型训练,48个样本数据进行测试;3种硫化促进剂108个样本数据中,72个样本数据进行模型训练,48个样本数据进行测试。针对以上数据集,利用SVM、PSO-SVM和MPSO-SVM 3种模型进行分类识别。首先,以分类正确率作为适应度,通过算法对支持向量机的参量进行寻优,结果如表 2所示。

      Table 2.  Selection results of SVM model parameters based on three algorithm

      classification model penalty parameter C kernel function parameter σREF
      set 1 set 2 set 1 set 2
      SVM 2.00 2.00 1.00 1.00
      PSO-SVM 5.69 17.80 0.01 0.01
      MPSO-SVM 9.03 19.81 0.01 0.01

      基于表 2中的参量,3种模型分类结果的混淆矩阵如图 3图 4所示。

      Figure 3.  Confusion matrix of classification results for four kinds of vulcanized rubber

      Figure 4.  Confusion matrix of classification results of three kinds of vulcanization accelerators

      图 3是3种算法针对4类硫化橡胶分类得到的混淆矩阵。图中,1,2,3,4依次对应NBR,CR,IIR和SBR 4种硫化橡胶。从图 3a中可以看出,SVM算法的误判集中在第1类橡胶和第4类橡胶上,其中7个第1类橡胶被错分到第2类,1个第1类橡胶被误判为第3类橡胶,以及3个第4类橡胶被误判为第3类橡胶;从图 3b中可以看出,PSO-SVM算法的分类结果较好,误判主要集中在第1类上,将8个第1类橡胶分到了第2类和1个第1类橡胶分到了第4类,将1个第3类错分为第4类;从图 3c中可以看出,误判率主要集中在第1类上,将8个第1类分到了第2类和1个第1类分到了第4类。整体而言,误判率主要集中在第1类橡胶上,主要原因是第1类橡胶和第2类橡胶的特征吸收峰位置很接近,其中1.39THz处的吸收峰发生重叠是主要影响误判的原因。

      图 4是3种算法针对3类硫化促进剂分类得到的混淆矩阵。图中,1, 2, 3依次对应DTDM, MBT和TMTM 3种硫化促进剂。从图 4中可以看出,相较于4类硫化橡胶,3类硫化促进剂的分类结果更好。从图 4a中可以看出,SVM算法的误判主要集中在第1类和第3类,其中1个第1类和1个第3类互相误判;从图 4b中可以看出,PSO-SVM的分类结果比较好,仅将1个第3类误判为第2类;从图 4c中可以看出,MPSO-SVM的误判率为零,3类硫化促进剂可以全部正确分类,效果最好。

      进一步定量评判分类结果,由混淆矩阵计算出set 1和set 2数据集分类结果的查全率和查准率,如表 3所示。从表中可以看出,针对set 1数据集,MPSO-SVM识别CR, IIR和SBR的查全率均为100%,在NBR橡胶的查全率仅为25%, 低于SVM;对于查准率,MPSO-SVM针对NBR和SBR可以精确分类,在CR的分类精准度上略低于SVM。针对set 2数据集,MPSO-SVM的查全率和查准率均为100%,效果最佳。

      Table 3.  The recall and precision of the classification results for the three algorithms

      sample type recall ratio/% precision ratio/%
      SVM PSO-SVM MPSO-SVM SVM PSO-SVM MPSO-SVM
      set 1 NBR 33.33 25.00 25.00 100 100 100
      CR 100 100 100 63.16 60.00 60
      IIR 100 91.67 100 75 100 92.31
      SBR 75.00 100 100 100 85.71 100
      set 2 DTDT 91.67 100 100 91.67 92.31 100
      MBT 100 100 100 100 100 100
      TMTM 91.67 91.67 100 91.67 100 100

      保持set 1和set 2训练集和测试集的样本不变,将SVM, PSO-SVM和MPSO-SVM 3种方法分别运行20次,得到训练集和测试集的平均准确率如表 4所示。从表中可以看出,3种方法针对两个不同的数据集的结果中,MPSO-SVM算法的综合正确率更高;本文中的算法在Intel(R) Core(TM) i5-4210U CPU 1.70GHz、内存为4GB的电脑配置环境下运行,相比PSO-SVM算法,该算法的分类识别时间更短,效率更高。

      Table 4.  Comprehensive evaluation of three algorithms after running 20 times

      classification model the accuracy of training set/% the accuracy of prediction set/% classification recognition time/s
      set 1 set 2 set 1 set 2 set 1 set 2
      SVM 100 100 77.08 94.44 0.64 0.25
      PSO-SVM 95.83 100 79.17 97.22 9.44 4.74
      MPSO-SVM 95.83 100 81.25 100 9.40 4.06
    • 本研究中以4类常见的硫化橡胶和3类常用橡胶硫化促进剂为实验对象,通过改进的粒子群算法与支持向量回归机相结合,建立分类识别模型。研究结果表明,粒子群算法与随机权重策略和异步学习因子的结合可以较好地对支持向量机的惩罚参量和核函数参量进行寻优,从而有效提高分类模型的识别准确率,相比于SVM和PSO-SVM算法,MPSO-SVM算法的识别准确率更高,为基于太赫兹时域光谱技术的物质检测分析提供了新的参考方法,具有重要的参考价值。

参考文献 (21)

目录

    /

    返回文章
    返回