高级检索

ISSN1001-3806CN51-1125/TN 网站地图

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

玉米粉中苯甲酸的太赫兹光谱定量检测研究

欧阳爱国 蔡会周 李斌 刘刚

引用本文:
Citation:

玉米粉中苯甲酸的太赫兹光谱定量检测研究

    作者简介: 欧阳爱国(1968-), 男, 教授, 现主要从事车辆性能检测及仪器新型传感器技术及应用方面的研究。E-mail:ouyang1968711@163.com.
  • 基金项目:

    国家自然科学基金资助项目 31760344

  • 中图分类号: O433.1

Quantitative detection of benzoic acid in corn flour by terahertz spectroscopy

  • CLC number: O433.1

  • 摘要: 为了检测玉米粉中苯甲酸的含量,控制苯甲酸在玉米粉中使用量,提高食品安全等级,采用太赫兹光谱技术对玉米粉中苯甲酸含量进行定量研究,获得了玉米粉中不同质量分数的苯甲酸在0.5THz~3THz的光谱数据。采用偏最小二乘、最小二乘支持向量机和多元线性回归构建光谱模型,未参与建模的样品用来进行模型评估, 并利用预测集相关系数Rp和预测集均方根误差eRMSEP对模型进行了评价。结果表明, 最小二乘支持向量机模型评价能力最强,预测集相关系数Rp=0.9958,预测集均方根误差eRMSEP=0.0057。说明太赫兹技术结合化学计量学方法可以用于定量检测玉米粉中苯甲酸的含量。
  • Figure 1.  Flow chart of LSSVM regression prediction model

    Figure 2.  Terahertz time domain spectrogram

    a—pure benzoic acid b—partial terahertz absorption spectra of benzoic acid mixtures with different mass fractions

    Figure 3.  RMSE varies with principal component factor 0f PLS

    Figure 4.  Regression coefficients

    Figure 5.  Scatters plots of calibration and prediction results of Benzoic acid content by PLS

    Figure 6.  Scatters plots of calibration and prediction results of Benzoic acid content by LS-SVM

    a—original spectrum b—moving average smoothing and for size 5

    Figure 7.  Scatters plots of calibration and prediction results of Benzoic acid content by SPA-MLR

    Table 1.  Mass fractions of 33 benzoic acid samples

    sample number mass fraction of benzoic acid
    1 0.005
    2 0.010
    3 0.015
    4 0.020
    5 0.025
    6 0.040
    7 0.045
    8 0.050
    9 0.060
    10 0.070
    11 0.075
    12 0.080
    13 0.085
    14 0.090
    15 0.100
    16 0.110
    17 0.120
    18 0.125
    19 0.130
    20 0.135
    21 0.140
    22 0.145
    23 0.150
    24 0.155
    25 0.160
    26 0.165
    27 0.170
    28 0.175
    29 0.180
    30 0.185
    31 0.190
    32 0.195
    33 0.200
    下载: 导出CSV

    Table 2.  PLS model results of different pretreatment methods

    preprocessing methods PLS
    principal component Rc eRMSEC Rp eRMSEP
    original 7 0.98602 0.01006 0.98095 0.01152
    moving average smoothing size 3 7 0.98655 0.01005 0.98107 0.01143
    size 5 7 0.98611 0.01002 0.98151 0.01125
    SNV 5 0.97942 0.01671 0.97219 0.01402
    MSC 5 0.97897 0.01231 0.96902 0.01426
    baseline 7 0.98145 0.01156 0.98149 0.01186
    normalization 5 0.97796 0.01218 0.96475 0.01515
    下载: 导出CSV

    Table 3.  LS-SVM model prediction results

    input data kernel function Rp eRMSEP
    type parameter t/s
    original spectrum linear kernel γ=2.4123 0.0468 0.9850 0.0104
    RBF kernel γ=1980.3968, σ2=51.8468 0.0468 0.9958 0.0057
    moving average smoothing size 5 linear kernel γ =2.7239 0.0468 0.9844 0.0106
    RBF kernel γ=192721.9293, σ2=852.7071 0.0312 0.9917 0.0082
    下载: 导出CSV
  • [1]

    WANG N, XIE H, HAN P Zh, et al. Green synthesis of benzoic acid[J]. Chemical Engineer, 2017, 34(2): 69-71(in Chinese). 
    [2]

    LIU C C, WANG Y N, FU L M, et al. Microfluidic paper-based chip platform for benzoic acid detection in food[J]. Food Chemistry, 2018, 249:162-167. doi: 10.1016/j.foodchem.2018.01.004
    [3]

    XIE G Z, ZHANG Q. 2013's food preservative applications and trends research[J]. Food Research and Development, 2013, 34(11): 112-116(in Chinese). 
    [4]

    LI X S, XU L D, HU X Zh, et al. Determination of benzoic acid and sorbic acid in sauce samples by molecular complex-based dispersive liquid-liquid microextraction coupled to high performance liquid chromatography[J]. Journal of Analytical Science, 2013, 29(3): 297-301(in Chinese). doi: 10.2116/analsci.29.297
    [5]

    HSU S H, HU C C, CHIU T C. Online dynamic pH junction-sweeping for the determination of benzoic and sorbic acids in food products by capillary electrophoresis.[J]. Analytical and bioanalytical Chemistry, 2013, 406(2): 635-641. 
    [6]

    BI S Y, ZHU H, XIE B H, et al. Research progress on determination of benzoic acid in food safety[J]. Journal of Anhui Agricultural Sciences, 2017, 45(15): 100-103(in Chinese). 
    [7]

    ZEN Q H. Rapid analysis of benzoic acid and sorbic acid in the acidic food by UV-photometric analysis[J]. Journal of Zunyi Normal Co-llege, 2004, 6(4):59-60(in Chinese). 
    [8]

    CAO B H, LI H, WANG W, et al.Determination of pesticides in a flour substrate by chemometric methods using terahertz spectroscopy[J]. Analytical Methods, 2018, 10(42): 5097-5104. doi: 10.1039/C8AY01728J
    [9]

    YIN X H, WANG Q, MO W, et al. A quantitative analysis method for GCB as rubber additive by terahertz spectroscopy[J]. Spectroscopy and Spectral Analysis, 2018, 38(11): 3385-3389(in Chinese). 
    [10]

    FANG H X, ZHANG Q, ZHNAG H L, et al. Detection of azodicarbonamide in flour based on terahertz time-domain spectroscopy[J]. Journal of the Chinese Cereals and Oils Association, 2016, 31(1): 107-111(in Chinese). 
    [11]

    LIU Y D, DU X Y, LI B, et al. Detection of benzoic acid in arrowroot by terahertz technology[J].Laser & Optoelectronics Progress, 2019, 56(4):041101(in Chinese). 
    [12]

    LIU Y D, XU H, SUN X D, et al. Non-destructive measurement of tomato maturity by near-infrared diffuse transmission spectroscopy[J]. Laser Technology, 2019, 43(1): 25-29(in Chinese). 
    [13]

    SUN Zh H. Study on support vector machine and ins application in control[D].Hangzhou: Zhejiang University, 2003: 10-15(in Ch-inese). 
    [14]

    XIE Y. Icing forecast of power lines based on support vector machine[D]. Chengdu: Xihua University, 2016: 31-55(in Chinese). 
    [15]

    CHU X L. molecular spectroscopy analytical technology combined with chemometrics and its applications[M]. Beijing: Chemical Industry Press, 2011: 31-57(in Chinese).
    [16]

    MENG Q L, ZHANG Y, SHANG J. Nondestructive detection of apple defect combining optical fiber spectra with pattern recognition[J]. Laser Technology, 2019, 43(5): 676-680(in Chinese). 
    [17]

    LIU Y D, XIAO H Ch, DENG Q, et al.Nondestructive detection of citrus greening by near infrared spectroscopy[J]. Transactions of the Chinese Society of Agricultural Engineering, 2016, 32(14): 202-208(in Chinese). 
    [18]

    LI J T, LU C P, SHA W. Quantitative analysis of phosphorus in compound fertilizer by laser induced breakdown spectroscopy[J]. Laser Technology, 2019, 43(5): 601-607(in Chinese). 
  • [1] 张进姜红刘峰段斌 . 差分喇曼光谱结合化学计量学检验烟用内衬纸. 激光技术, 2021, 45(1): 61-66. doi: 10.7510/jgjs.issn.1001-3806.2021.01.011
    [2] 王绍龙王阳恩陈奇陈善俊 . 激光诱导击穿光谱技术定量分析原油金属元素. 激光技术, 2015, 39(1): 104-108. doi: 10.7510/jgjs.issn.1001-3806.2015.01.021
    [3] 殷贤华姜燕吕斌川陈德勇陈涛 . 2-巯基苯并噻唑的太赫兹时域光谱定量研究. 激光技术, 2019, 43(1): 83-87. doi: 10.7510/jgjs.issn.1001-3806.2019.01.017
    [4] 殷贤华郭超奉慕霖贺微 . 基于Tchebichef图像矩的氧化锌太赫兹光谱定量研究. 激光技术, 2019, 43(6): 747-752. doi: 10.7510/jgjs.issn.1001-3806.2019.06.003
    [5] 郝晓剑任龙杨彦伟孙永凯 . 煤中激光诱导击穿光谱的碳元素定量分析. 激光技术, 2020, 44(2): 232-236. doi: 10.7510/jgjs.issn.1001-3806.2020.02.017
    [6] 罗宇恒万恩来刘玉柱 . 利用LIBS技术对电烙铁的烟雾进行在线分析. 激光技术, 2022, 46(5): 663-667. doi: 10.7510/jgjs.issn.1001-3806.2022.05.014
    [7] 付钧泽姜红李意满吉 . 基于多元统计分析的香烟烟灰XRF快速检验. 激光技术, 2020, 44(6): 710-715. doi: 10.7510/jgjs.issn.1001-3806.2020.06.011
    [8] 陆俊高淑梅熊婕杨幼益陈国庆 . 女性尿液荧光光谱学特性及机理分析. 激光技术, 2010, 34(1): 45-47,84. doi: 10.3969/j.issn.1001-3806.2010.01.013
    [9] 李江涛鲁翠萍沙文 . 复合肥中磷元素的激光诱导击穿光谱定量分析. 激光技术, 2019, 43(5): 601-607. doi: 10.7510/jgjs.issn.1001-3806.2019.05.003
    [10] 崔祖文向昱霖张宇璇吴玉兰何宇刘作业孙少华 . 铀酰溶液中铀含量的激光诱导击穿光谱测量. 激光技术, 2021, 45(3): 331-335. doi: 10.7510/jgjs.issn.1001-3806.2021.03.012
    [11] 付奎娄本浊孙彦清龙姝明黄朝军 . Zn0.95-xBe0.05MnxSe稀磁半导体的光谱特性分析. 激光技术, 2015, 39(1): 135-139. doi: 10.7510/jgjs.issn.1001-3806.2015.01.027
    [12] 欧阳玉平成龙吴和成张文穗 . 醇类汽油定性定量分析通用模型的研究. 激光技术, 2019, 43(3): 363-368. doi: 10.7510/jgjs.issn.1001-3806.2019.03.014
    [13] 殷贤华刘昱贺微奉慕霖石玉林 . 基于MPSO-SVM的硫化橡胶及助剂的太赫兹光谱分类识别. 激光技术, 2021, 45(1): 7-12. doi: 10.7510/jgjs.issn.1001-3806.2021.01.002
    [14] 马翠红崔金龙 . 基于改进的偏最小二乘法的LIBS钢液成分定量分析. 激光技术, 2016, 40(6): 876-881. doi: 10.7510/jgjs.issn.1001-3806.2016.06.021
    [15] 王龙沈学举张维安董红军 . 高斯光束的光谱传输特性分析. 激光技术, 2012, 36(5): 700-703. doi: 10.3969/j.issn.1001-3806.2012.05.032
    [16] 郝健张记龙崔丹凤景宁 . 基于FPGA的傅里叶变换光谱仪光谱复原技术. 激光技术, 2011, 35(6): 804-807. doi: 10.3969/j.issn.1001-3806.2011.06.022
    [17] 余洋赵南京王寅方丽孟德硕胡丽马明俊刘建国 . 含铅污泥中Pb的激光诱导击穿光谱定量反演研究. 激光技术, 2015, 39(4): 537-540. doi: 10.7510/jgjs.issn.1001-3806.2015.04.024
    [18] 王可王慧琴殷颖毛力张毅 . 基于光谱重建技术的壁画颜色复原与评价. 激光技术, 2019, 43(2): 280-285. doi: 10.7510/jgjs.issn.1001-3806.2019.02.024
    [19] 王召兵刘涛郝殿中彭捍东张霞吴闻迪 . 有色方解石晶体的光谱分析. 激光技术, 2008, 32(6): 596-597,604.
    [20] 徐远泽郭建强高晓蓉王黎王泽男 . 温度对CO光谱线吸收的影响分析. 激光技术, 2010, 34(6): 778-780,784. doi: 10.3969/j.issn.1001-3806.2010.06.016
  • 加载中
图(7) / 表(3)
计量
  • 文章访问数:  6628
  • HTML全文浏览量:  4980
  • PDF下载量:  19
  • 被引次数: 0
出版历程
  • 收稿日期:  2019-08-29
  • 录用日期:  2019-09-19
  • 刊出日期:  2020-07-25

玉米粉中苯甲酸的太赫兹光谱定量检测研究

    作者简介: 欧阳爱国(1968-), 男, 教授, 现主要从事车辆性能检测及仪器新型传感器技术及应用方面的研究。E-mail:ouyang1968711@163.com
  • 1. 华东交通大学 机电与车辆工程学院, 水果智能光电检测技术与装备国家地方联合工程研究中心, 南昌 330013
  • 2. 江西联创宏声电子股份有限公司, 南昌 330096
基金项目:  国家自然科学基金资助项目 31760344

摘要: 为了检测玉米粉中苯甲酸的含量,控制苯甲酸在玉米粉中使用量,提高食品安全等级,采用太赫兹光谱技术对玉米粉中苯甲酸含量进行定量研究,获得了玉米粉中不同质量分数的苯甲酸在0.5THz~3THz的光谱数据。采用偏最小二乘、最小二乘支持向量机和多元线性回归构建光谱模型,未参与建模的样品用来进行模型评估, 并利用预测集相关系数Rp和预测集均方根误差eRMSEP对模型进行了评价。结果表明, 最小二乘支持向量机模型评价能力最强,预测集相关系数Rp=0.9958,预测集均方根误差eRMSEP=0.0057。说明太赫兹技术结合化学计量学方法可以用于定量检测玉米粉中苯甲酸的含量。

English Abstract

    • 苯甲酸(C6H5COOH)又叫安息香酸,是一种很重要的化工原料,在食品工业、化学工业以及医药等领域有十分广泛应用[1]。在食品工业领域经常作为防腐剂使用,在抑制菌类生长方面具有很突出的作用[2]。所以在食品工业中常用作食品添加剂使用,但是人体摄入过量的苯甲酸则会产生一定的毒性,轻者会引起流口水、心跳加快和记忆力衰退等症状, 严重者可能会致癌或发生再生障碍性贫血[3]等病症。因此,控制苯甲酸的使用量有很大的实际意义,找到一种能够快速、有效地检测苯甲酸含量的方法很有必要。

      目前检测苯甲酸含量的方法主要有3种:色谱法、电泳法和紫外分光光度法。高效液相色谱法是使用比较多的方法,具有检测结果准确的优点,但是这种方法存在投入大、操作难度高的特点[4]。HSU等人利用在线动态pH值扫描毛细管电泳法测定食品中苯甲酸和山梨酸[5],它的优点是检测速度快、稳定性高和准确度高,但是对检测设备投入很高, 且人员操作难度很大[6]。紫外分光光度法成本比较低,分析的灵敏度也高,但是检测准确性很差[7]

      太赫兹光谱法作为一种新的光谱分析方法,在近十几年里受到了越来越多人的关注。与红外光谱相比,太赫兹时域光谱(terahertz time-domain spectroscopy,THz-TDS)技术具有对环境热辐射不敏感、光源稳定等特点。此外,由于太赫兹波长较长,散射效应较弱,THz-TDS技术采用相干测量技术,可以同时提供电场的幅值和相位信息,更方便地得到样品的吸收系数、折射率谱或复介电常数谱。因此,THz-TDS被广泛应用于化学、生物、医学、工业、安全监测等领域,对材料进行定性和定量的分析[8]。YIN等人利用太赫兹技术结合偏最小二乘法(partial least square,PLS)和支持向量回归算法, 建立橡胶中的添加剂瓦斯炭黑的定量分析模型,结果表明, 利用太赫兹技术结合支持向量回归算法能够得到较好模型,得到预测集相关系数Rp=0.998,预测集均方根误差(root mean square error of prediction,RMSEP)eRMSEP=2.098%[9]。FANG等人利用太赫兹光谱技术检测小麦中偶氮甲酰胺的含量,利用最小二乘法建立数学模型,预测集相关系数达到了0.999,预测集均方根误差eRMSEP=0.06%[10]。LIU等人利用太赫兹技术结合偏最小二乘法检测葛粉中苯甲酸含量,得到预测集相关系数Rp=0.975,预测集均方根误差eRMSEP=1.126%[11],但是在建模方法上单一,不能说明PLS建模得到效果最好。

      本文中利用太赫兹时域光谱技术对玉米粉中的苯甲酸含量进行定量检测,通过太赫兹时域光系统获得玉米粉和苯甲酸混合物的太赫兹吸收光谱。根据太赫兹波的特点对样品进行定量分析,采用偏最小二乘法、最小二乘支持向量机(least squares support vector machine,LS-SVM)和多元线性回归(multiple linear regre-ssion,MLR)等3种建模方法建立苯甲酸质量分数的数学模型,比较这3种模型,得到苯甲酸质量分数分析的最优模型。为快速、无损地检测检测苯甲酸含量提供了方法。

    • 实验中所用的THz-TDS系统由日本Advantest公司研制,系统使用两个超短脉冲激光器(1.55μm)做偏置输出(太赫兹波产生)和信号输入(太赫兹波探测)。飞秒激光脉冲输出功率为20mW,中心波长为1550nm,宽度为50fs,重复频率为50MHz。太赫兹波对水分比较敏感,为了减少实验误差,将太赫兹电磁辐射通过的光路封闭在氮气箱内,在实验过程中,湿度保持在4%的恒定值。

    • 实验中所使用苯甲酸的纯度大于99%,购自阿拉丁试剂网。所有样品均在40℃的温度下烘干1h以去除水分。本文中将苯甲酸按0~0.200的质量分数与玉米粉混合用于光谱分析,制备了33种不同质量分数的苯甲酸和玉米粉的混合物,每个质量分数制备4个样品,样本的质量分数组成如表 1所示。质量分数间隔0.005,一共132个样本。所有混合物都在混匀器上被均匀混合,然后用液压机在10MPa的压力下压1min,取出压片。压片的形状为圆形,直径13mm,厚度1mm左右。将这些样品密封在贴有标签的袋子里,最后利用太赫兹设备获得样本的太赫兹光谱信息。

      Table 1.  Mass fractions of 33 benzoic acid samples

      sample number mass fraction of benzoic acid
      1 0.005
      2 0.010
      3 0.015
      4 0.020
      5 0.025
      6 0.040
      7 0.045
      8 0.050
      9 0.060
      10 0.070
      11 0.075
      12 0.080
      13 0.085
      14 0.090
      15 0.100
      16 0.110
      17 0.120
      18 0.125
      19 0.130
      20 0.135
      21 0.140
      22 0.145
      23 0.150
      24 0.155
      25 0.160
      26 0.165
      27 0.170
      28 0.175
      29 0.180
      30 0.185
      31 0.190
      32 0.195
      33 0.200
    • 所有测量均采用日本爱德万公司生产的太赫兹系统进行。实验记录参考太赫兹信号Eref(t)和样本的太赫兹时域信号Esam(t),利用快速傅里叶变换(fast Fourier transform,FFT)算法可以得到光谱。根据菲涅耳公式,大多数低损耗材料的THz振幅透射率可以表示为:

      $ \begin{array}{c} T(\omega ) = \frac{{{E_{\rm sam}}(\omega )}}{{{E_{\rm ref}}(\omega )}} = A{\rm \exp} ( - {\rm i}\varphi ) \approx \\ \frac{{4n}}{{{{(1 + n)}^2}}}{\rm \exp} \left[ {\frac{{{\rm i}\omega (N - 1)d}}{c}} \right] \end{array} $

      (1)

      式中, Eref(ω)和Esam(ω)分别为参考信号和样本信号的THz脉冲; Aφ分别为基准信号和样本信号的幅值比和相位差,n为样本折射率,N=n+ik为样品的复折射率,k为消光系数;d为样片厚度,是角频率,c是真空中的光速。由(1)式得到相对折射率n(ω)和相对吸收系数α(ω)。

      $ n(\omega ) = \frac{{\varphi (\omega )c}}{{\omega d}} + 1 $

      (2)

      $ \begin{array}{c} \alpha (\omega ) = \frac{{2k(\omega )\omega }}{c} = \frac{2}{d} = \\ {\rm \ln} \frac{{4n(\omega )}}{{A(\varphi ){{[n(\omega ) + 1]}^2}}} \end{array} $

      (3)
    • 采用PLS, LS-SVM和MLR 3种建模方法进行建模分析。将132个样本按3:1随机分为校正组和预测组,其中校正组样本99个,预测组样本33个。PLS是常用的多元线性回归方法之一,PLS从光谱数据中提取正交特征,建立特征与目标变量之间的相关性[12]。本文中采用PLS建立了苯甲酸样品吸收系数与频率的关系,用于苯甲酸样品的定量分析。

      LS-SVM是在统计学习理论的基础上发展起来的一种新的模式识别方法[13]。基于支持向量回归理论,建立了苯甲酸质量分数的支持向量机预测模型,确定惩罚因子和核参量是支持向量机模型的关键[14]。采用交叉验证法选择支持向量机的惩罚因子和核参量。图 1是支持向量机预测模型流程图。采用交叉验证法选择模型的最佳参量[8]

      Figure 1.  Flow chart of LSSVM regression prediction model

      使用多元线性回归的前提是自变量之间必须是相互独立的,但是采集的光谱变量之间在一定程度上都会有某种程度的相关关系,出现统计学意义上的多从共线的问题。在进行多元线性回归方法建模前,需要减小数据的多重线性关系,而减小这种关系最常用的方法是对数据进行降维,提取数据的主要特征,本文中通过连续投影算法(successive projections algorithm,SPA)对数据进行线性特征提取,然后将提取的特征作为输入,利用多元线性回归建立数学模型[15]

      利用标定集对模型进行了交叉验证均方根误差(root mean square error of cross valibration,RMSECV)优化,并根据预测集均方根误差eRMSEP、预测集相关系数Rp、校正集相关系数Rc和校正集均方根误差(root mean square error of calibration,RMSEC)eRMSEC 4个方面对模型的性能进行了评价。均方根误差(root mean square error,RMSE)eRMSE和相关系数R定义如下:

      $ {e_{\rm RMSE}} = \sqrt {\frac{{\sum\limits_{i = 1}^m {{{({y_{{\rm p},i}} - {y_{{\rm r},i}})}^2}} }}{{m - 1}}} $

      (4)

      $ R = \frac{{\sum\limits_{i = 1}^m {({y_{{\rm r},i}} - {{\overline y }_{\rm r}})({y_{{\rm p},i}} - {{\overline y }_{\rm p}})} }}{{\sqrt {\sum\limits_{i = 1}^m {{{({y_{{\rm r},i}} - {{\overline y }_{\rm r}})}^2}} } \sqrt {\sum\limits_{i = 1}^m {{{({y_{{\rm p},i}} - {{\overline y }_{\rm p}})}^2}} } }} $

      (5)

      式中,yp, i是第i个样本的预测质量分数,yr, i是第i个样本的标称质量分数。yryp分别代表所有样本标称和预测值的平均值,m表示参与计算样品数。

    • 图 2a是纯苯甲酸太赫兹光谱图。从图中可以得知, 苯甲酸的吸收峰位置在1.98THz处,苯甲酸的太赫兹吸收只在1.98THz前后比玉米粉的吸收强,因此这个峰值可以作为苯甲酸定量检测的指纹特征。图 2b中是苯甲酸混合物样品在0.5THz~3THz之间的太赫兹吸收光谱,样品太赫兹吸收强度近似地随频率的变大而增强,随着苯甲酸的质量分数增加, 在1.98THz处出现吸收峰。光谱中除了有自身的化学信息外,还存在很多其它跟样品的无关信息[16],比如说电噪声和杂散光等,以及固体颗粒的大小、表面散射等对光透射的影响,在建模前对光谱数据进行预处理,可以有效地消除这些无关信息带来的影响,本实验中共采用了5种预处理方法分别处理数据,移动平均平滑算法、标准正态变换、多元散射校正和基线校正等对光谱数据进行预处理。

      Figure 2.  Terahertz time domain spectrogram

    • 本文中按3:1随机划分建模集和预测集,其中建模集样品99个,预测集样品33个。采用移动平均平滑法、标准正态变换法(standard normal variate transformation,SNV)、多元散射校正(multiplicative scatter correction,MSC)、基线校正和归一化等预处理方法,然后用偏最小二乘法进行建模,表 2是利用偏最小二乘法建模得到的模型结果。结果显示,采用移动平均平滑算法对光谱进行预处理得到的效果稍微好些,其它4种预处理方法处理后建模结果反而比用原始光谱数据进行建模得到的模型结果更差。其中采用移动平均平滑算法,窗口数为5时效果最佳,其Rp=0.98151,eRMSEP=0.01125,表 2中是偏最小二乘法模型预测结果。

      Table 2.  PLS model results of different pretreatment methods

      preprocessing methods PLS
      principal component Rc eRMSEC Rp eRMSEP
      original 7 0.98602 0.01006 0.98095 0.01152
      moving average smoothing size 3 7 0.98655 0.01005 0.98107 0.01143
      size 5 7 0.98611 0.01002 0.98151 0.01125
      SNV 5 0.97942 0.01671 0.97219 0.01402
      MSC 5 0.97897 0.01231 0.96902 0.01426
      baseline 7 0.98145 0.01156 0.98149 0.01186
      normalization 5 0.97796 0.01218 0.96475 0.01515

      在光谱分析过程中,其PLS主因子数的选择和模型的实际预测能力直接相关,选取的主因子数过少,则会很难充分地表达测试样品的光谱信息,选取的主因子数过多的,则会加入过多的噪声,直接影响模型的预测能力。图 3是PLS的均方根误差随主成分因子数变化图。从图中可以看出,在主成分因子数小于3的时候出现了过拟合现象,但主成分因子数为7时,校正集均方根误差趋于稳定,预测集均方根误差略微有点上升。因此, 选择主因子数为7时作为最佳主成分数。图 4是随着频率变化的回归系数变化的图。图中反应的是不同频率对模型的影响大小。回归系数越大,对模型的影响越大,从图中可以看出在1.98THz处有最大的回归系数,这个位置正好也是苯甲酸的太赫兹特征峰位置,说明苯甲酸含量对模型影响很大。

      Figure 3.  RMSE varies with principal component factor 0f PLS

      Figure 4.  Regression coefficients

      图 5为经过移动平均平滑法,窗口数为5时的PLS苯甲酸质量分数预测模型的散点图。Rc=0.98611,eRESEC=0.01002,Rp=0.98151,eRMSEP=0.01125。

      Figure 5.  Scatters plots of calibration and prediction results of Benzoic acid content by PLS

    • 为了得到较好的数学模型,本文中还采用了最小二乘支持向量机对玉米粉中苯甲酸质量分数建立建模,LS-SVM模型的精度主要有3个因素确定,分别是输入变量、核函数的类型和核函数的参量。采用原始光谱和移动平均平滑法预处理过的数据作为输入,其中移动平均平滑法的窗口数为5。考察LS-SVM的预测能力,主要从两种核函数出发,用线性核函数和径向基(radial basis function,RBF)核函数两种类型的核函数分别建立数学模型,γσ2是径向基核函数主要考虑的两个参量,而线性核函数主要考虑1个参量γ, 其模型的结果如表 3所示,t是运算时间[17-18]。从表中可以看出, 不管是否进行预处理,采用径向基核函数比采用线性核函数的效果好,在都使用核函数的情况下,使用原始光谱所建的苯甲酸质量分数模型在γ=1980.3968,σ2=51.8468时模型最好,此时Rp=0.9958,eRMSEP=0.0057。

      Table 3.  LS-SVM model prediction results

      input data kernel function Rp eRMSEP
      type parameter t/s
      original spectrum linear kernel γ=2.4123 0.0468 0.9850 0.0104
      RBF kernel γ=1980.3968, σ2=51.8468 0.0468 0.9958 0.0057
      moving average smoothing size 5 linear kernel γ =2.7239 0.0468 0.9844 0.0106
      RBF kernel γ=192721.9293, σ2=852.7071 0.0312 0.9917 0.0082

      图 6是最小二乘支持向量机苯甲酸质量分数预测模型的散点图。图 6a是原始数据苯甲酸质量分数预测模型散点图,图 6b是经过预处理后的苯甲酸质量分数预测模型散点图。其中原始数据在径向基核函数下得到Rp=0.9958, eRMSEP=0.0057,选择线性核函数时,Rp=0.9850, eRMSEP=0.0104;经过预处理后的数据在径向基核函数下得到Rp=0.9917, eRMSEP=0.0082,选择线性核函数时,Rp=0.9844, eRMSEP=0.0106。

      Figure 6.  Scatters plots of calibration and prediction results of Benzoic acid content by LS-SVM

    • 连续投影算法(SPA)是一种选择变量的算法,在选择过程中从某一个波长变量开始,而接下来的循环则计算没有被选择过波长变量上的投影[14]。选择投影向量中最大的波长点,每一次新选入的波长点和之前选入的波长点之间线性相关最小。本文中通过SPA选取原始光谱中的特征波长点,利用SPA从360个波长点中选取了27个主要特征波长点。然后将这27个特征波长点用MLR进行建模。图 7是利用SPA结合多元线性回归算法建模得到的玉米粉中苯甲酸质量分数预测模型散点图。其中Rc=0.9897,eRMSEC=0.0085, Rp=0.9896, eRMSEP=0.0090。

      Figure 7.  Scatters plots of calibration and prediction results of Benzoic acid content by SPA-MLR

    • 本文中采用PLS, LS-SVM和SPA-MLR等方法建立模型,建模前进行预处理,由结果可知, 采用移动平均平滑算法、窗口数为5时,效果最佳,其Rp=0.98151,eRMSEP=0.01125,利用LS-SVM建模分别从径向和线性核函数出发,结果表明, 对原始光谱,在径向核函数下得到的模型最佳,得到Rp=0.9958,eRMSEP=0.0057;最后还利用了多元线性回归进行建模,在建模前为了使变量之间的相关性最小,利用SPA挑选了27个特征波长变量,然后利用这些特征波长变量建立模型,其得到的结果为Rp=0.9896,eRMSEP=0.0090。对比这3种建模方法,LS-SVM建模得到最优模型,Rp最大,误差最小,偏最小二乘法模型结果相对来说最差。

    • 采用THz-TDS法定量分析了玉米粉基质中的苯甲酸含量,利用太赫兹时域光谱技术对玉米粉和苯甲酸混合物在0.5THz~3THz的频率范围进行建模分析,利用PLS, LS-SVM和SPA-MLR对样品质量分数进行定量分析。实验结果表明,利用LS-SVM进行建模得到最好的预测结果,以eRMSEP=0.0057,Rp=0.9985,得到玉米粉中苯甲酸质量分数测定的最优LS-SVM模型。本文中通过THz-TDS与化学计量学结合,证明了定量检测玉米粉基质中苯甲酸的可能性,说明THz-TDS可以作为检测玉米粉中苯甲酸含量的工具。为了更进一步,可以用所用的方法扩展到预测其它物质混合物中各种成分的质量分数。

      根据我国《食品添加剂使用卫生标准》(GB2760-2014)规定,苯甲酸作为防腐剂使用时,最大用量为0.2g/kg,该实验在高质量分数下达到了很好的效果,但在低质量分数效果很差,目前受实验设备光源功率的限制,在国标以下很难检测出来,所以本实验为探索性实验,探索太赫兹检测苯甲酸的可能性。本实验对玉米粉中苯甲酸质量分数为0~0.200做了研究,得到了很好的结果。目前飞秒激光器的功率通过放大技术已获得了很大的提高,但噪声也会同时增加。因此,需要太赫兹时域光谱系统信噪比的进一步提高,以及测量装置灵敏度的提高相结合,这样国家标准以下的检测有可能得以实现。

参考文献 (18)

目录

    /

    返回文章
    返回