Advanced Search

ISSN1001-3806 CN51-1125/TN Map

Volume 44 Issue 4
Jul.  2020
Article Contents
Turn off MathJax

Citation:

Quantitative detection of benzoic acid in corn flour by terahertz spectroscopy

  • Received Date: 2019-08-29
    Accepted Date: 2019-09-19
  • In order to detect the content of benzoic acid in corn flour, control the amount of benzoic acid used in corn flour to improve food safety grade, the content of benzoic acid in corn flour was studied using terahertz spectroscopy technology, and the terahertz benzoic acid spectral data of different mass fractions in corn flour was obtained. In order to improve the accuracy of the model, pre-processing methods such as moving average smoothing algorithm, standard normal transformation, multi-scattering correction, baseline correction, and normalization were used to eliminate the original spectral noise and useless information. The least squares support vector machine(LS-SVM), partial least squares(PLS), and multiple linear regression(MLR) spectroscopy models were constructed, and the model samples were not used for model evaluation. The model was evaluated based on the prediction set correlation coefficient eRMSEP and the prediction set root mean square error Rp. The results show that the least squares support vector machine model with the original terahertz time-domain spectral preprocessing has the strongest evaluation ability. The correlation coefficient of the prediction set Rp=0.9958, and the root mean square error of the prediction(RMSEP) set eRMSEP=0.0057, indicating the metrology method of THz-TDS binding chemistry can be used to detect the quantitative determination of benzoic acid in corn flour.
  • 加载中
  • [1]

    WANG N, XIE H, HAN P Zh, et al. Green synthesis of benzoic acid[J]. Chemical Engineer, 2017, 34(2): 69-71(in Chinese).
    [2]

    LIU C C, WANG Y N, FU L M, et al. Microfluidic paper-based chip platform for benzoic acid detection in food[J]. Food Chemistry, 2018, 249:162-167. doi: 10.1016/j.foodchem.2018.01.004
    [3]

    XIE G Z, ZHANG Q. 2013's food preservative applications and trends research[J]. Food Research and Development, 2013, 34(11): 112-116(in Chinese).
    [4]

    LI X S, XU L D, HU X Zh, et al. Determination of benzoic acid and sorbic acid in sauce samples by molecular complex-based dispersive liquid-liquid microextraction coupled to high performance liquid chromatography[J]. Journal of Analytical Science, 2013, 29(3): 297-301(in Chinese). doi: 10.2116/analsci.29.297
    [5]

    HSU S H, HU C C, CHIU T C. Online dynamic pH junction-sweeping for the determination of benzoic and sorbic acids in food products by capillary electrophoresis.[J]. Analytical and bioanalytical Chemistry, 2013, 406(2): 635-641.
    [6]

    BI S Y, ZHU H, XIE B H, et al. Research progress on determination of benzoic acid in food safety[J]. Journal of Anhui Agricultural Sciences, 2017, 45(15): 100-103(in Chinese).
    [7]

    ZEN Q H. Rapid analysis of benzoic acid and sorbic acid in the acidic food by UV-photometric analysis[J]. Journal of Zunyi Normal Co-llege, 2004, 6(4):59-60(in Chinese).
    [8]

    CAO B H, LI H, WANG W, et al.Determination of pesticides in a flour substrate by chemometric methods using terahertz spectroscopy[J]. Analytical Methods, 2018, 10(42): 5097-5104. doi: 10.1039/C8AY01728J
    [9]

    YIN X H, WANG Q, MO W, et al. A quantitative analysis method for GCB as rubber additive by terahertz spectroscopy[J]. Spectroscopy and Spectral Analysis, 2018, 38(11): 3385-3389(in Chinese).
    [10]

    FANG H X, ZHANG Q, ZHNAG H L, et al. Detection of azodicarbonamide in flour based on terahertz time-domain spectroscopy[J]. Journal of the Chinese Cereals and Oils Association, 2016, 31(1): 107-111(in Chinese).
    [11]

    LIU Y D, DU X Y, LI B, et al. Detection of benzoic acid in arrowroot by terahertz technology[J].Laser & Optoelectronics Progress, 2019, 56(4):041101(in Chinese).
    [12]

    LIU Y D, XU H, SUN X D, et al. Non-destructive measurement of tomato maturity by near-infrared diffuse transmission spectroscopy[J]. Laser Technology, 2019, 43(1): 25-29(in Chinese).
    [13]

    SUN Zh H. Study on support vector machine and ins application in control[D].Hangzhou: Zhejiang University, 2003: 10-15(in Ch-inese).
    [14]

    XIE Y. Icing forecast of power lines based on support vector machine[D]. Chengdu: Xihua University, 2016: 31-55(in Chinese).
    [15]

    CHU X L. molecular spectroscopy analytical technology combined with chemometrics and its applications[M]. Beijing: Chemical Industry Press, 2011: 31-57(in Chinese).
    [16]

    MENG Q L, ZHANG Y, SHANG J. Nondestructive detection of apple defect combining optical fiber spectra with pattern recognition[J]. Laser Technology, 2019, 43(5): 676-680(in Chinese).
    [17]

    LIU Y D, XIAO H Ch, DENG Q, et al.Nondestructive detection of citrus greening by near infrared spectroscopy[J]. Transactions of the Chinese Society of Agricultural Engineering, 2016, 32(14): 202-208(in Chinese).
    [18]

    LI J T, LU C P, SHA W. Quantitative analysis of phosphorus in compound fertilizer by laser induced breakdown spectroscopy[J]. Laser Technology, 2019, 43(5): 601-607(in Chinese).
  • 加载中
通讯作者: 陈斌, bchen63@163.com
  • 1. 

    沈阳化工大学材料科学与工程学院 沈阳 110142

  1. 本站搜索
  2. 百度学术搜索
  3. 万方数据库搜索
  4. CNKI搜索

Figures(7) / Tables(3)

Article views(6836) PDF downloads(19) Cited by()

Proportional views

Quantitative detection of benzoic acid in corn flour by terahertz spectroscopy

  • 1. National and Local Joint Engineering Research Center of Fruit Intelligent Photoelectric Detection Technology and Equipment, School of Mechatronics & Vehicle Engineering, East China Jiaotong University, Nanchang 330013, China
  • 2. Jiangxi Lianchuang Hongsheng Electronics Co.Ltd., Nanchang 330096, China

Abstract: In order to detect the content of benzoic acid in corn flour, control the amount of benzoic acid used in corn flour to improve food safety grade, the content of benzoic acid in corn flour was studied using terahertz spectroscopy technology, and the terahertz benzoic acid spectral data of different mass fractions in corn flour was obtained. In order to improve the accuracy of the model, pre-processing methods such as moving average smoothing algorithm, standard normal transformation, multi-scattering correction, baseline correction, and normalization were used to eliminate the original spectral noise and useless information. The least squares support vector machine(LS-SVM), partial least squares(PLS), and multiple linear regression(MLR) spectroscopy models were constructed, and the model samples were not used for model evaluation. The model was evaluated based on the prediction set correlation coefficient eRMSEP and the prediction set root mean square error Rp. The results show that the least squares support vector machine model with the original terahertz time-domain spectral preprocessing has the strongest evaluation ability. The correlation coefficient of the prediction set Rp=0.9958, and the root mean square error of the prediction(RMSEP) set eRMSEP=0.0057, indicating the metrology method of THz-TDS binding chemistry can be used to detect the quantitative determination of benzoic acid in corn flour.

引 言
  • 苯甲酸(C6H5COOH)又叫安息香酸,是一种很重要的化工原料,在食品工业、化学工业以及医药等领域有十分广泛应用[1]。在食品工业领域经常作为防腐剂使用,在抑制菌类生长方面具有很突出的作用[2]。所以在食品工业中常用作食品添加剂使用,但是人体摄入过量的苯甲酸则会产生一定的毒性,轻者会引起流口水、心跳加快和记忆力衰退等症状, 严重者可能会致癌或发生再生障碍性贫血[3]等病症。因此,控制苯甲酸的使用量有很大的实际意义,找到一种能够快速、有效地检测苯甲酸含量的方法很有必要。

    目前检测苯甲酸含量的方法主要有3种:色谱法、电泳法和紫外分光光度法。高效液相色谱法是使用比较多的方法,具有检测结果准确的优点,但是这种方法存在投入大、操作难度高的特点[4]。HSU等人利用在线动态pH值扫描毛细管电泳法测定食品中苯甲酸和山梨酸[5],它的优点是检测速度快、稳定性高和准确度高,但是对检测设备投入很高, 且人员操作难度很大[6]。紫外分光光度法成本比较低,分析的灵敏度也高,但是检测准确性很差[7]

    太赫兹光谱法作为一种新的光谱分析方法,在近十几年里受到了越来越多人的关注。与红外光谱相比,太赫兹时域光谱(terahertz time-domain spectroscopy,THz-TDS)技术具有对环境热辐射不敏感、光源稳定等特点。此外,由于太赫兹波长较长,散射效应较弱,THz-TDS技术采用相干测量技术,可以同时提供电场的幅值和相位信息,更方便地得到样品的吸收系数、折射率谱或复介电常数谱。因此,THz-TDS被广泛应用于化学、生物、医学、工业、安全监测等领域,对材料进行定性和定量的分析[8]。YIN等人利用太赫兹技术结合偏最小二乘法(partial least square,PLS)和支持向量回归算法, 建立橡胶中的添加剂瓦斯炭黑的定量分析模型,结果表明, 利用太赫兹技术结合支持向量回归算法能够得到较好模型,得到预测集相关系数Rp=0.998,预测集均方根误差(root mean square error of prediction,RMSEP)eRMSEP=2.098%[9]。FANG等人利用太赫兹光谱技术检测小麦中偶氮甲酰胺的含量,利用最小二乘法建立数学模型,预测集相关系数达到了0.999,预测集均方根误差eRMSEP=0.06%[10]。LIU等人利用太赫兹技术结合偏最小二乘法检测葛粉中苯甲酸含量,得到预测集相关系数Rp=0.975,预测集均方根误差eRMSEP=1.126%[11],但是在建模方法上单一,不能说明PLS建模得到效果最好。

    本文中利用太赫兹时域光谱技术对玉米粉中的苯甲酸含量进行定量检测,通过太赫兹时域光系统获得玉米粉和苯甲酸混合物的太赫兹吸收光谱。根据太赫兹波的特点对样品进行定量分析,采用偏最小二乘法、最小二乘支持向量机(least squares support vector machine,LS-SVM)和多元线性回归(multiple linear regre-ssion,MLR)等3种建模方法建立苯甲酸质量分数的数学模型,比较这3种模型,得到苯甲酸质量分数分析的最优模型。为快速、无损地检测检测苯甲酸含量提供了方法。

1.   实 验
  • 实验中所用的THz-TDS系统由日本Advantest公司研制,系统使用两个超短脉冲激光器(1.55μm)做偏置输出(太赫兹波产生)和信号输入(太赫兹波探测)。飞秒激光脉冲输出功率为20mW,中心波长为1550nm,宽度为50fs,重复频率为50MHz。太赫兹波对水分比较敏感,为了减少实验误差,将太赫兹电磁辐射通过的光路封闭在氮气箱内,在实验过程中,湿度保持在4%的恒定值。

  • 实验中所使用苯甲酸的纯度大于99%,购自阿拉丁试剂网。所有样品均在40℃的温度下烘干1h以去除水分。本文中将苯甲酸按0~0.200的质量分数与玉米粉混合用于光谱分析,制备了33种不同质量分数的苯甲酸和玉米粉的混合物,每个质量分数制备4个样品,样本的质量分数组成如表 1所示。质量分数间隔0.005,一共132个样本。所有混合物都在混匀器上被均匀混合,然后用液压机在10MPa的压力下压1min,取出压片。压片的形状为圆形,直径13mm,厚度1mm左右。将这些样品密封在贴有标签的袋子里,最后利用太赫兹设备获得样本的太赫兹光谱信息。

    sample number mass fraction of benzoic acid
    1 0.005
    2 0.010
    3 0.015
    4 0.020
    5 0.025
    6 0.040
    7 0.045
    8 0.050
    9 0.060
    10 0.070
    11 0.075
    12 0.080
    13 0.085
    14 0.090
    15 0.100
    16 0.110
    17 0.120
    18 0.125
    19 0.130
    20 0.135
    21 0.140
    22 0.145
    23 0.150
    24 0.155
    25 0.160
    26 0.165
    27 0.170
    28 0.175
    29 0.180
    30 0.185
    31 0.190
    32 0.195
    33 0.200

    Table 1.  Mass fractions of 33 benzoic acid samples

  • 所有测量均采用日本爱德万公司生产的太赫兹系统进行。实验记录参考太赫兹信号Eref(t)和样本的太赫兹时域信号Esam(t),利用快速傅里叶变换(fast Fourier transform,FFT)算法可以得到光谱。根据菲涅耳公式,大多数低损耗材料的THz振幅透射率可以表示为:

    式中, Eref(ω)和Esam(ω)分别为参考信号和样本信号的THz脉冲; Aφ分别为基准信号和样本信号的幅值比和相位差,n为样本折射率,N=n+ik为样品的复折射率,k为消光系数;d为样片厚度,是角频率,c是真空中的光速。由(1)式得到相对折射率n(ω)和相对吸收系数α(ω)。

  • 采用PLS, LS-SVM和MLR 3种建模方法进行建模分析。将132个样本按3:1随机分为校正组和预测组,其中校正组样本99个,预测组样本33个。PLS是常用的多元线性回归方法之一,PLS从光谱数据中提取正交特征,建立特征与目标变量之间的相关性[12]。本文中采用PLS建立了苯甲酸样品吸收系数与频率的关系,用于苯甲酸样品的定量分析。

    LS-SVM是在统计学习理论的基础上发展起来的一种新的模式识别方法[13]。基于支持向量回归理论,建立了苯甲酸质量分数的支持向量机预测模型,确定惩罚因子和核参量是支持向量机模型的关键[14]。采用交叉验证法选择支持向量机的惩罚因子和核参量。图 1是支持向量机预测模型流程图。采用交叉验证法选择模型的最佳参量[8]

    Figure 1.  Flow chart of LSSVM regression prediction model

    使用多元线性回归的前提是自变量之间必须是相互独立的,但是采集的光谱变量之间在一定程度上都会有某种程度的相关关系,出现统计学意义上的多从共线的问题。在进行多元线性回归方法建模前,需要减小数据的多重线性关系,而减小这种关系最常用的方法是对数据进行降维,提取数据的主要特征,本文中通过连续投影算法(successive projections algorithm,SPA)对数据进行线性特征提取,然后将提取的特征作为输入,利用多元线性回归建立数学模型[15]

    利用标定集对模型进行了交叉验证均方根误差(root mean square error of cross valibration,RMSECV)优化,并根据预测集均方根误差eRMSEP、预测集相关系数Rp、校正集相关系数Rc和校正集均方根误差(root mean square error of calibration,RMSEC)eRMSEC 4个方面对模型的性能进行了评价。均方根误差(root mean square error,RMSE)eRMSE和相关系数R定义如下:

    式中,yp, i是第i个样本的预测质量分数,yr, i是第i个样本的标称质量分数。yryp分别代表所有样本标称和预测值的平均值,m表示参与计算样品数。

2.   结果与讨论
  • 图 2a是纯苯甲酸太赫兹光谱图。从图中可以得知, 苯甲酸的吸收峰位置在1.98THz处,苯甲酸的太赫兹吸收只在1.98THz前后比玉米粉的吸收强,因此这个峰值可以作为苯甲酸定量检测的指纹特征。图 2b中是苯甲酸混合物样品在0.5THz~3THz之间的太赫兹吸收光谱,样品太赫兹吸收强度近似地随频率的变大而增强,随着苯甲酸的质量分数增加, 在1.98THz处出现吸收峰。光谱中除了有自身的化学信息外,还存在很多其它跟样品的无关信息[16],比如说电噪声和杂散光等,以及固体颗粒的大小、表面散射等对光透射的影响,在建模前对光谱数据进行预处理,可以有效地消除这些无关信息带来的影响,本实验中共采用了5种预处理方法分别处理数据,移动平均平滑算法、标准正态变换、多元散射校正和基线校正等对光谱数据进行预处理。

    Figure 2.  Terahertz time domain spectrogram

  • 本文中按3:1随机划分建模集和预测集,其中建模集样品99个,预测集样品33个。采用移动平均平滑法、标准正态变换法(standard normal variate transformation,SNV)、多元散射校正(multiplicative scatter correction,MSC)、基线校正和归一化等预处理方法,然后用偏最小二乘法进行建模,表 2是利用偏最小二乘法建模得到的模型结果。结果显示,采用移动平均平滑算法对光谱进行预处理得到的效果稍微好些,其它4种预处理方法处理后建模结果反而比用原始光谱数据进行建模得到的模型结果更差。其中采用移动平均平滑算法,窗口数为5时效果最佳,其Rp=0.98151,eRMSEP=0.01125,表 2中是偏最小二乘法模型预测结果。

    preprocessing methods PLS
    principal component Rc eRMSEC Rp eRMSEP
    original 7 0.98602 0.01006 0.98095 0.01152
    moving average smoothing size 3 7 0.98655 0.01005 0.98107 0.01143
    size 5 7 0.98611 0.01002 0.98151 0.01125
    SNV 5 0.97942 0.01671 0.97219 0.01402
    MSC 5 0.97897 0.01231 0.96902 0.01426
    baseline 7 0.98145 0.01156 0.98149 0.01186
    normalization 5 0.97796 0.01218 0.96475 0.01515

    Table 2.  PLS model results of different pretreatment methods

    在光谱分析过程中,其PLS主因子数的选择和模型的实际预测能力直接相关,选取的主因子数过少,则会很难充分地表达测试样品的光谱信息,选取的主因子数过多的,则会加入过多的噪声,直接影响模型的预测能力。图 3是PLS的均方根误差随主成分因子数变化图。从图中可以看出,在主成分因子数小于3的时候出现了过拟合现象,但主成分因子数为7时,校正集均方根误差趋于稳定,预测集均方根误差略微有点上升。因此, 选择主因子数为7时作为最佳主成分数。图 4是随着频率变化的回归系数变化的图。图中反应的是不同频率对模型的影响大小。回归系数越大,对模型的影响越大,从图中可以看出在1.98THz处有最大的回归系数,这个位置正好也是苯甲酸的太赫兹特征峰位置,说明苯甲酸含量对模型影响很大。

    Figure 3.  RMSE varies with principal component factor 0f PLS

    Figure 4.  Regression coefficients

    图 5为经过移动平均平滑法,窗口数为5时的PLS苯甲酸质量分数预测模型的散点图。Rc=0.98611,eRESEC=0.01002,Rp=0.98151,eRMSEP=0.01125。

    Figure 5.  Scatters plots of calibration and prediction results of Benzoic acid content by PLS

  • 为了得到较好的数学模型,本文中还采用了最小二乘支持向量机对玉米粉中苯甲酸质量分数建立建模,LS-SVM模型的精度主要有3个因素确定,分别是输入变量、核函数的类型和核函数的参量。采用原始光谱和移动平均平滑法预处理过的数据作为输入,其中移动平均平滑法的窗口数为5。考察LS-SVM的预测能力,主要从两种核函数出发,用线性核函数和径向基(radial basis function,RBF)核函数两种类型的核函数分别建立数学模型,γσ2是径向基核函数主要考虑的两个参量,而线性核函数主要考虑1个参量γ, 其模型的结果如表 3所示,t是运算时间[17-18]。从表中可以看出, 不管是否进行预处理,采用径向基核函数比采用线性核函数的效果好,在都使用核函数的情况下,使用原始光谱所建的苯甲酸质量分数模型在γ=1980.3968,σ2=51.8468时模型最好,此时Rp=0.9958,eRMSEP=0.0057。

    input data kernel function Rp eRMSEP
    type parameter t/s
    original spectrum linear kernel γ=2.4123 0.0468 0.9850 0.0104
    RBF kernel γ=1980.3968, σ2=51.8468 0.0468 0.9958 0.0057
    moving average smoothing size 5 linear kernel γ =2.7239 0.0468 0.9844 0.0106
    RBF kernel γ=192721.9293, σ2=852.7071 0.0312 0.9917 0.0082

    Table 3.  LS-SVM model prediction results

    图 6是最小二乘支持向量机苯甲酸质量分数预测模型的散点图。图 6a是原始数据苯甲酸质量分数预测模型散点图,图 6b是经过预处理后的苯甲酸质量分数预测模型散点图。其中原始数据在径向基核函数下得到Rp=0.9958, eRMSEP=0.0057,选择线性核函数时,Rp=0.9850, eRMSEP=0.0104;经过预处理后的数据在径向基核函数下得到Rp=0.9917, eRMSEP=0.0082,选择线性核函数时,Rp=0.9844, eRMSEP=0.0106。

    Figure 6.  Scatters plots of calibration and prediction results of Benzoic acid content by LS-SVM

  • 连续投影算法(SPA)是一种选择变量的算法,在选择过程中从某一个波长变量开始,而接下来的循环则计算没有被选择过波长变量上的投影[14]。选择投影向量中最大的波长点,每一次新选入的波长点和之前选入的波长点之间线性相关最小。本文中通过SPA选取原始光谱中的特征波长点,利用SPA从360个波长点中选取了27个主要特征波长点。然后将这27个特征波长点用MLR进行建模。图 7是利用SPA结合多元线性回归算法建模得到的玉米粉中苯甲酸质量分数预测模型散点图。其中Rc=0.9897,eRMSEC=0.0085, Rp=0.9896, eRMSEP=0.0090。

    Figure 7.  Scatters plots of calibration and prediction results of Benzoic acid content by SPA-MLR

  • 本文中采用PLS, LS-SVM和SPA-MLR等方法建立模型,建模前进行预处理,由结果可知, 采用移动平均平滑算法、窗口数为5时,效果最佳,其Rp=0.98151,eRMSEP=0.01125,利用LS-SVM建模分别从径向和线性核函数出发,结果表明, 对原始光谱,在径向核函数下得到的模型最佳,得到Rp=0.9958,eRMSEP=0.0057;最后还利用了多元线性回归进行建模,在建模前为了使变量之间的相关性最小,利用SPA挑选了27个特征波长变量,然后利用这些特征波长变量建立模型,其得到的结果为Rp=0.9896,eRMSEP=0.0090。对比这3种建模方法,LS-SVM建模得到最优模型,Rp最大,误差最小,偏最小二乘法模型结果相对来说最差。

3.   结 论
  • 采用THz-TDS法定量分析了玉米粉基质中的苯甲酸含量,利用太赫兹时域光谱技术对玉米粉和苯甲酸混合物在0.5THz~3THz的频率范围进行建模分析,利用PLS, LS-SVM和SPA-MLR对样品质量分数进行定量分析。实验结果表明,利用LS-SVM进行建模得到最好的预测结果,以eRMSEP=0.0057,Rp=0.9985,得到玉米粉中苯甲酸质量分数测定的最优LS-SVM模型。本文中通过THz-TDS与化学计量学结合,证明了定量检测玉米粉基质中苯甲酸的可能性,说明THz-TDS可以作为检测玉米粉中苯甲酸含量的工具。为了更进一步,可以用所用的方法扩展到预测其它物质混合物中各种成分的质量分数。

    根据我国《食品添加剂使用卫生标准》(GB2760-2014)规定,苯甲酸作为防腐剂使用时,最大用量为0.2g/kg,该实验在高质量分数下达到了很好的效果,但在低质量分数效果很差,目前受实验设备光源功率的限制,在国标以下很难检测出来,所以本实验为探索性实验,探索太赫兹检测苯甲酸的可能性。本实验对玉米粉中苯甲酸质量分数为0~0.200做了研究,得到了很好的结果。目前飞秒激光器的功率通过放大技术已获得了很大的提高,但噪声也会同时增加。因此,需要太赫兹时域光谱系统信噪比的进一步提高,以及测量装置灵敏度的提高相结合,这样国家标准以下的检测有可能得以实现。

Reference (18)

Catalog

    /

    DownLoad:  Full-Size Img  PowerPoint
    Return
    Return