高级检索

ISSN1001-3806CN51-1125/TN 网站地图

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

随机抽样一致性算法在激光光谱中的应用研究

谢珊珊 王哲强 黄河 陈宝宝 汪培 李劲松

引用本文:
Citation:

随机抽样一致性算法在激光光谱中的应用研究

    作者简介: 谢珊珊(1995-), 女, 硕士研究生, 主要从事数字信号处理算法研究.
    通讯作者: 李劲松, jingsong_li@ahu.edu.cn
  • 基金项目:

    安徽大学创新训练计划资助项目 J18511120

    国家自然科学基金资助项目 61440010

    安徽省高等学校省级质量工程资助项目 2014tszy004

    安徽大学材料物理专业综合改革试点项目 2014zy007

  • 中图分类号: O433.1

Applications of random sample consistency algorithm on laser spectroscopy

    Corresponding author: LI Jingsong, jingsong_li@ahu.edu.cn
  • CLC number: O433.1

  • 摘要: 为了解决波长调制激光光谱技术探测大气痕量气体浓度中信号处理算法的不足,提出了一种基于随机抽样一致性算法的气体浓度反演算法。以大气甲醛分子的仿真信号和实际测量信号为例,进行了理论分析和实验研究,并与传统的最小二乘法相比较。结果表明,该算法具有较强的抗噪声和异常点干扰能力,尤其是在低信噪比的条件下,精确度可提高1个量级,体现出较高的可靠性和优越性。
  • Figure 1.  The flowchart of RANSAC algorithm

    Figure 2.  Fitness results of the same data sets by applying LSM and RANSAC

    Figure 3.  a~c—the simulated second harmonic signal of formaldehyde with noise level A=10, 20, 50, respectively e~f—the corresponding fitted results by using LSM and RANSAC algorithms, respectively

    Figure 4.  a—the experimentally measured second harmonic signal of formaldehyde with different concentrations b—the fitting results by using LSM and RANSAC algorithms, respectively

    Figure 5.  a—the experimentally measured second harmonic signal of formaldehyde with same concentration b—the corresponding fitted results by using LSM and RANSAC algorithm, respectively

    Table 1.  Fitting results of two harmonic signal of formaldehyde simulation with different SNR (adding Gaussian noise with different amplitude A to Y, while keeping X unchanged)

    experimental results R2 slope
    LSM RANSAC LSM RANSAC
    A=0(RSNR=∞) 1.0 1.0 2.0 2.0
    A=5(RSNR=8.87) 0.9833 0.9935 1.9845 2.0059
    A=10(RSNR=6.00) 0.9371 0.9831 2.0183 1.9997
    A=20(RSNR=3.54) 0.8045 0.9412 2.0252 2.0003
    A=50(RSNR=0.64) 0.2654 0.7482 1.6848 1.9083
    下载: 导出CSV

    Table 2.  Linear fitting results of formaldehyde spectra under different experimental conditions

    formaldehyde sample 1 sample 2
    LSM RANSAC LSM RANSAC
    actual ratio 1.20 1.20 1.0 1.0
    fitted value 1.1818 1.1818 0.5342 1.0272
    correlation coefficient R2 0.8923 0.9853 0.2111 0.9743
    error/% 1.517 -0.18 46.58 -2.72
    下载: 导出CSV
  • [1]

    PHILIPPE L C, HANSON R K. Laser diode wavelength-modulation spectroscopy for simultaneous measurement of temperature, pressure, and velocity in shock-heated oxygen flows[J]. Applied Optics, 1993, 32(30):6090-6103. doi: 10.1364/AO.32.006090
    [2]

    LI J S, YU B L, ZHAO W X, et al. A review of signal enhancement and noise reduction techniques for tunable diode laser absorption spectroscopy[J]. Applied Spectroscopy Reviews, 2014, 49(8):666-691. doi: 10.1080/05704928.2014.903376
    [3]

    REID J, LABRIE D. Second-Harmonic detection with tunable diode lasers-comparison of experiment and theory[J]. Applied Physics, 1981, B26(3):203-210. 
    [4]

    LI J, REIFFS A, PARCHATKA U, et al. In situ measurements of atmospheric CO and its correlation with NOx and O3 at a rural mountain site[J]. Metrology and Measurement Systems, 2015, 22(1):25-38. doi: 10.1515/mms-2015-0001
    [5]

    CAI Y, WU Sh Q, WU A, et al. Study on calculation method of detection limit based on wavelength modulation spectroscopy[J]. Laser Technology, 2012, 36(3):390-393(in Chinese). 
    [6]

    XU Y Z, GUO J Q, GAO X R, et al. Effect of temperature on absorption spectral lines of carbon monoxide[J]. Laser Technology, 2010, 34(6):778-780(in Chinese). 
    [7]

    PLACKETT R L. The discovery of the method of least squares[J]. Biometrika, 1972, 59(2):239-251. 
    [8]

    JIA X Y, XU C S, BAI X. The invention and way of thinking on least squares[J]. Joumal of Northwest University, 2006, 36(3):507-511(in Chinese). 
    [9]

    FISCHLER M A, BOLLES R C.Random sample consensus:a paradigm for model fitting with applications to image analysis and automated cartography[J]. Communications of the ACM, 1981, 24(6):381-395. doi: 10.1145/358669.358692
    [10]

    ZHOU C L, ZHU H H, LI X J. Research and application of robust plane fitting algorithm with RANSAC[J]. Computer Engineering and Applications, 2011, 47(7):177-179(in Chinese). 
    [11]

    CAO Y, FENG Y, YANG Y T, et al. Application of estimation algorithm based on RANSAC in road points cloud optimization[J]. Infrared and Laser Engineering, 2012, 41(11):3108-3112(in Chinese). 
    [12]

    WEI Y Z, LIU X L. Robust plane fitting of clouds based on RANSAC[J]. Journal of Beijing University of Technology, 2014, 40(3):400-403(in Chinese). 
    [13]

    ZHEN Y, LIU X J, WANG M Zh. An improved RANSAC of fundamental matrix estimation method[J]. Bulletin of Surveying and Mapping, 2014(4):39-43(in Chinese). 
    [14]

    ZHANG H M, ZHENG Z. An improvement of the adjacent probability random sampling consistency algorithm[J]. Laser Journal, 2013, 34(5):29-30(in Chinese). 
    [15]

    HAST A, NYSJÖ J, MARCHETTI A. Optimal RANSAC-towards a repeatable algorithm for finding the optimal set[J]. Journal of WSCG, 2013, 21(1):21-30.
    [16]

    LI J S, PARCHATKA U, FISCHER H. A formaldehyde trace gas sensor based on a thermoelectrically cooled CW-DFB quantum cascade laser[J]. Analytical Methods, 2014, 6(15):5483-5488. doi: 10.1039/C3AY41964A
    [17]

    LI J, PARCHATKA U, FISCHER H. Development of field-deployable real time QCL spectrometer for simultaneous detection of ambient N2O and CO[J]. Sensors and Actuators, 2013, B182(3):659-667. 
  • [1] 李世阳禹延光叶会英付广春 . 一种半导体激光自混合效应模型参数的测量方法. 激光技术, 2005, 29(5): 519-521.
    [2] 谈渊甘学辉张东剑刘香玉廖壑 . 基于小波去噪的激光多普勒振动信号处理. 激光技术, 2022, 46(1): 129-133. doi: 10.7510/jgjs.issn.1001-3806.2022.01.014
    [3] 王涛沈永辉姚建铨 . 基于小波阈值法的激光雷达回波信号去噪研究. 激光技术, 2019, 43(1): 63-68. doi: 10.7510/jgjs.issn.1001-3806.2019.01.013
    [4] 李海廷胡鑫曾双李少波周国家隋峻鲁强付培志 . 基于增益控制电路的响应不一致性校正方法. 激光技术, 2021, 45(1): 80-85. doi: 10.7510/jgjs.issn.1001-3806.2021.01.014
    [5] 鲍鸿曾海涛白玉磊胡忠向志聪周延周申作春 . 基于概率密度最小二乘拟合的叶片后缘轮廓. 激光技术, 2016, 40(4): 555-559. doi: 10.7510/jgjs.issn.1001-3806.2016.04.021
    [6] 王博刘晓东李君豪陈泰宇刘容麟 . 基于邻域特征的网点激光打孔定位算法研究. 激光技术, 2019, 43(5): 591-596. doi: 10.7510/jgjs.issn.1001-3806.2019.05.001
    [7] 李玉瑶张婉怡刘喆李美萱付秀华S-on-1测量方式下薄膜激光损伤的累积效应. 激光技术, 2018, 42(1): 39-42. doi: 10.7510/jgjs.issn.1001-3806.2018.01.008
    [8] 张春光张玉钧韩道文刘文清陈臻懿 . 机动车颗粒物的激光雷达监测. 激光技术, 2009, 33(2): 130-133.
    [9] 时颖句爱松乐燕芬 . 基于FPGA的外差干涉信号处理方法. 激光技术, 2012, 36(2): 221-224. doi: 10.3969/j.issn.1001-3806.2012.02.020
    [10] 陈功朱锡芳许清泉徐安成杨辉 . 小波和稀疏分解在非连续性薄膜去噪中的应用. 激光技术, 2014, 38(4): 546-550. doi: 10.7510/jgjs.issn.1001-3806.2014.04.022
    [11] 杨今才刘富金昌蓝宏 . 用He-Ne激光在线检测链板缺陷. 激光技术, 1996, 20(6): 356-359.
    [12] 朱琼玉吴松坪胡伦骥王春明 . CO2激光焊接拼缝间隙缺陷的同轴实时监测. 激光技术, 2006, 30(5): 455-457,461.
    [13] 潘卫军张庆宇张强李华吴郑源 . 多普勒激光雷达的飞机尾涡识别方法. 激光技术, 2019, 43(2): 233-237. doi: 10.7510/jgjs.issn.1001-3806.2019.02.016
    [14] 潘冰冰梁勖潘宁林颖徐健方晓东 . 基于LabVIEW的准分子激光器控制系统. 激光技术, 2020, 44(3): 343-348. doi: 10.7510/jgjs.issn.1001-3806.2020.03.013
    [15] 赵新才吴云峰方亮刘宁文 . 激光干涉测速中的小波快速算法研究. 激光技术, 2012, 36(5): 649-652. doi: 10.3969/j.issn.1001-3806.2012.05.019
    [16] 刘盛刚李泽仁刘乔 . 基于时频分析的自混合干涉信号处理方法研究. 激光技术, 2009, 33(6): 626-629. doi: 10.3969/j.issn.1001-3806.2009.06.019
    [17] 邱小倩乐燕芬王静 . 基于FPGA的插频式外差干涉信号处理方法. 激光技术, 2011, 35(2): 199-201,205. doi: 10.3969/j.issn.1001-3806.2011.02.016
    [18] 冀常鹏赵丽娜 . 脉搏信号滤波方法研究. 激光技术, 2016, 40(1): 42-46. doi: 10.7510/jgjs.issn.1001-3806.2016.01.010
    [19] 杨正理史文陈海霞 . 光纤周界报警信号自适应压缩感知. 激光技术, 2020, 44(1): 74-80. doi: 10.7510/jgjs.issn.1001-3806.2020.01.013
    [20] 王德旺王改利 . 自适应中值滤波在云雷达数据预处理的应用. 激光技术, 2012, 36(2): 217-220,224. doi: 10.3969/j.issn.1001-3806.2012.02.019
  • 加载中
图(5) / 表(2)
计量
  • 文章访问数:  5690
  • HTML全文浏览量:  4167
  • PDF下载量:  235
  • 被引次数: 0
出版历程
  • 收稿日期:  2015-12-23
  • 录用日期:  2016-01-15
  • 刊出日期:  2017-01-25

随机抽样一致性算法在激光光谱中的应用研究

    通讯作者: 李劲松, jingsong_li@ahu.edu.cn
    作者简介: 谢珊珊(1995-), 女, 硕士研究生, 主要从事数字信号处理算法研究
  • 安徽大学 物理与材料科学学院, 合肥 230601
基金项目:  安徽大学创新训练计划资助项目 J18511120国家自然科学基金资助项目 61440010安徽省高等学校省级质量工程资助项目 2014tszy004安徽大学材料物理专业综合改革试点项目 2014zy007

摘要: 为了解决波长调制激光光谱技术探测大气痕量气体浓度中信号处理算法的不足,提出了一种基于随机抽样一致性算法的气体浓度反演算法。以大气甲醛分子的仿真信号和实际测量信号为例,进行了理论分析和实验研究,并与传统的最小二乘法相比较。结果表明,该算法具有较强的抗噪声和异常点干扰能力,尤其是在低信噪比的条件下,精确度可提高1个量级,体现出较高的可靠性和优越性。

English Abstract

    • 自20世纪80年代以来,随着经济的发展,全球环境问题日益突出,如温室效应、臭氧层破坏、雾霾、酸雨和光化学烟雾等,严重威胁着全球人类的生存和发展。发展大气污染物的监测技术,为环境污染的监控、治理以及环境科学问题的研究提供必要的实验数据和理论支持,已成为环境科学家们的首要任务。可调谐半导体激光吸收光谱(tunable diode laser absorption spectroscopy, TDLAS)作为一种新型的非接触式气体浓度诊断技术,具有高分辨率和响应速度快等特点,从而被广泛地应用大气温室气体及其它大气痕量气体的测量研究[1-2]。TDLAS的测量方法主要基于朗伯-比尔定律,通过检测气体分子对特定波长的激光吸收而产生的光强衰减量,结合一定的算法模型和已知实验参量,即可直接反演出被测分子的浓度、温度和速度等信息。该方法相对简单,但易受噪声影响,测量精度和灵敏度有限。鉴于半导体激光器的可调谐特性,1981年, REID和LABRIE提出将波长调制技术应用于TDLAS[3],利用高频正弦信号叠加到低频激光波长扫描信号中调制激光器, 使得探测器探测到信号含有高频的谐波分量, 进而通过锁相放大器进行提取,能有效地抑制1/f噪声,从而实现更高精确度的测量。

      波长调制光谱中二次谐波探测技术灵敏度较高,因而被广泛地用于气体浓度的测量,但该技术首先需要对系统进行标定后才能反演出被测样品的浓度信息[4-5]。鉴于二次谐波信号与样品浓度之间的线性关系,目前采用的反演算法主要包括二次谐波信号峰值比值法和二次谐波信号整个线型轮廓线性回归分析法[6]。前者采用样品信号和参考信号之间单个峰值的比值,在低浓度的情况下(吸收信号较弱,噪声干扰明显)测量误差较大。后者利用整个二次谐波信号的有效吸收线型,结合最小二乘法拟合算法(least square method, LSM)[7-8], 反演数据点增加,可有效降低测量误差,但是仍然受到非相关的噪声影响,导致拟合结果有所偏差。

      本文中针对当前波长调制光谱技术中信号处理方法存在的问题,提出了一种改进的反演气体浓度算法,结合随机抽样一致性(random sample consensus, RANSAC)算法,用于高精度的大气痕量气体测量。首先介绍了相关算法的基本理论,通过将自行建立的RANSAC算法模型应用到理论模拟和实验测量的数据处理中,对该算法模型的可靠性进行系统地评估。

    • RANSAC算法最早由FISCHLER和BOLLES于1981年提出[9],作为一种迭代方法,用来在一组包含离群的被观测数据中估算出数学模型的参量。其主要原理是:输入一组实验数据,通过迭代反复选择数据中的一组随机子集(局内点),排除噪声(局外点),给出一个模型,最大概率的适用于局内点, 算法流程见图 1[10-11]

      Figure 1.  The flowchart of RANSAC algorithm

      RANSAC算法计算过程中,要确定的参量有判断为内点的阈值t、使得模型足够合理的内点数目d,被重复执行上述流程的次数k(迭代次数)可以从理论结果推断出。从估计模型参量时,用p表示在迭代过程中从数据集内随机选取出的点均为局内点的概率,用w表示每次从数据集中选取一个局内点的概率:w=局内点的数目/数据集的数目。

      假设估计模型需要选定n个点,wn是所有n个点均为局内点的概率;(1-wn)是n个点中至少有一个点为局外点的概率,此时表明从数据集中估计出了一个不好的模型。(1-wn)k表示算法永远都不会选择到n个点均为局内点的概率,它和(1-p)相同,即:1-p=(1-wn)k。两边取对数,即得到迭代次数:

      $ k = \frac{{{\rm{lg}}(1 - p)}}{{{\rm{lg}}(1 - {w^n})}} $

      (1)

      阈值t的选取很重要,直接影响内点外点的判断[12]。因为在判断有效点的时候,若选取的t较小,则会放弃应该选择的有效点;而选取的t较大,则可能将异常点或误差点误判为有效点。针对该问题,本文中采用绝对中位差(median absolute deviation, MAD)DMAD来估计数据的方差。假设选取的数据子集为yi,则其表达式为:

      $ {D_{{\rm{MAD}}}} = {\rm{media}}{{\rm{n}}_i}(|{y_i} - {\rm{media}}{{\rm{n}}_j}({y_i})|) $

      (2)

      式中,median为求数组的中值函数,∣·∣为求绝对值符号,ij分别为数据子集位置。阈值t取实验数据的绝对中位差,再用模型去测试其它实验数据,若数据点到直线的距离小于t时,此点被认为是内点,反之则为外点。

    • 为验证两种算法的可靠性和稳健性,对同一组含有相同误差和异常点的数据进行模拟,当数据(inliers)中不添加异常点和添加50个异常点(outliers)时,LSM和RANSAC算法的拟合结果如图 2所示。

      Figure 2.  Fitness results of the same data sets by applying LSM and RANSAC

      结果显示, 最小二乘法对异常值较敏感,当实验数据中出现异常点时,最小二乘法拟合的直线极大地偏离原直线;而RANSAC则可有效地排除异常点的影响,拟合结果非常接近原模型,具有较好的稳健性。相比于最小二乘法,RANSAC算法在计算参量的迭代次数没有上限,其优点是它能鲁棒性地估计模型参量,即使是对于存在一定显著数量的异常值的数据集,也可以高精度的估计参量,因而被广泛地应用于图像处理。实际应用中,通过最佳化RANSAC模型参量可找到最大内点集[13-15],减小误差概况概率,提高数据处理的精确度。

    • 本文中首先通过采用Python程序语言自行编程对波长调制二次谐波信号进行仿真研究。假设不含噪声的体积分数为10-7的甲醛二次谐波信号为参考信号X(信号幅值为相对值),体积分数为2×10-7的二次谐波信号为待分析信号Y,并通过对待分析信号Y添加不同幅值A的噪声(部分信号如图 3a~图 3c所示),进而对以上两种线性拟合模型进行评估。以图 3a~图 3c仿真二次谐波信号(横坐标为采样点数,无单位)中每个X信号为横坐标,Y信号为纵坐标,画出的图形及相应线性拟合结果分别展示在对应的图 3d~图 3f中,最终拟合结果统计如表 1所示。从表 1可以看出,对具有较高信噪比(signal-to-noise ratio, SNR)RSNR的谐波信号进行线性拟合,两种算法的拟合结果具有很好的一致性;随着噪声的增加,对具有较低信噪比的二次谐波信号进行线性拟合时,RANSAC算法明显比LSM更具有优越性,拟合结果的线性相关度R2要明显高于LSM, 且拟合的比值(slope)(即线性拟合的斜率,YX的比值)更接近真实值2.0。

      Figure 3.  a~c—the simulated second harmonic signal of formaldehyde with noise level A=10, 20, 50, respectively e~f—the corresponding fitted results by using LSM and RANSAC algorithms, respectively

      Table 1.  Fitting results of two harmonic signal of formaldehyde simulation with different SNR (adding Gaussian noise with different amplitude A to Y, while keeping X unchanged)

      experimental results R2 slope
      LSM RANSAC LSM RANSAC
      A=0(RSNR=∞) 1.0 1.0 2.0 2.0
      A=5(RSNR=8.87) 0.9833 0.9935 1.9845 2.0059
      A=10(RSNR=6.00) 0.9371 0.9831 2.0183 1.9997
      A=20(RSNR=3.54) 0.8045 0.9412 2.0252 2.0003
      A=50(RSNR=0.64) 0.2654 0.7482 1.6848 1.9083
    • 为了进一步对两种拟合算法进行评估,将两种拟合模型应用到实验中记录的大气甲醛二次谐波信号处理中,实验测量系统如参考文献[16]中所述。大气中甲醛含量极低,因此,实验中测量的光谱信号质量较差。实验上获得二次谐波信号I2, f与气体分子浓度C之间满足以下关系[17]

      $ {I_{{\rm{2, f}}}} \propto {I_0}\alpha CL $

      (3)

      式中,I0为激光初始光强,α为分子吸收系数,L为有效吸收光程。因此,通过将未知浓度的样品信号与已知参考样品的信号进行对比分析,即可消除初始光强的影响,从而获得未知样品的浓度信息。本文中主要是通过已知浓度的甲醛信号,对相关算法的可靠性进行初步的评估。图 4a是不同甲醛体积分数的两个二次谐波信号(signal_1:42×10-9;signal_2:35×10-9),信号基线部分受到采集系统噪声的严重干扰。类似于图 3处理方法,以signal_2的数据点为横坐标和signal_1的数据点为纵坐标时,给出如图 4b中符号“·”所示的依赖关系(包含inliers和outliers),图中符号“-”描述的分别为LSM和RANSAC算法线性拟合的结果。由此图可见,LSM算法处理的对象为整个数据点集(inliers+outliers), 而RANSAC算法通过排除含有噪声干扰的数据点(outliers),只对有效数据(inliers)进行拟合分析,从而使得拟合结果的可靠性得到显著提高。图 5a为甲醛体积分数为35×10-9不变的情况下,长时间连续测量二次谐波信号时不同时刻下选取的两个二次谐波信号(signal_2和signal_3),由于受系统的稳定性和背景噪声的干扰,使得信号的峰峰值出现明显的上下波动。同理,图 5b中给出了signal_2和signal_3之间的依赖关系(如“·”所示),及相应LSM和RANSAC算法线性拟合结果(如“-”所示),拟合结果相关的参量统计归纳在表 2中。

      Figure 4.  a—the experimentally measured second harmonic signal of formaldehyde with different concentrations b—the fitting results by using LSM and RANSAC algorithms, respectively

      Figure 5.  a—the experimentally measured second harmonic signal of formaldehyde with same concentration b—the corresponding fitted results by using LSM and RANSAC algorithm, respectively

      Table 2.  Linear fitting results of formaldehyde spectra under different experimental conditions

      formaldehyde sample 1 sample 2
      LSM RANSAC LSM RANSAC
      actual ratio 1.20 1.20 1.0 1.0
      fitted value 1.1818 1.1818 0.5342 1.0272
      correlation coefficient R2 0.8923 0.9853 0.2111 0.9743
      error/% 1.517 -0.18 46.58 -2.72

      从拟合结果可以看出,LSM在信噪比较低情况下,极易受异常数据的影响,使拟合模型明显偏离,线性相关度较低,拟合的体积分数误差高达47%。而RANSAC算法通过设置阈值来区分内外点,可以很好地排除仪器系统噪声(光学干涉噪声和电子学噪声)的影响,使得拟合线性相关度提高,反演的气体体积分数误差较小。

      通过以上对仿真信号和实验数据的分析处理可见,当光谱数据信噪比较高的时候,两种模型拟合结果保持很好的一致性,当光谱数据信噪比较差的时候,尤其是光谱信号受到采集系统噪声的严重干扰,RANSAC算法比LSM更能鲁棒性地估计模型参量,提高线性相关度,减小气体浓度反演的误差。

    • 通过理论和实验研究了RANSAC算法在波长调制吸收光谱数据处理中的应用。结果表明,与传统的LSM相比,RANSAC算法可以很好地适应光谱数据中各种异常情况,对带有误差和异常值的数据集进行拟合并得到线性相关度较高的拟合结果。尤其是在吸收光谱信号较弱(气体浓度较低)、背景噪声影响显著的情况下,RANSAC算法作为一种鲁棒性的线性拟合算法,可很好地排除异常数据的干扰,有效且可靠地反演出样品浓度信息,体现出其在激光光谱高精度测量大气温室气体及其它大气痕量气体应用研究方面的潜力。

参考文献 (17)

目录

    /

    返回文章
    返回