基于目标检测的VOC泄漏区域识别技术研究

杨承霖; 陈海永; 岳学智; 李华曜; 邓立齐; 郭东歌; 王海超; 刘欢

doi:10.7510/jgjs.issn.1001-3806.2024.06.019

基于目标检测的VOC泄漏区域识别技术研究

1.
汉威科技集团股份有限公司，郑州 450001，中国
2.
华中科技大学集成电路学院湖北光谷实验室，武汉 430074，中国

通讯作者: 陈海永, hai@hust.edu.cn ; 刘欢, huan@hust.edu.cn

基金项目:
华中科技大学湖北光谷实验室创新科研项目 OVL2023ZD003

郑州市重大科技专项基金资助项目 2021KJZX0061
中图分类号: TN219

Research on VOC leakage area identification based on target detection

1.
Hanwei Electronics Group Corporation, Zhengzhou 450001, China
2.
Optics Valley Laboratory, School of Integrated Circuits, Huazhong University of Science and Technology, Wuhan 430074, China

Corresponding author: CHEN Haiyong, hai@hust.edu.cn ;LIU Huan, huan@hust.edu.cn

CLC number: TN219

摘要: 为了解决红外气体成像仪在挥发性有机化合物(VOC)泄漏识别中存在的误识别率高、漏检率高、算法执行效率低以及模型泛化能力差等问题，提出了一种基于运动特征增强的VOC泄漏区识别方法。采用视频序列投影变化率统计的方法确定视频稳定性判定阈值，提取稳定状态下运动背景和运动前景；采用优化线性拉伸的方法对运动前景进行特征增强和异常值过滤；将运动前景与原始帧进行图像融合，并利用目标检测算法进行VOC泄漏区域识别；通过模型预训练和迁移学习的方法，以烟雾数据集和少量VOC泄漏数据集进行了识别模型训练，并将模型迁移至RK3588S嵌入式开发板上进行了执行效率测试。结果表明，该算法在交并比为0.5的情况下，平均精度均值为0.88；交并比在0.5~0.95范围内，平均精度均值为0.51，单帧平均识别时间为49 ms，具有较高的识别精度和识别效率，能够满足实时监测需求。本文中的算法能够保持稳定的模型性能且具有一定的抗干扰能力，为VOC泄漏识别提供了一定的参考。
- 图像处理 /
- 泄漏区域识别 /
- 目标检测 /
- 挥发性有机化合物泄漏 /
- 红外气体成像仪
Abstract: To solve the problem of high misidentification rate, high missed detection rate, low algorithm execution efficiency, and poor model generalization ability in the recognition of volatile organic compound (VOC) leakage area of infrared gas imager, a VOC leakage area recognition method based on motion feature enhancement was proposed. The video stability threshold was determined by using the statistical method of projection change rate of video sequence, and the moving background and moving foreground were extracted under stable state. Optimized linear stretching was used to perform feature enhancement and outlier filtering on the moving foreground. The motion foreground was fused with the original frame, and VOC leakage area identification was performed using the target detection algorithm. Through the method of model pre-training and transfer learning, the smoke dataset and a small amount of VOC leakage dataset were used to train the recognition model, and the model was transferred to the RK3588S embedded development board for execution efficiency test. Experimental results show that the mean average precision of the proposed algorithm is 0.88 when the intersection over union ratio is 0.5, and the mean average precision is 0.51 when the intersection over union ratio ranges from 0.5 to 0.95. The average recognition time of a single frame is 49 ms, which has high recognition accuracy and recognition efficiency, and can meet the requirements of real-time monitoring. The algorithm in this article can maintain stable model performance and has certain anti-interference capabilities providing some reference for VOC leak identification.
- image processing /
- leakage area identification /
- target detection /
- volatile organic compounds leakage /
- infrared gas imager

图 1 实验地点

Figure 1. Experiment site

下载: 全尺寸图片幻灯片

图 2 中波制冷型机芯实物图

Figure 2. Mid-wave integrated detector cooler assembly

下载: 全尺寸图片幻灯片

图 3 投影矩阵变化率

Figure 3. Change rate of video sequence projection matrix

下载: 全尺寸图片幻灯片

图 4 部分已标注数据集

Figure 4. Part of the annotated dataset

下载: 全尺寸图片幻灯片

图 5 烟雾识别模型的训练结果

Figure 5. Training results of smoke recognition model

下载: 全尺寸图片幻灯片

图 6 VOC识别模型的训练结果

Figure 6. Training results of VOC recognition model

下载: 全尺寸图片幻灯片

图 7 RK3588S嵌入式开发板

Figure 7. RK3588S embedded development board

下载: 全尺寸图片幻灯片

图 8 算法运行参数统计图

Figure 8. Statistical chart of algorithm runtime parameter

下载: 全尺寸图片幻灯片

图 9 VOC识别结果

Figure 9. VOCrecognition results

下载: 全尺寸图片幻灯片

图 10 算法耗时逐帧统计结果

Figure 10. Algorithm execution time frame-by-frame statistical results

下载: 全尺寸图片幻灯片

图 11 视频数据第103帧检测结果

Figure 11. Detection result of video data frame 103

下载: 全尺寸图片幻灯片

图 12 视频数据第548帧检测结果

Figure 12. Detection result of video data frame 548

下载: 全尺寸图片幻灯片

图 13 视频数据第913帧检测结果

Figure 13. Detection result of video data frame 913

下载: 全尺寸图片幻灯片

表 1 红外气体成像仪核心参数

Table 1. Core parameters of infrared gas imaging device

item	technical indicators
reolution	640 pixel×512 pixel
pixel size	15 μm
spectral response range	3.2 μm~3.5 μm
noiseequivalent temperature difference	22 mK
cooling method	stirling refrigeration machine
data type	8 bit/14 bit

下载: 导出CSV

表 2 模型训练关键参数

Table 2. Key parameters of model training

item	smoke recognition model	VOC recognition model
number of categories	1	1
anchor point	[10 13 16 30 33 23] [30 61 62 45 59 119] [116 90 156 198 373 326]	[10 13 16 30 33 23] [30 61 62 45 59 119] [116 90 156 198 373 326]
initial learning rate	0.01	0.01
batch size	20	10
epochs	10	100
number of samples	15000	323

下载: 导出CSV

表 3 算法关键指标统计结果

Table 3. Algorithm key performance indicators statistics results

model	accuracy	algorithm execution efficiency/(frame·ms^-1)	algorithm execution efficiency standard deviation/(frame·ms^-1)
frame difference method	—	18	9
contour detection method	0.79	110	126
the algorithm in this article	0.88 (mAP@0.5)	49	22

下载: 导出CSV

[1]	YAN M Q, ZHU H K, LUO H N, et al. Daily ex1posure to environmental volatile organic compounds triggers oxidative damage: Evidence from a large-scale survey in China[J]. Environmental Science & Technology, 2023, 57(49): 20501-20509.
[2]	CHOI Y H, KIM H J, SOHN J R, et al. Occupational exposure to VOC and carbonyl compounds in beauty salons and health risks associated with it in South Korea[J]. Ecotoxicology and Environmental Safety, 2023, 256: 114837. doi: 10.1016/j.ecoenv.2023.114837
[3]	HUANGE Y X, D K, XIONG Y, et al. One-third of global population at cancer risk due to elevated volatile organic compounds levels[J/OL]. Research Square: (2023-09)[2024-01-11]. https://doi.org/10.21203/rs.3.rs-3320416/v1.
[4]	NARANJO E, BALIGA S, BERNASCOLLE P F, et al. IR gas imaging in an industrial setting[J]. Proceedings of the SPIE, 2010, 7661: 7661K.
[5]	RANGEL J, SCHMOLL R, KROLL A. Catadioptric stereo optical gas imaging system for scene flow computation of gas structures[J]. IEEE Sensors Journal, 2021, 21(5): 6811-6820. doi: 10.1109/JSEN.2020.3042116
[6]	HUSEIN A M, CALVIN, HALIM D, et al. Motion detect application with frame difference method on a surveillance camera[J]. Journal of Physics: Conference Series, 2019, 12309(1): 012017.
[7]	WANG L M, TONG Zh, JI B, et al. Temporal difference networks for efficient action recognition[C]//2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Nashville, USA: IEEE Press, 2021: 1895-1904. .
[8]	XIN Y H, HOU J, DONG L M, et al. A self-adaptive optical flow method for the moving object detection in the video sequences[J]. Optik—International Journal for Light and Electron Optics, 2014, 125(19): 5690-5694. doi: 10.1016/j.ijleo.2014.06.092
[9]	WANG X, FENG L I, XIN L, et al. Moving targets detection for sa-tellite-based surveillance video[C]//IGARSS 2019-2019 IEEE International Geoscience and Remote Sensing Symposium. Yokohama, Japan: IEEE Press, 2019: 5492-5495.
[10]	HE W, LI J X, QI Q, et al. SIM-MFR: Spatial interactions mechanisms based multi-feature representation for background modeling[J]. Journal of Visual Communication and Image Representation, 2022, 88: 103622. doi: 10.1016/j.jvcir.2022.103622
[11]	王建平, 李俊山, 杨亚威, 等. 基于红外成像的乙烯气体泄漏检测[J]. 液晶与显示, 2014, 29(4): 623-628. WANG J P, LI J Sh, YANG Y W, et al. Ethylene gas leakage detection based on infrared imaging[J]. Journal of Liquid Crystals and Displays, 2014, 29(4): 623-628(in Chinese).
[12]	刘路民根, 张耀宗, 栾琳, et al. 一种基于形状的红外图像泄漏气体检测方法[J]. 应用光学, 2019, 40(3): 468-472. LIU L M G, ZHANG Y Z, LUAN L, et al. A shape-based infrared image gas leakage detection method[J]. Journal of Applied Optics, 2019, 40(3): 468-472(in Chinese).
[13]	HONG Sh Zh, YING H, YU H W, et al. A VOC gas detection algorithm based on infrared thermal imaging[C]//2019 Chinese Control and Decision Conference (CCDC). Nanchang, China: IEEE Press, 2019: 329-334.
[14]	BADAWI D, PAN H Y, CETIN S C C, et al. Computationally efficient spatio-temporal dynamic texture recognition for volatile organic compound (VOC) leakage detection in industrial plants[J]. IEEE Journal of Selected Topics in Signal Processing, 2020, 14(4): 676-687. doi: 10.1109/JSTSP.2020.2976555
[15]	XU Y, DONG J X, ZHANG B, et al. Background modeling methods in video analysis: A review and comparative evaluation[J]. CAAI Transactions on Intelligence Technology, 2016, 1(1): 43-60.
[16]	ZHENG Y, FAN L Zh. Moving object detection based on running average background and temporal difference[C]//2010 IEEE International Conference on Intelligent Systems and Knowledge Engineering. Hangzhou, China: IEEE Press, 2010: 270-272.
[17]	MEGHANA R K, CHITKARA Y, MOHANA A. Background-mo-delling techniques for foreground detection and tracking using Gaussian mixture model[C]//2019 3rd International Conference on Computing Methodologies and Communication (ICCMC). Erode, India: IEEE Press, 2019: 1129-1134.
[18]	ZHU M Zh, WANGE H B. Fast detection of moving object based on improved frame-difference method[C]//2017 6th International Conference on Computer Science and Network Technology (ICCSNT). Dalian, China: IEEE Press, 2017: 299-303.
[19]	费宬, 康佳龙, 刘俊良, 等. 基于FPGA的短波红外图像灰度级拉伸算法实现[J]. 太赫兹科学与电子信息学报, 2022, 20(7): 713-717. FEI F, KANG J L, LIU J L, et al. Implementation of short-wave infrared image gray-level stretching algorithm based on FPGA[J]. Journal of Terahertz Science and Electronic Information, 2022, 20(7): 713-717(in Chinese).
[20]	周永康, 朱尤攀, 曾邦泽, 等. 宽动态红外图像增强算法综述[J]. 激光技术, 2018, 42(5): 718-726. ZHOU Y K, ZHU Y P, ZENG B Z, et al. A review of wide dynamic range infrared image enhancement algorithms[J]. Laser Technology, 2018, 42(5): 718-726(in Chinese).
[21]	魏艳平. 线性变换与局部均衡融合的红外图像增强[J]. 激光技术, 2024, 48(5): 705-710. WEI Y P. Infrared image enhancement using linear transformation and local equalization fusion[J]. Laser Technology, 2024, 48(5): 705-710(in Chinese).
[22]	WANG Y C, BOCHKOVSKIY A, LIAO H Y M. YOLOv7: Trainable bag-of-free bies sets new state-of-the-art for real-time object detectors[C]//2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Vancouver, Canada: IEEE Press, 2023: 7464-7475.
[23]	CHENG Y H, YIN J L, CHEN B H, et al. Smoke 100k: A database for smoke detection[C]//2019 IEEE 8th Global Conference on Consumer Electronics (GCCE). Osaka, Japan: IEEE Press, 2019: 596-597.

[1]	张宝华 , 刘鹤 . 基于区域定位与轮廓分割的红外目标检测. 激光技术, 2015, 39(6): 840-844. doi: 10.7510/jgjs.issn.1001-3806.2015.06.023
[2]	冯洋 . 基于改进的奇异值分解的红外弱小目标检测. 激光技术, 2016, 40(3): 335-338. doi: 10.7510/jgjs.issn.1001-3806.2016.03.007
[3]	杨桄 , 田张男 , 李豪 , 关世豪 . 基于线性解混的高光谱图像目标检测研究. 激光技术, 2020, 44(2): 143-147. doi: 10.7510/jgjs.issn.1001-3806.2020.02.001
[4]	王其华 , 叶苗 . 基于裂变自举粒子滤波的红外目标跟踪处理. 激光技术, 2011, 35(1): 141-144. doi: 10.3969/j.issn.1001-3806.2011.01.038
[5]	李泽峰 , 欧阳八生 . 基于MFC+HALCON图像识别Mark圆的检测方法. 激光技术, 2020, 44(3): 358-363. doi: 10.7510/jgjs.issn.1001-3806.2020.03.016
[6]	李文龙 , 戈海龙 , 任远 , 成巍 . 图像处理技术在激光熔池温度检测的应用. 激光技术, 2018, 42(5): 599-604. doi: 10.7510/jgjs.issn.1001-3806.2018.05.004
[7]	蹇渊 , 黄自力 , 王询 . 基于随机化张量算法的红外弱小目标检测. 激光技术, 2024, 48(1): 127-134. doi: 10.7510/jgjs.issn.1001-3806.2024.01.020
[8]	刘逸飞 , 苏亚 , 姚晓天 , 崔省伟 , 杨丽君 , 周聪聪 , 何松 . OCT无创血糖检测图像处理最优化方法研究. 激光技术, 2023, 47(2): 178-184. doi: 10.7510/jgjs.issn.1001-3806.2023.02.004
[9]	赵蓉 , 顾国华 , 杨蔚 . 基于偏振成像的可见光图像增强. 激光技术, 2016, 40(2): 227-231. doi: 10.7510/jgjs.issn.1001-3806.2016.02.016
[10]	陈树越 , 刘金星 , 丁艺 . 基于小波变换的红外与X光图像融合方法研究. 激光技术, 2015, 39(5): 685-688. doi: 10.7510/jgjs.issn.1001-3806.2015.05.021
[11]	江天 , 沈会良 , 杨冬晓 , 刘建军 , 邹哲 . 基于模糊局部信息C均值的太赫兹图像目标检测. 激光技术, 2015, 39(3): 289-294. doi: 10.7510/jgjs.issn.1001-3806.2015.03.001
[12]	张明淳 , 牛春晖 , 刘力双 , 刘洋 . 用于无人机探测系统的红外小目标检测算法. 激光技术, 2024, 48(1): 114-120. doi: 10.7510/jgjs.issn.1001-3806.2024.01.018
[13]	朱金辉 , 张宝华 , 谷宇 , 李建军 , 张明 . 基于双邻域对比度的红外小目标检测算法. 激光技术, 2021, 45(6): 794-798. doi: 10.7510/jgjs.issn.1001-3806.2021.06.020
[14]	刘皓皎 , 刘力双 , 张明淳 . 基于YOLOv5改进的红外目标检测算法. 激光技术, 2024, 48(4): 534-541. doi: 10.7510/jgjs.issn.1001-3806.2024.04.011
[15]	虞文俊 , 顾国华 , 刘骋昊 . 红外偏振图像的仿真. 激光技术, 2014, 38(1): 76-78. doi: 10.7510/jgjs.issn.1001-3806.2014.01.016
[16]	周永康 , 朱尤攀 , 曾邦泽 , 胡健钏 , 欧阳慧明 , 李泽民 . 宽动态红外图像增强算法综述. 激光技术, 2018, 42(5): 718-726. doi: 10.7510/jgjs.issn.1001-3806.2018.05.025
[17]	吴家洲 , 刘君 , 施佳文 , 张胜 . 激光焊缝图像分割与颜色识别方法研究. 激光技术, 2023, 47(5): 723-728. doi: 10.7510/jgjs.issn.1001-3806.2023.05.022
[18]	孙颖馨 . 基于FPGA红外成像光谱数据处理系统研究. 激光技术, 2019, 43(6): 763-767. doi: 10.7510/jgjs.issn.1001-3806.2019.06.006
[19]	孙越娇 , 雷武虎 , 胡以华 , 赵楠翔 , 任晓东 . 基于视觉显著模型的遥感图像舰船快速检测. 激光技术, 2018, 42(3): 379-384. doi: 10.7510/jgjs.issn.1001-3806.2018.03.017
[20]	李昌海 , 叶玉堂 , 沈淦松 , 徐伟 , 叶涵 , 姚景昭 . 基于图像轮廓分析的LCD线路缺陷检测. 激光技术, 2013, 37(2): 207-210. doi: 10.7510/jgjs.issn.1001-3806.2013.02.017

点击查看大图

图(13) / 表(3)

计量

文章访问数: 23
HTML全文浏览量: 12
PDF下载量: 0
被引次数: 0

全文HTML

0. 引言

挥发性有机化合物(volatile organic compound, VOC)是一类在常温条件下易挥发的有机化合物，在工业生产、交通运输、建筑材料以及室内气体环境中均广泛分布，会对环境和健康造成重大危害，其光化学反应会形成臭氧和其它有毒大气污染物，对环境造成严重污染。长期暴露于高浓度VOC会导致眼鼻喉刺激、呼吸道疾病、头痛、恶心、疲劳等健康问题^[1-2]，甚至可能引发潜在的癌症风险^[3]。因此，监测VOC泄漏对于保护人体健康和环境质量至关重要，在早期阶段发现并迅速控制泄漏，能够有效预防长期暴露可能带来的危害，同时也符合相关法规和标准要求。

随着气体探测技术的不断发展，VOC泄漏监测已由非成像模式逐步转向成像模式。比如，Bertin公司的SecondSight MS^[4]产品通过精心设计多个滤光片，依据气体在不同波段的吸收特性，实现对特定气体的精确识别。FLIR公司的光学气体图像摄像机(optical gas imaging, OGI^[5])则采用窄带滤光片和斯特林制冷系统，使其能够可视化气体在红外吸收波段的分布情况，通过差分图像技术，该设备能够有效识别可疑的VOC泄漏区域，进一步提高了监测的准确性和可靠性。

相较于传统的非成像气体检测设备，光学气体成像仪不仅在作业效率和准确定位泄漏点方面具有显著优势，还能远距离评估泄漏区域的大小，帮助巡检人员精确掌握泄漏趋势，降低人员暴露于VOC泄漏区域的风险。随着红外图像分析技术的不断发展，越来越多的学者开始将其与红外成像技术相结合，以提高VOC泄漏的自动化识别效果。较为典型的分析方法包括帧差法^[6-7]、光流法^[8-9]和背景建模法^[10]，这些方法的核心思想是利用运动目标的运动特征来识别目标。然而，由于VOC的泄漏通常以不稳定的模式移动，使得上述方法难以区分气体运动区域和非气体运动区域。为减少非气体运动区域干扰、提升识别效果，研究者们从背景建模算法，运动区域的轮廓、面积、纹理和历史特征等方面进行了深入研究，例如，WANG等人^[11]将多幅帧间差分和背景差分后图像进行了融合处理，经形态学滤波后得到了疑似VOC泄漏区域；LIU等人^[12]则基于支持向量机分类算法，设计了一种基于轮廓特征分类的泄漏VOC识别方法。此外，多特征融合识别的方法也备受关注，例如，HONG等人^[13]通过优化高斯背景建模，并引入气体不规则性、气体连通区域面积和移动方向等特征，显著提高了高浓度VOC泄漏区域的识别效果；BADAWI等人^[14]则利用VOC动态纹理区域的空间和时间结构特征，结合视频图像深度神经网络和时间序列神经网络的方法，实现了从视频中快速识别VOC泄漏区域。

上述研究中，VOC泄漏区域识别算法多集中在优化背景建模、改善VOC疑似区域分类模型和多特征融合等方面，在VOC泄漏识别中存在误识别率高、漏检率高、算法执行效率低以及模型泛化能力差等问题，并且在VOC泄漏区域的特征提取方面缺少自主学习能力。因此，本文作者提出了一种基于增强运动区域特征并利用目标识别算法识别VOC泄漏区域的算法，包括视频稳定性判定、运动背景提取、运动前景特征增强、图像融合与VOC泄漏区域识别等5个步骤。通过分析相邻视频帧的灰度投影矩阵变化率来判断视频是否稳定，减少干扰因素的影响；利用高斯混合模型背景建模方法提取出静止区域作为运动背景；通过减去运动背景，提取出视频中的运动区域，并进行图像增强，突出细节特征，将增强后的运动图像与原始帧进行融合，并利用运动目标检测算法识别VOC泄漏区域，实现对泄漏区域的识别。该算法的优势在于结合了视频稳定性判定和混合高斯背景建模，提高了算法的执行效率和背景建模质量；运动图像增强处理在保留原始帧数据特征的同时，融合了运动区域的细节特征，提高了VOC泄漏区域的识别精度和可靠性。

1. 算法介绍

1.1. 视频稳定性判定

本文中将灰度投影矩阵变化率作为判定视频稳定性的指标。较小的投影变化率表示视频处于稳定状态，较高的投影变化率表示视频处于非稳定状态，或者视频中有快速移动物体的干扰。该算法计算效率高，能够有效过滤非稳定状态的视频数据，减少镜头晃动、人员快速移动等因素对结果的干扰。下面介绍灰度投影矩阵变化率计算方法。

1.1.1. 灰度投影矩阵计算

分别计算视频第k帧行方向1维灰度投影矩阵X_k、列方向1维灰度投影矩阵Y_k和上一帧行方向1维灰度投影矩阵X_k-1、列方向1维灰度投影矩阵Y_k-1，计算公式见下：

$ X_k(x)=\frac{1}{w} \sum\limits_{y=1}^w f_k(x, y) $
(1)

$ Y_k(y)=\frac{1}{h} \sum\limits_{x=1}^h f_k(x, y) $
(2)

$ X_{k-1}(x)=\frac{1}{w} \sum\limits_{y=1}^w f_{k-1}(x, y) $
(3)

$ Y_{k-1}(y)=\frac{1}{h} \sum\limits_{x=1}^h f_{k-1}(x, y) $
(4)

式中：h为视频帧的行数；w为视频帧的列数；f_k(x, y)、f_k-1(x, y) 分别为视频第k、k-1帧图像的2维灰度信息；X_k(x)、Y_k(y) 为第k帧图像第x行和第y列的灰度投影值；X_k-1(x)、Y_k-1(y) 为第k-1帧图像第x行和第y列的灰度投影值。

1.1.2. 灰度投影矩阵标准差计算

第k帧行方向的灰度投影标准差矩阵S_{x, k}、列方向灰度投影标准差矩阵S_{y, k}和上一帧行方向灰度投影标准差矩阵S_{x, k-1}、列方向灰度投影标准差矩阵S_{y, k-1}, 计算公式为：

$ S_{x, k}(x)=\sqrt{\frac{1}{w} \sum\limits_{y=1}^w\left(f_k(x, y)-X_k(x)\right)^2} $

(5)

$ S_{y, k}(y)=\sqrt{\frac{1}{h} \sum\limits_{x=1}^h\left(f_k(x, y)-Y_k(y)\right)^2} $

(6)

$ S_{x, k-1}(x)=\sqrt{\frac{1}{w} \sum\limits_{y=1}^w\left(f_{k-1}(x, y)-X_{k-1}(x)\right)^2} $

(7)

$ S_{y, k-1}(y)=\sqrt{\frac{1}{h} \sum\limits_{x=1}^h\left(f_{k-1}(x, y)-Y_{k-1}(y)\right)^2} $

(8)

式中：S_{x, k}(x)、S_{y, k}(y)分别为第k帧图像第x行和第y列的灰度投影标准差；S_{x, k-1}(x)、S_{y, k-1}(y)分别为第k-1帧图像第x行和第y列的灰度投影标准差。

1.1.3. 灰度投影矩阵变化率计算

利用下式分别计算行、列方向灰度投影矩阵变化率X_c和Y_c：

$ X_\text{c}=\frac{\sum\limits_{x=1}^h\left|X_{k-1}(x)-X_k(x)\right|}{\frac{1}{w} \sum \boldsymbol{S}_{x, k-1}} $

(9)

$ Y_\text{c}=\frac{\sum\limits_{y=1}^w\left|Y_{k-1}(y)-Y_k(y)\right|}{\frac{1}{h} \sum \boldsymbol{S}_{y, k-1}} $

(10)

式中：($\sum \boldsymbol{S}_{x, k-1} $)/w和($\sum \boldsymbol{S}_{y, k-1} $)/h分别为视频第k-1帧行方向和列方向灰度投影标准差的均值。如果X_c和Y_c都较低，则说明第k帧图像处于稳定视频序列中。

1.2. 运动背景提取

本文中基于背景减法实现对运动前景的提取。常用背景模型的构建方法有中值建模法^[15]、均值建模法^[16]和基于混合高斯模型的建模^[17]方法。下面介绍采用混合高斯背景建模算法作为背景建模和前景提取方法的步骤。

1.2.1. 模型参数初始化

在混合高斯背景建模算法中，选取连续N帧图像，用于初始化高斯分布的权重、均值和方差：

$ \boldsymbol{\omega}_{m, 0}=\frac{1}{m} $

(11)

$ \boldsymbol{\mu}_{m, 0}=\frac{1}{N} \sum\limits_{i=0}^N \boldsymbol{f}(i) $

(12)

$ \boldsymbol{\sigma}_{m, 0}^2=\frac{1}{N} \sum\limits_{i=0}^N\left(\boldsymbol{f}(i)-\boldsymbol{\mu}_{m, 0}\right)^2 $

(13)

式中：m是高斯分量的数量；初始权重矩阵ω_{m, 0}采用平均分配的方式；μ_{m, 0}表示高斯分布的初始化均值矩阵；σ_{m, 0}²表示各高斯分布的初始化方差矩阵；f(i)表示第i帧图像的灰度矩阵。

1.2.2. 背景建模和更新

对于新输入第k帧图像位置(x, y) 处的灰度值f(x, y, k)，利用式(14)计算其与当前m个混合高斯模型匹配度，若满足匹配条件则标记p_{m, k} =1；否则，标记p_{m, k} =0。

$ \begin{gathered} \left|f(x, y, k)-\mu_{m, k-1}(x, y, k-1)\right| \leqslant \\ c \times \sigma_{m, k-1}(x, y, k-1) \end{gathered} $

(14)

式中：c∈[2,3]是一个经验常数。随后，根据匹配标记结果利用式(15)更新权重参数，如果存在p_{m, k} =1，采用式(16)和式(17)分别更新第m个高斯模型的均值和方差。

$ \begin{gathered} \omega_{m, k}(x, y, k)= \\ (1-\alpha) \cdot \omega_{m, k-1}(x, y, k-1)+\alpha \cdot p_{m, k} \end{gathered} $

(15)

$ \begin{gathered} \mu_{m, k}(x, y, k)= \\ (1-\alpha) \cdot \mu_{m, k-1}(x, y, k-1)+\alpha \cdot f(x, y, k) \end{gathered} $

(16)

$ \begin{gathered} \sigma_{m, k}^2(x, y, k)=(1-\alpha) \cdot \sigma_{m, k-1}^2(x, y, k-1)+ \\ \alpha \cdot p_{m, k} \cdot\left[f(x, y, k)-\mu_{m, k-1}(x, y, k-1)\right]^2 \end{gathered} $

(17)

式中：α∈[0, 1]是一个学习率参数，用于更新各高斯模型的参数。若f(x, y, k) 与所有模型都未得到匹配，则用f(x, y, k) 取代最后一个高斯模型对应位置的均值，并重新为该模型的(x, y) 处分配一个较大的方差和较小的权重。

为进一步计算第k帧视频数据的背景模型，对前k-1帧已完成参数更新的模型进行如下调整：利用式(18)对视频帧各像素位置的模型权重进行归一化处理；随后，按由大到小的排序规则对ω_{m, k}(x, y, k)/σ_{m, k}²(x, y, k)的计算结果对各高斯模型进行排序，利用式(19)选择前B个模型作为背景分布, τ为权重阈值；最后，利用式(20)对第k帧视频数据f(x, y, k) 各像素点的值和前B个背景模型进行匹配判断，若匹配到一个模型满足匹配要求，则认为该像素点为背景信息，否则为前景信息。

$ \omega_{m, k}(x, y, k)=\frac{\omega_{m, k}(x, y, k)}{\sum\limits_{i=1}^m \omega_{i, k}(x, y, k)} $

(18)

$ B=\underset{m}{\operatorname{argmin}}\left(\sum\limits_{m=1} \omega_{m, k}(x, y) \geqslant \tau\right) $

(19)

$ \left|f(x, y, k)-\mu_{m, k}(x, y, k)\right| \leqslant c \times \sigma_{m, k}(x, y, k) $

(20)

1.3. 运动前景提取

帧差法^[18]是一种常用的运动目标检测算法，它通过分析相邻帧像素灰度值的差异，能够精确地检测出视频中的运动目标。第1.3.1节中采用连续两帧图像与背景图像进行灰度值差值分析，取两者的均值作为帧差结果；然后将平均值与预设阈值进行比较，如果平均值超过阈值0，则相应区域被判定为运动区域。这种方法能够有效地检测出运动目标，并且在实际操作中具有较高的准确性和可靠性。

1.3.1. 计算帧差

$ d(x, y, k-1)=|f(x, y, k-1)-b(x, y, k-1)| $
(21)

$ d(x, y, k)=|f(x, y, k)-b(x, y, k)| $
(22)

$ g(x, y, k)=0.5(d(x, y, k-1)+d(x, y, k)) $
(23)

式中：f(x, y, k-1) 和f(x, y, k) 为影像第k-1和第k帧图像处的灰度值；b(x, y, k) 为第k帧的运动背景；d(x, y, k-1) 和d(x, y, k) 为第k-1和第k帧的帧差结果；g(x, y, k) 为第k帧求均值后的帧差结果，也就是运动前景。

1.3.2. 图像增强

为提高图像质量、突出图像细节，常采线性拉伸^[19]、细节滤波^[20]、多尺度变换^[21]等算法对红外图像进行特征增强。其中，线性拉伸是一种常见的图像增强技术，用于改善图像的对比度和亮度。它基于简单的线性变换，将图像像素的灰度值从原始范围映射到更广的范围，这样可以使原本较暗的区域变得更明亮，同时保留图像中的细节。

为解决VOC泄漏运动前景灰度值低、存在异常噪声、对比度不明显的问题，本文作者提出了一种优化的线性拉伸算法来提升图像质量。首先计算图像的相对累积直方图，查找最小百分比和最大百分比相对应的数据值，将其分别标记为a值和b值；接着利用最小调整百分比0.1和最大调整百分比0.5更新a值(见式(24))和b值(见式(25))，得到新的a′和b′，将小于a′和大于的b′值标记为最小噪声和最大噪声；然后使用公式(见式(26))对图像进行拉伸和噪声去除。

$ a^{\prime}=a-(b-a) \times 0.1 $

(24)

$ b^{\prime}=b+(b-a) \times 0.5 $

(25)

$ \begin{gathered} E(x, y, k)= \\ \begin{cases}0, \quad\;\;\;\; \left(g(x, y, k)<a^{\prime}\right) \\ 255, \quad\left(g(x, y, k)>b^{\prime}\right) \\ 255 \frac{g(x, y, k)-a^{\prime}}{\left(b^{\prime}-a^{\prime}\right)}, \;\;\;\;\;\;\;\;\left(a^{\prime} \leqslant g(x, y, k) \leqslant b^{\prime}\right)\end{cases} \end{gathered} $

(26)

式中：g(x, y, k) 为原始运动前景；E(x, y, k) 为第k帧图像经过拉伸和图像增强后的运动前景。

1.4. 图像融合

为利用视频的场景特征，利用式(27)将经过特征增强的运动前景与原始图像进行加权融合，使动态运动区域的特征与原始图像结合在一起。该方法在提升运动区域形状、纹理和位置特征的同时，保留了图像的上下文信息，有助于目标检测算法更好地理解和识别运动区域。

$ A(x, y, k)=\alpha \times f(x, y, k)+\beta \times E(x, y, k) $
(27)

式中：A(x, y, k) 为融合后像素的灰度值；α和β为权重系数，本文中α和β均为0.5；f(x, y, k) 为原始图像的灰度值；E(x, y, k) 为第k帧图像经过拉伸和图像增强后的运动前景。

1.5. 模型选择

在充分考虑后续识别任务对多尺度、时效性和准确性的要求后，本文中选择了目标检测模型YOLOv7。YOLOv7^[22]是一种基于深度学习的单阶段目标检测网络，具备高性能和实时检测的特点。该模型采用多尺度特征提取的骨干网结构，能够专注于从深层获取目标的高级描述信息，在多尺度目标检测中表现出色。

模型的Head部分通过并行结构和多级特征融合技术，如空间金字塔池化(spatial pyramid pooling, SPP)、空间金字塔卷积(spatial pyramid convolution, SPC)、上采样、最大池化以及重复卷积等，进一步细化特征并有效整合了不同分辨率的特征图。另外，YOLOv7的head结构通过多尺度预测能够灵敏捕获不同尺寸的物体，准确预测它们的位置和类别。

3. 结论

为了提高VOC泄漏区识别效率和识别精度，本文作者设计了一种基于增强运动区域特征并利用目标识别算法识别VOC泄漏区的算法。在背景建模方面，该算法将视频稳定性判定技术与高斯背景建模相结合，减少了镜头移动、抖动和检测区内物体快速移动等因素对背景建模和移动区域提取的干扰，提高了背景建模质量和算法执行效率。在泄漏区域特征增强方面，本文中算法利用优化线性拉伸的方法突出了泄漏区域细节，对运动前景进行异常噪声过滤和细节增强，并将其与原始图像进行加权融合，提高了VOC泄漏区域的可识别性。在VOC泄漏区识别方面，利用目标检测算法，实现了VOC泄漏区域的精准识别，泄漏区域识别精度mAP@0.5为0.88，mAP@0.5~0.95为0.51，较轮廓识别法提升了0.09。在算法执行性能方面，在嵌入式开发板中以红外视频为测试数据，对算法执行效率进行了对比测试，并以原油倾倒前、倾倒过程中和倾倒后3个典型场景的检测结果进行了可视化分析。结果表明，本文中算法单帧平均识别时间为49 ms，较轮廓识别法降低了61 ms；算法耗时标准差为22 ms，较轮廓识别法降低了104 ms。

尽管本文作者提出的VOC泄漏区域识别算法在实验中取得了较高的识别和定位精度，但受限于数据集场景单一、数量少等问题，需要对算法的视频稳定性判定阈值进行深入优化和验证。为了确保视频稳定性判定的准确性，应引入更多不同场景的视频数据，从而更精确地确定阈值。在识别模型训练方面，需要收集更多具有不同距离、场景和多源气体泄漏源样本，这将有助于增强算法对各类VOC以及各类场景的识别能力。同时，考虑到技术的不断进步，应进一步结合循环神经网络等先进的图像处理和机器学习技术，进一步提升算法的性能和智能化程度。

参考文献 (23)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于目标检测的VOC泄漏区域识别技术研究

通讯作者: 陈海永, hai@hust.edu.cn ; 刘欢, huan@hust.edu.cn

Research on VOC leakage area identification based on target detection

Corresponding author: CHEN Haiyong, hai@hust.edu.cn ;LIU Huan, huan@hust.edu.cn

计量

基于目标检测的VOC泄漏区域识别技术研究

通讯作者: 陈海永, hai@hust.edu.cn;

通讯作者: 刘欢, huan@hust.edu.cn

English Abstract

Research on VOC leakage area identification based on target detection

Corresponding author: CHEN Haiyong, hai@hust.edu.cn

Corresponding author: LIU Huan, huan@hust.edu.cn

全文HTML

1.1. 视频稳定性判定

1.1.1. 灰度投影矩阵计算

1.1.2. 灰度投影矩阵标准差计算

1.1.3. 灰度投影矩阵变化率计算

1.2. 运动背景提取

1.2.1. 模型参数初始化

1.2.2. 背景建模和更新

1.3. 运动前景提取

1.3.1. 计算帧差

1.3.2. 图像增强

1.4. 图像融合

1.5. 模型选择

2.1. 模拟实验

2.2. 视频稳定性阈值获取

2.3. VOC泄漏数据集获取

2.4. 模型训练与精度评价

2.5. 算法执行效率

2.6. 与其它算法的对比

目录

留言板

基于目标检测的VOC泄漏区域识别技术研究

通讯作者: 陈海永, hai@hust.edu.cn ; 刘欢, huan@hust.edu.cn

Research on VOC leakage area identification based on target detection

Corresponding author: CHEN Haiyong, hai@hust.edu.cn ;LIU Huan, huan@hust.edu.cn

计量

出版历程

基于目标检测的VOC泄漏区域识别技术研究

通讯作者: 陈海永, hai@hust.edu.cn;

通讯作者: 刘欢, huan@hust.edu.cn

English Abstract

Research on VOC leakage area identification based on target detection

Corresponding author: CHEN Haiyong, hai@hust.edu.cn

Corresponding author: LIU Huan, huan@hust.edu.cn

全文HTML

1.1. 视频稳定性判定

1.1.1. 灰度投影矩阵计算

1.1.2. 灰度投影矩阵标准差计算

1.1.3. 灰度投影矩阵变化率计算

1.2. 运动背景提取

1.2.1. 模型参数初始化

1.2.2. 背景建模和更新

1.3. 运动前景提取

1.3.1. 计算帧差

1.3.2. 图像增强

1.4. 图像融合

1.5. 模型选择

2.1. 模拟实验

2.2. 视频稳定性阈值获取

2.3. VOC泄漏数据集获取

2.4. 模型训练与精度评价

2.5. 算法执行效率

2.6. 与其它算法的对比

目录