HTML
-
模拟实验在设有罐状设备的工厂内进行,以原油油气作为VOC泄漏源。泄漏源右侧为林木,实验当天的天气条件为微风,树枝有明显晃动,符合移动干扰的特征。实验现场的情况如图 1所示。
实验数据采集设备为红外气体成像仪,该成像仪采用了浙江超晶晟锐光电有限公司的Ⅱ类超晶格中波制冷型机芯,型号为406B,实物如图 2所示,其核心参数如表 1所示。
item technical indicators reolution 640 pixel×512 pixel pixel size 15 μm spectral response range 3.2 μm~3.5 μm noiseequivalent temperature difference 22 mK cooling method stirling refrigeration machine data type 8 bit/14 bit Table 1. Core parameters of infrared gas imaging device
为便于数据分析,对成像仪采集的原始数据进行了处理,包括将YUV格式的二进制数据转换为通用的数据格式、调整分辨率和帧率设置,最终生成了一段分辨率为640 pixel×512 pixel、帧率为25的高质量视频。
-
实验中本文作者对原始视频序列进行了投影矩阵变化率的统计分析,并得到了如图 3所示的时序序列。根据该序列的分布和统计特性,采取了一定的处理措施。首先计算投影矩阵变化率序列的标准差,并将两倍标准差的数值定义为异常视频帧的判定阈值,剔除了大于该阈值的视频数据,这样可以过滤掉异常值或异常波动,保留相对平稳的数据;接着对剩余数据取均值,以得到一个稳定的投影矩阵变化率阈值。在本实验中,该阈值设置为3,即当投影矩阵的变化率不大于3时,认为视频处于稳定状态,可以进行后续处理和识别操作,而一旦超过阈值,则判定图像处于运动状态或有快速移动物体的干扰,直接返回原始图像。通过以上处理和阈值设定,可以筛选出稳定的视频帧,以确保后续的处理和识别操作的准确性和可靠性。
-
基于第2.2节中获取的稳定性判定阈值,对稳定状态的视频序列进行后续背景建模、运动前景提取、运动前景图像增强和图像融合处理。在处理后的图像中,人工筛选出具有明显泄漏气体特征的图像,作为VOC泄漏样本,本实验中共获取VOC泄漏样本323个。
在数据集标准方面,本文作者采用数据标注工具对样本进行标注。样本数据标注前,将已融合图像的上下两端各填充64行0值,使其符合目标检测数据集对图像尺寸640 pixel×640 pixel的要求。部分已标注数据集图 4所示。
-
本实验中使用PyTorch 2.1.1框架来训练基于YOLOv7算法的目标检测网络模型。由于真实样本有限,为了提高模型的泛化能力并降低小样本数据带来的过拟合问题,作者采用了迁移学习中模型预训练的策略。在预训练阶段,使用了与VOC泄漏数据集具有相似特征的烟雾数据集进行训练,以获得一个具有较好烟雾特征提取能力的模型。这一策略旨在使模型具备一定的先验知识,有助于模型更好地处理和提取VOC泄漏数据集中的目标信息。在获得预训练模型后,作者又使用真实的VOC泄漏数据集进行模型微调,使模型的参数能够更好地适应实际的检测任务,提高模型的准确性和泛化能力。
预训练数据集为网络公开数据集[23],共15000个,使用前将图片尺寸统一调整为640 pixel×640 pixel,训练、验证和测试集比例为8 ∶1 ∶1,即80%的数据用于训练模型,10%的数据用于验证模型的性能和调优,另外10%的数据用于测试模型的泛化能力和评估最终性能。真实VOC数据集323个,图片尺寸640 pixel× 640 pixel,数据集划分方法与预训练数据集划分方法一致。模型训练时的部分参数设置如表 2所示。
item smoke recognition model VOC recognition model number of categories 1 1 anchor point [10 13 16 30 33 23]
[30 61 62 45 59 119]
[116 90 156 198 373 326][10 13 16 30 33 23]
[30 61 62 45 59 119]
[116 90 156 198 373 326]initial learning rate 0.01 0.01 batch size 20 10 epochs 10 100 number of samples 15000 323 Table 2. Key parameters of model training
本实验中,模型评估遵循训练与验证两个阶段:在训练阶段,使用检测边框损失、物体置信度损失、准确率和召回率来衡量模型对目标边界框的识别能力;在验证阶段,使用检测边框损失、物体置信度损失、平均精度均值(mean average precision,mAP)mAP@0.5和mAP@0.5~0.95指标综合评价模型性能。其中,mAP@0.5是指固定交并比(intersection over union, IOU)阈值为0.5情况下的mAP,mAP@0.5~0.95是指IOU阈值从0.5~0.95时的平均精度均值,更全面地评估目标检测模型的性能。图 5和图 6分别为烟雾和VOC识别模型训练过程的可视化结果。从训练结果可以看出,模型迁移对VOC泄漏识别模型的训练效率提升明显。
为评价模型精度,以测试集为输入数据,以mAP@ 0.5和mAP@0.5~0.95为评价指标对模型精度进行评价,结果表明在IOU为0.5时,mAP为0.88;当IOU阈值从0.5~0.95时,mAP为0.51。
-
为了验证移动端算法的执行效率,本文中采用瑞芯微电子有限公司的RK3588S开发版作为识别效率的验证平台。该开发板搭载4核A76和4核A55的处理器,主频高达2.4 GHz,并且集成了ARMMaliG610MP4 GPU以及高性能的3-D和2-D图像加速模块。此外,该开发板还内置了具备高达6 T/s算力的AI加速NPU,支持INT4、INT8、INT16和FP16混合计算,能有效加速网络模型的推理过程。开发板如图 7所示。
测试所用视频为第2.1节中预处理后的视频,文件大小9.76 Mbytes,分辨率640 pixel×512 pixel,帧率25,视频时长55 s。该视频包含人员移动、镜头移动、林木晃动等典型干扰,最大限度模拟了真实VOC泄漏场景中的各种干扰。算法执行过程中,记录各帧投影矩阵变化率,算法运行耗时等关键参数。当视频稳定算法判定视频处于稳定状态,满足背景建模要求后,识别算法开始计时,将运动背景建模、运动前景提取、运动前景图像拉伸、图像增强和VOC泄漏区域识别过程,均记录为算法耗时。实验中对1284帧数据进行了算法耗时统计,最大、最小和平均耗时分别为83 ms、38 ms和49 ms,各帧详细统计参数如图 8所示。
为更直观地展示算法在移动端的检测效果,随机选择4帧具有代表性的图片进行可视化表达,识别结果如图 9所示。可以看出,聚拢和非聚拢形态的VOC泄漏区,检测框都予以了准确标注。
-
为比较本文中的算法与帧差法[6-7]、轮廓识别法[18]的识别效果,在相同实验条件下,包括数据预处理、视频稳定性判定、模型训练策略和算法执行环境,利用第2.1节中预处理后的视频数据进行对比实验。实验中选取准确率、算法执行效率和单帧算法耗时标准差为关键对比指标,实验结果如表 3和图 10所示。
model accuracy algorithm execution efficiency/(frame·ms-1) algorithm execution efficiency standard deviation/(frame·ms-1) frame difference method — 18 9 contour detection method 0.79 110 126 the algorithm in this article 0.88 (mAP@0.5) 49 22 Table 3. Algorithm key performance indicators statistics results
从表 3中的实验结果可知,本文中算法相较于轮廓识别法,精度提升了0.09、平均算法耗时降低了61 ms、算法耗时标准差降低了104 ms。从图 10的统计结果来看,轮廓识别法算法稳定性受轮廓数量影响较大,算法稳定性明显不如本文中算法。
为更直观说明本文中算法的检测效果,选择了视频中原油倾倒前、倾倒过程中和倾倒后3个阶段的视频数据进行对比实验。
原油倾倒前,实验场景内无VOC泄漏,但存在人体移动、物体表面辐射变化和林木晃动等干扰,可检验算法的抗干扰能力,实验结果如图 11所示。帧差法将人体移动、物体表面辐射变化误识别为VOC泄漏区;轮廓识别法虽然排除了人体移动干扰,但将物体辐射变化误识别为VOC泄漏区;本文中算法则未检测出VOC泄漏区。
原油倾倒过程中,实验场景内包含人体移动、物体表面辐射变化、VOC泄漏和林木晃动,属复杂场景下的VOC泄漏检测场景,实验结果如图 12所示。帧差法将人体移动、物体表面辐射变化误识别为VOC泄漏区;轮廓识别法将部分人体移动干扰和物体辐射变化误识别为VOC泄漏区;本文中算法则准确地检测出VOC泄漏区。
原油倾倒后,实验场景内包含物体表面辐射变化、林木晃动和明显的VOC泄漏,属于一般场景下的VOC泄漏检测场景,实验结果如图 13所示。帧差法准确识别出VOC泄漏区,但同时将物体表面辐射变化误识别为VOC泄漏区;轮廓识别法识别出部分VOC泄漏区,并将部分物体辐射变化误识别为VOC泄漏区;本文中算法则准确地检测出全部VOC泄漏区。
综上所述,帧差法执行效率和稳定性最优,但不能识别VOC泄漏区和非泄漏区,难以满足自动化检测需求;轮廓识别法虽然可识别具有典型轮廓特征的VOC泄漏区,但易受辐射变化、影像噪声、疑似泄漏区数量等影响,算法稳定性较差;本文中算法则在不同场景下准确识别出VOC泄漏区,在算法稳定性、结果可视化方面表现更优,更适用于自动化检测场景。