高级检索

ISSN1001-3806CN51-1125/TN 网站地图

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于深度图像先验的高光谱图像去噪方法

马飞 王梓璇 刘思雨

引用本文:
Citation:

基于深度图像先验的高光谱图像去噪方法

    通讯作者: 马飞, femircom@gmail.com
  • 基金项目:

    辽宁省教育厅科学研究面上项目 LJKZ0357

    辽宁省自然科学基金资助项目 2023-MS-314

  • 中图分类号: TP751.1

Hyperspectral image denoising method based on depth image prior

    Corresponding author: MA Fei, femircom@gmail.com ;
  • CLC number: TP751.1

  • 摘要: 为了避免现有的高光谱图像去噪优化模型仅考虑有限的高光谱内在结构特点、并未实现图像特征的精确表征的问题, 采用了一种基于空谱深度图像先验与平滑的高光谱图像去噪方法, 将紧框架变换与具有高表达与强学习能力的深度学习模型进行结合, 构建基于深度学习的噪声去除模型。首先在低秩矩阵分解的基础上, 利用特定的深度图像先验学习潜在的空谱特征; 然后分别构建端元与丰度矩阵的紧框架稀疏正则探究空谱局部平滑, 并解决深度图像先验的半拟合问题; 最后设计高效迭代算法实现模型求解。结果表明, 基于空谱深度图像先验的方法在各种复杂的噪声干扰下均表现出较好的视觉恢复性能, 峰值信噪比至少有1 dB以上的提升, 得到了高质量的恢复图像。该方法为高光谱图像去噪提供了参考。
  • 图 1  深度图像先验整体网络结构

    Figure 1.  Overall network flowchart of deep image prior

    图 2  Washington DC Mall数据集第100个波段在方案Ⅰ下的去噪图像

    Figure 2.  The denoised results of the 100th band in Washington DC Mall dataset under case Ⅰ

    图 3  Salinas数据集第100个波段在方案Ⅳ下的去噪图像

    Figure 3.  The denoised results of the 100th band in Salinas dataset under case Ⅳ

    图 4  在方案Ⅰ与Ⅲ下Washington DC Mall数据集所有波段的PSNR与ERGAS值

    Figure 4.  PSNR and ERGAS values of all bands in Washington DC Mall dataset under case Ⅰ and Ⅲ

    图 5  在方案Ⅱ与Ⅳ下Salinas数据集所有波段的PSNR与ERGAS值

    Figure 5.  PSNR and ERGAS values of all bands in Salinas dataset under case Ⅱ and Ⅳ

    图 6  WHU HongHu数据集第2个波段的去噪结果

    Figure 6.  The denoised results of the 2nd band in WHU HongHu dataset

    图 7  WHU HongHu数据集第2个波段的水平均值剖面图

    Figure 7.  Horizontal mean profile of the 2nd band in WHU HongHu dataset

    图 8  MPSNR与各参数值间的关系

    Figure 8.  Relationship between parameter values and MPSNR

    图 9  不同方案下MPSNR与迭代次数间的关系

    Figure 9.  Relationship between iteration number and MPSNR in different cases

    表 1  Washington DC Mall的去噪图像性能对比

    Table 1.  Performance comparison of denoising images on Washington DC Mall

    case index LRMR LRTV HySuDeep DIP2D proposed
    MPSNR/dB 32.63 27.63 29.43 26.97 33.31
    MSSIM 0.926 0.859 0.907 0.849 0.938
    SAM 0.0837 0.127 0.153 0.121 0.069
    ERGAS 75.86 152.31 127.10 145.63 70.14
    MPSNR/dB 32.93 32.12 29.72 27.59 33.81
    MSSIM 0.934 0.928 0.913 0.844 0.948
    SAM 0.082 0.094 0.150 0.129 0.065
    ERGAS 73.46 90.12 125.68 140.33 66.39
    MPSNR/dB 31.43 31.96 29.54 32.31 34.15
    MSSIM 0.925 0.934 0.913 0.934 0.949
    SAM 0.101 0.083 0.151 0.071 0.065
    ERGAS 92.39 89.38 126.43 78.87 63.85
    MPSNR/dB 30.24 26.42 28.92 25.04 32.73
    MSSIM 0.906 0.829 0.901 0.789 0.931
    SAM 0.114 0.166 0.156 0.154 0.075
    ERGAS 103.71 181.25 136.37 187.67 74.83
    下载: 导出CSV

    表 2  Salinas的去噪图像性能对比

    Table 2.  Performance comparison of denoising images on Salinas

    scase index LRMR LRTV HySuDeep DIP2D proposed
    MPSNR/dB 34.69 29.26 31.98 29.62 36.03
    MSSIM 0.848 0.778 0.907 0.763 0.895
    SAM 0.040 0.089 0.069 0.068 0.034
    ERGAS 89.86 628.62 107.14 338.15 66.70
    MPSNR/dB 34.35 33.95 32.22 32.01 35.86
    MSSIM 0.857 0.880 0.917 0.823 0.894
    SAM 0.043 0.068 0.069 0.053 0.035
    ERGAS 186.45 583.89 112.05 271.69 65.24
    MPSNR/dB 30.68 31.42 32.16 35.39 36.69
    MSSIM 0.815 0.855 0.926 0.884 0.905
    SAM 0.083 0.088 0.071 0.035 0.033
    ERGAS 127.43 109.72 86.83 78.07 55.54
    MPSNR/dB 29.19 26.40 31.04 27.92 35.20
    MSSIM 0.767 0.715 0.884 0.728 0.881
    SAM 0.090 0.127 0.074 0.093 0.036
    ERGAS 197.29 961.37 154.44 583.71 91.20
    下载: 导出CSV

    表 3  不同张量核范数方法的性能对比

    Table 3.  Performance comparison of different tensor nuclear norm method

    data case method MPSNR/dB MSSIM SAM ERGAS
    Washington DC Mall SSDIP 31.69 0.931 0.087 86.25
    SSDSN 32.41 0.935 0.071 78.03
    SSDFS 31.90 0.926 0.096 89.81
    proposed 33.81 0.948 0.065 66.39
    SSDIP 26.53 0.849 0.124 157.01
    SSDSN 31.89 0.925 0.075 82.64
    SSDFS 27.21 0.850 0.124 155.91
    proposed 33.11 0.939 0.070 71.68
    Salinas SSDIP 33.87 0.863 0.054 537.44
    SSDSN 35.37 0.894 0.036 67.93
    SSDFS 34.38 0.869 0.048 196.51
    proposed 36.18 0.901 0.035 67.72
    SSDIP 28.78 0.777 0.083 499.51
    SSDSN 34.63 0.870 0.042 95.88
    SSDFS 29.22 0.787 0.082 511.01
    proposed 35.20 0.881 0.036 91.20
    下载: 导出CSV

    表 4  不同方法在4种方案下的平均运行时间对比/s

    Table 4.  Comparison of average running times of different methods under four cases/s

    data LRMR LRTV HySuDeep DIP2D proposed
    Washington DC Mall 74.56 55.69 29.12 59.91 28.82
    Salinas 65.39 47.72 26.47 52.65 27.53
    下载: 导出CSV
  • [1] 赵佳乐, 王广龙, 周冰, 等. 基于边缘剔除的陆基高光谱图像噪声评估方法[J]. 激光技术, 2023, 47(1): 121-126.

    ZHAO J L, WANG G L, ZHOU B, et al. Noise evaluation method for land-based hyperspectral images based on edge elimination[J]. Laser Technology, 2023, 47(1): 121-126(in Chinese). 
    [2] 刘翠连, 陶于祥, 罗小波, 等. 混合卷积神经网络的高光谱图像分类方法[J]. 激光技术, 2022, 46(3): 355-361.

    LIU C L, TAO Y X, LUO X B, et al. Hyperspectral image classification based on hybrid convolutional neural network[J]. Laser Techno-logy, 2022, 46(3): 355-361(in Chinese). 
    [3]

    WU Z B, SUN J, ZHANG Y, et al. Recent developments in parallel and distributed computing for remotely sensed big data processing[J]. Proceedings of the IEEE, 2021, 109(8): 1282-1305. doi: 10.1109/JPROC.2021.3087029
    [4]

    XU X S, GAO R X, QING Y, et al. Hyperspectral image mixed noise removal via tensor robust principal component analysis with tensor-ring decomposition[J]. International Journal of Remote Sensing, 2023, 44(5): 1556-1578. doi: 10.1080/01431161.2023.2187720
    [5]

    SUN H, ZHENG X T, LU X Q. A supervised segmentation network for hyperspectral image classification[J]. IEEE Transactions on Ⅰ-mage Processing, 2021, 30(4): 2810-2825.
    [6]

    RAO W Q, GAO L R, QU Y, et al. Siamese transformer network for hyperspectral image target detection[J]. IEEE Transactions on Geoscience And Remote Sensing 2022, 60(4): 1-19.
    [7]

    DAO P D, MANTRIPRAGADA K, HE Y, et al. Improving hyperspectral image segmentation by applying inverse noise weighting and outlier removal for optimal scale selection[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2021, 171(1): 348-366.
    [8]

    ZHANG P, NING J. Hyperspectral image denoising via group sparsity regularized hybrid spatio-spectral total variation[J]. Remote Sensing, 2022, 14(10): 2348-2372. doi: 10.3390/rs14102348
    [9]

    XIONG F C, ZHOU J, ZHAO Q L, et al. MAC-Net: Model-aided nonlocal neural network for hyperspectral image denoising[J]. IEEE Transactions on Geoscience and Remote Sensing, 2021, 60(11): 1-14.
    [10]

    MA F, HUO S, YANG F X. Graph-based logarithmic low-rank tensor decomposition for the fusion of remotely sensed images[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2021, 14(4): 11271-11286.
    [11]

    ZENG Z Y, HUANG T Z, CHEN Y, et al. Nonlocal block-term decomposition for hyperspectral image mixed noise removal[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2021, 14(2): 5406-5420.
    [12]

    WANG Y, PENG J J, ZHAO Q, et al. Hyperspectral image restoration via total variation regularized low-rank tensor decomposition[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2017, 11(4): 1227-1243.
    [13]

    XU C G, WU Z M, LI F, et al. Spectral-spatial joint sparsity unmixing of hyperspectral images based on framelet transform[J]. Infrared Physics & Technology, 2021, 112(5): 103564.
    [14]

    KONG W F, SONG Y Y, LIU J. Hyperspectral image denoising via framelet transformation based three-modal tensor nuclear norm[J]. Remote Sensing, 2021, 13(19): 3829-3852.
    [15]

    XU X, LI J, LI S T, et al. Curvelet transform domain-based sparse nonnegative matrix factorization for hyperspectral unmixing[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2020, 13(3): 4908-4924. 
    [16]

    PAN E, MA Y, MEI X G, et al. D2net: deep denoising network in frequency domain for hyperspectral image[J]. IEEE/CAA Journal of Automatica Sinica, 2022, 10(3): 813-815.
    [17]

    ZHANG H Y, HE W, ZHANG L P, et al. Hyperspectral image restoration using low-rank matrix recovery[J]. IEEE Transactions on Geoscience and Remote Sensing, 2013, 52(8): 4729-4743.
    [18]

    HE W, ZHANG H Y, ZHANG L P, et al. Total-variation-regula-rized low-rank matrix factorization for hyperspectral image restoration[J]. IEEE Transactions on Geoscience and Remote Sensing, 2015, 54(1): 178-188.
    [19]

    ZHUANG L N, NG M K, FU X Y. Hyperspectral image mixed noise removal using subspace representation and deep cnn image prior[J]. Remote Sensing, 2021, 13(20): 2071-2092.
    [20]

    SIDOROV O, HARDEBERG J. Deep hyperspectral prior: single-image denoising, inpainting, super-resolution[C]//Proceedings of the IEEE/CVF International Conference on Computer Vision Workshops. New York, USA: IEEE, 2019: 3844-3851.
  • [1] 贺锋涛吴倩倩杨祎张建磊王炳辉张依 . 基于深度学习的激光散斑图像识别技术研究. 激光技术, 2024, 48(3): 443-448. doi: 10.7510/jgjs.issn.1001-3806.2024.03.022
    [2] 陶昕辰朱涛黄玉玲高恬曼何博吴迪 . 基于DDR GAN的低质量图像增强算法. 激光技术, 2023, 47(3): 322-328. doi: 10.7510/jgjs.issn.1001-3806.2023.03.006
    [3] 吴家洲刘君施佳文张胜 . 激光焊缝图像分割与颜色识别方法研究. 激光技术, 2023, 47(5): 723-728. doi: 10.7510/jgjs.issn.1001-3806.2023.05.022
    [4] 常颖常大俊 . 改进型卷积神经网络焊点缺陷识别算法研究. 激光技术, 2020, 44(6): 779-783. doi: 10.7510/jgjs.issn.1001-3806.2020.06.023
    [5] 李宇豪吕晓琪谷宇张明李菁 . 基于改进S3FD网络的人脸检测算法. 激光技术, 2021, 45(6): 722-728. doi: 10.7510/jgjs.issn.1001-3806.2021.06.008
    [6] 刘煊渠慎明 . 低秩稀疏和改进SAM的高光谱图像误标签检测. 激光技术, 2022, 46(6): 808-816. doi: 10.7510/jgjs.issn.1001-3806.2022.06.016
    [7] 张宝华刘鹤张传亭 . 基于经验模态分解提取纹理的图像融合算法. 激光技术, 2014, 38(4): 463-468. doi: 10.7510/jgjs.issn.1001-3806.2014.04.007
    [8] 李文龙戈海龙任远成巍 . 图像处理技术在激光熔池温度检测的应用. 激光技术, 2018, 42(5): 599-604. doi: 10.7510/jgjs.issn.1001-3806.2018.05.004
    [9] 张海庄姚梅雷萍李鹏曾庆平 . 远场激光光斑图像处理方法研究. 激光技术, 2013, 37(4): 460-463. doi: 10.7510/jgjs.issn.1001-3806.2013.04.010
    [10] 卢兆林李闰龙李涛王震威韩春霞钱建生 . 基于全变分理论的红外图像去噪. 激光技术, 2012, 36(2): 194-197. doi: 10.3969/j.issn.1001-3806.2012.02.012
    [11] 汤敏王惠南 . 激光扫描共聚焦显微镜图像的计算机处理. 激光技术, 2007, 31(5): 558-560.
    [12] 张羽鹏王开福 . LabVIEW和MATLAB在电子散斑干涉图像处理中的应用. 激光技术, 2009, 33(6): 582-585,589. doi: 10.3969/j.issn.1001-3806.2009.06.007
    [13] 冯煦张瑞瑛周萍李松 . 大功率半导体线激光图像处理方法研究. 激光技术, 2010, 34(5): 624-627. doi: 10.3969/j.issn.1001-3806.2010.O5.013
    [14] 顾国庆王开福燕新九 . 基于同态滤波的电子散斑干涉图像处理. 激光技术, 2010, 34(6): 750-752,797. doi: 10.3969/j.issn.1001-3806.2010.06.009
    [15] 苏平牛燕雄李大乾牛海莎李易难张超 . 基于面阵CCD的激光告警系统的图像采集与处理. 激光技术, 2013, 37(3): 394-399. doi: 10.7510/jgjs.issn.1001-3806.2013.03.028
    [16] 刘逸飞苏亚姚晓天崔省伟杨丽君周聪聪何松 . OCT无创血糖检测图像处理最优化方法研究. 激光技术, 2023, 47(2): 178-184. doi: 10.7510/jgjs.issn.1001-3806.2023.02.004
    [17] 孟宇帆张丽君何长涛肖婧阳宁静冯国英韩敬华 . 基于图像处理的激光清洗飞机蒙皮特性和机制研究. 激光技术, 2024, 48(3): 303-311. doi: 10.7510/jgjs.issn.1001-3806.2024.03.002
    [18] 崔治邓曙光肖卫初 . 利用HSSIM和残差比阈值的3维激光扫描图像去噪. 激光技术, 2015, 39(5): 669-673. doi: 10.7510/jgjs.issn.1001-3806.2015.05.018
    [19] 张怡霄杜惊雷高福华姚军曾阳素郭永康 . 分数域啁啾滤波及其在数字图像处理中的应用. 激光技术, 2003, 27(1): 78-80.
    [20] 陈树越刘金星丁艺 . 基于小波变换的红外与X光图像融合方法研究. 激光技术, 2015, 39(5): 685-688. doi: 10.7510/jgjs.issn.1001-3806.2015.05.021
  • 加载中
图(9) / 表(4)
计量
  • 文章访问数:  919
  • HTML全文浏览量:  548
  • PDF下载量:  9
  • 被引次数: 0
出版历程
  • 收稿日期:  2023-06-26
  • 录用日期:  2023-07-27
  • 刊出日期:  2024-05-25

基于深度图像先验的高光谱图像去噪方法

    通讯作者: 马飞, femircom@gmail.com
  • 辽宁工程技术大学 电子与信息工程学院, 葫芦岛 125105, 中国
基金项目:  辽宁省教育厅科学研究面上项目 LJKZ0357辽宁省自然科学基金资助项目 2023-MS-314

摘要: 为了避免现有的高光谱图像去噪优化模型仅考虑有限的高光谱内在结构特点、并未实现图像特征的精确表征的问题, 采用了一种基于空谱深度图像先验与平滑的高光谱图像去噪方法, 将紧框架变换与具有高表达与强学习能力的深度学习模型进行结合, 构建基于深度学习的噪声去除模型。首先在低秩矩阵分解的基础上, 利用特定的深度图像先验学习潜在的空谱特征; 然后分别构建端元与丰度矩阵的紧框架稀疏正则探究空谱局部平滑, 并解决深度图像先验的半拟合问题; 最后设计高效迭代算法实现模型求解。结果表明, 基于空谱深度图像先验的方法在各种复杂的噪声干扰下均表现出较好的视觉恢复性能, 峰值信噪比至少有1 dB以上的提升, 得到了高质量的恢复图像。该方法为高光谱图像去噪提供了参考。

English Abstract

    • 利用遥感技术获取的高光谱图像,作为一个数据立方体,结合了用于表征物质反射特性的光谱信息以及用于刻画物质2维空间分布的图像信息[1]。凭借其强大的空间与光谱信息的表达能力,高光谱图像被广泛应用于物质分类[2]、环境监测、军事目标的检测与分析等[3]领域。高光谱图像在采集与处理过程中容易受到各种噪声的干扰[4],这对后续的高光谱图像的应用,如高光谱图像的分类[5]、目标检测[6]以及目标分割[7]等,都有一定的影响。因此,在有效去除噪声的基础上,恢复重建高分辨率的图像成为遥感图像领域研究的热点。

      基于先验的去噪方法可以精确地表达出高光谱图像的空谱信息分布特点。依据空谱特征描述方式的不同,先验方法可以更为精确地划分为基于平滑的去噪方法[8]、基于全局自相似的去噪方法[8]、基于低秩的去噪方法[9]以及基于深度学习的去噪方法。本文作者[10]曾通过构建空谱平滑图正则的方式, 实现基于塔克分解的低秩模型算法的扩展,但现有的基于平滑的方法容易陷入过平滑造成的细节信息丢失。ZENG等人[11]通过张量分解(block term decomposition,BTD) 的手段深入探究相似立体补丁组的光谱局部联系与空间的全局相关性,但基于全局自相似的方法采用的块匹配方法往往涉及较大计算量,会造成运算成本加剧。WANG等人[12]构建了一个融合了空谱全变分的低秩塔克分解模型,可以充分利用高光谱图像的空谱全局与局部相关性并恢复出高质量的去噪图像。然而,基于矩阵模型的算法面临着立体结构信息被破坏的问题。XIONG等人[9]尝试将全局注意力机制模块引入到传统的U型网络(U-Net),可以实现同时捕获空间的全局与局部信息。上述基于监督学习的方法通常涉及大量的数据训练以及超参数,会导致计算负担的增加。

      变换域的出现为高光谱图像的去噪研究开辟了一条全新的道路。图像经变换后, 主要信息会集中到低频部分,细节信息则在高频部分[13]。针对变换域的特点从张量秩[14]、平滑[15]、深度学习[16]等不同角度对去噪方法进行了探索。KONG等人[14]研究了基于紧框架的张量纤维秩以及对应的凸松弛来表达三模张量核范数,可以更好地刻画高光谱图像不同维度的低秩性。但总体来看,基于变换域的张量核范数方法由于涉及到大数据的奇异值分解计算,面临着计算复杂度过高的问题。XU等人[15]尝试通过非负矩阵分解得到丰度矩阵在曲线波域的稀疏特性,但基于变换域平滑的方法不能充分利用不同频段的图像特征信息。考虑到小波变换可以利用不同频段,实现高斯噪声与条带噪声的有效分离,PAN等人[16]设计了多层3维卷积低频网络和结合渐进式空谱混合卷积块的高频卷积神经网络,可以较好地学习变换域下图像不同频段的空谱潜在特征,然而基于变换域的深度学习模型仍存在着可解释性差以及网络复杂度高等问题。

      为了克服上述问题,本文作者提出将基于变换域的正则与深度学习模型相结合,构建无监督学习的噪声去除模型。首先,对无监督去噪模型展开探索,规避了监督去噪模型缺乏大量高光谱训练数据的缺陷,同时通过增加传统高光谱图像的先验优化改善了基于深度图像先验涉及到的半拟合现象;然后通过构建端元矩阵与丰度矩阵在变换域中的稀疏正则实现空谱局部平滑;最后, 设计迭代算法求解模型得到高质量的恢复图像,同时加速网络学习并获得更好的性能。

    • 假设FRm×n×p表示高光谱立体图像,R表示实数集,利用矩阵分解可将高光谱立体数据F重塑为矩阵形式Y =[y1, …, yi, …, yc],其中yiRp被定义为第i个像素对应的光谱向量。由于纯高光谱数据可以利用线性混合模型分解为端元矩阵与丰度矩阵的乘积,则噪声扰动的退化模型可以定义为:

      $ \boldsymbol{Y}=\boldsymbol{A} \boldsymbol{X}+\boldsymbol{S}+\boldsymbol{N} $

      (1)

      式中: ARp×r表示包含r个端元和p个光谱波段的端元矩阵; XRr×c是丰度矩阵; c=m×n代表空间像素数目,其每一列表示对应像素包含的r个端元的分布比例;SRp×c表示稀疏噪声;NRp×c代表高斯噪声或误差。

      在高光谱图像退化模型式(1)的基础上,引入各变量的正则约束定义基于高斯噪声最小化的去噪模型:

      $ \begin{gathered} \min _{{\boldsymbol{A}}, {\boldsymbol{X}}, {\boldsymbol{S}}} \frac{1}{2}{\|\boldsymbol{Y}-\boldsymbol{A} \boldsymbol{X}-\boldsymbol{S}\|_{\mathrm{F}}}^2+ \\ \lambda_A \theta_A(\boldsymbol{A})+\lambda_{\boldsymbol{X}} \theta_{\boldsymbol{X}}(\boldsymbol{X})+\lambda_S \theta_S(\boldsymbol{S}) \end{gathered} $

      (2)

      式中: ‖·‖F为Frobenius范数; λAθA(A)、λXθX(X)和λSθS(S)分别代表着端元矩阵、丰度矩阵以及稀疏噪声的正则项。利用深度图像先验分别学习端元矩阵与丰度矩阵的特征,得到空谱深度图像先验去噪模型:

      $ \begin{aligned} & {\min _{f_{\xi_1}\left(\boldsymbol{Z}_1\right), f_{\xi_2}\left(\boldsymbol{Z}_2\right), \boldsymbol{S}} \frac{1}{2}\left\|\boldsymbol{Y}-f_{\xi_1}\left(\boldsymbol{Z}_1\right) f_{\xi_2}\left(\boldsymbol{Z}_2\right)-\boldsymbol{S}\right\|_{\mathrm{F}}}^2+ \\ & \lambda_{\boldsymbol{A }}\theta_{\boldsymbol{A}}\left(f_{\xi_1}\left(\boldsymbol{Z}_1\right)\right)+\lambda_{\boldsymbol{X}} \theta_{\boldsymbol{X}}\left(f_{\xi_2}\left(\boldsymbol{Z}_2\right)\right)+\lambda_{\boldsymbol{S}} \theta_{\boldsymbol{S}}(\boldsymbol{S}) \end{aligned} $

      (3)

      式中: fξ1(·)与fξ2(·)分别表示端元矩阵与丰度矩阵的深度图像先验神经网络;ξ1ξ2代表对应的可学习网络权重;Z1Rp×rZ2Rr×mn用于生成空谱矩阵的随机输入。

    • 无监督深度图像先验是一个类似于U-Net的带有跳跃连接的沙漏类型卷积神经网络,将随机生成的张量视作网络输入,通过不断调整网络参数值实现图像特征信息的学习。它的特点是: 不需要训练网络用于训练,可以规避监督去噪模型缺乏大量高光谱训练数据的缺陷。基于此,本文作者采用深度图像先验分别学习丰度矩阵与端元矩阵的特征信息,具体的网络结构如图 1所示。图中,upsample是上采样;BatchNorm2D是深度学习中的一种层,用于进行批归一化操作;MaxPooling是最大池化。

      图  1  深度图像先验整体网络结构

      Figure 1.  Overall network flowchart of deep image prior

      设计的深度图像先验网络结构分别包括5层编码层、解码层以及跳跃链接。编码层的每层设计了两组相同的卷积、批标准化与激活模块,可以更好地提取图像的特征信息,其中2维卷积(convolution 2-D,Conv2D)采用大小为3、步长为1的卷积核,带泄露修正线性单元(leaky rectified linear unit,LeakyReLU)作为激活模块可以加速网络的学习过程;解码层通过一系列的上采样、卷积、批标准化与激活等操作,用于解析学习到的图像特征信息;跳跃连接采用大小为1、步长为1的Conv2D模块以及批标准化与激活模块建立相同层级间的编解码特征之间的联系,可以减少下采样操作所引起的信息损失。

    • 对于去噪模型式(3),如果仅使用空间与光谱深度图像先验去学习空谱特征,则会导致半拟合现象,造成去噪性能的下降。因此本文中对稀疏噪声施加L1范数正则用于增强其稀疏特性,对端元矩阵与丰度矩阵的局部相关性构建紧框架域平滑正则。综上所述,将去噪模型式重新定义为:

      $ \begin{gathered} {\min _{f_{\xi_1}\left(\boldsymbol{Z}_1\right), f_{\xi_2}\left(\boldsymbol{Z}_2\right), \boldsymbol{S}} \frac{1}{2}\left\|\boldsymbol{Y}-f_{\xi_1}\left(\boldsymbol{Z}_1\right) f_{\xi_2}\left(\boldsymbol{Z}_2\right)-\boldsymbol{S}\right\|_{\mathrm{F}}}^2+ \\ \lambda_{\boldsymbol{A}}\left\|\boldsymbol{W} f_{\xi_1}\left(\boldsymbol{Z}_1\right)\right\|_1+ \\ \lambda_{\boldsymbol{X}}\left\|\boldsymbol{W} f_{\xi_2}\left(\boldsymbol{Z}_2\right)\right\|_1+\lambda_S\|\boldsymbol{S}\|_1 \end{gathered} $

      (4)

      式中: W表示紧框架变换矩阵,对于多网络结构优化问题,可以交替迭代ξ1ξ2网络参数以及稀疏噪声S直到收敛。

      用于生成端元矩阵与丰度矩阵的ξ1ξ2神经网络优化子问题如下:

      $ \begin{aligned} & {\min _{\xi_1, \xi_2, {\boldsymbol{S}}} \frac{1}{2}\left\|\boldsymbol{Y}-f_{\xi_1}\left(\boldsymbol{Z}_1\right) f_{\xi_2}\left(\boldsymbol{Z}_2\right)\right\|_{\mathrm{F}}}^2+ \\ & \lambda_{\boldsymbol{A}}\left\|\boldsymbol{W} f_{\xi_1}\left(\boldsymbol{Z}_1\right)\right\|_1+\lambda_{\boldsymbol{X}}\left\|\boldsymbol{W} f_{\xi_2}\left(\boldsymbol{Z}_2\right)\right\|_1 \end{aligned} $

      (5)

      其可以利用动量梯度下降算法求解。

      $ \begin{gathered} \xi_1{ }^{(k+1)}=\xi_1{ }^{(k)}-\alpha^{(k)} \nabla_{\xi_1}\left(\frac{1}{2} \| \boldsymbol{Y}-f_{\xi_1}\left(\boldsymbol{Z}_1\right) f_{\xi_2{ }^{(k)}}\left(\boldsymbol{Z}_2\right)-\right. \\ \left.\boldsymbol{S}\left\|_{\mathrm{F}}{ }^2+\lambda_{\boldsymbol{A}}\right\| \boldsymbol{W} f_{\xi_1}\left(\boldsymbol{Z}_1\right) \|_1\right) \end{gathered} $

      (6)

      $ \begin{gathered} \xi_2{ }^{(k+1)}=\xi_2{ }^{(k)}-\alpha^{(k)} \nabla_{\xi_2}\left(\frac{1}{2} \| \boldsymbol{Y}-f_{\xi_1}\left(\boldsymbol{Z}_1\right) f_{\xi_2{ }^{(k)}}\left(\boldsymbol{Z}_2\right)-\right. \\ \left.{\boldsymbol{S}}\left\|_{\mathrm{F}}{ }^2+\lambda_{\boldsymbol{A}}\right\| \boldsymbol{W} f_{\xi_2}\left(\boldsymbol{Z}_2\right) \|_1\right) \end{gathered} $

      (7)

      式中: ∇ξ1(·)与∇ξ2(·)分别表示运用反向传播算法计算得到的ξ1ξ2梯度;α对应着通过自适应矩估计算法确定的步长;k是当前迭代的次数。由此,在更新了网络参数ξ1ξ2的基础上,可以得到对应的网络输出fξ1(Z1)(k+1)fξ2(Z2)(k+1)

      针对稀疏噪声S的优化子问题如下:

      $ \begin{array}{c} \arg \min \limits_{\boldsymbol{S}} \frac{1}{2} \| \boldsymbol{Y}-f_{\xi_1(k+1)}\left(\boldsymbol{Z}_1\right) f_{\xi_2{ }^{(k+1)}}\left(\boldsymbol{Z}_2\right)- \\ {\boldsymbol{S}||_{\mathrm{F}}}^2+\lambda_{\boldsymbol{S}}|| \boldsymbol{S} ||_1 \end{array} $

      (8)

      其闭式解可以利用软阈值算子得到:

      $ \begin{gathered} \boldsymbol{S}^{(k+1)}= \\ \operatorname{shrink}\left(\boldsymbol{Y}-f_{\xi_1{ }^{(k+1)}}\left(\boldsymbol{Z}_1\right) \boldsymbol{f}_{\xi_2{ }^{(k+1)}}\left(\boldsymbol{Z}_2\right), \lambda_{\boldsymbol{S}}\right) \end{gathered} $

      (9)

      本文作者所提出的基于空谱深度图像先验结合紧框架平滑与噪声稀疏先验(spatial spectral depth tight sparse,SSDTS)算法的迭代流程描述如下:

      (a) 输入YλAλXλS

      (b) 随机初始化A(0)X(0)S(0)=0,k=0;

      (c) 当不满足迭代停止条件时,借助式(6)更新ξ1(k+1), 借助式(7)更新ξ2(k+1), 借助式(9)更新S(k+1), k=k+1;

      (d) 判断收敛条件为‖ξ1(k+1)ξ2(k+1)-ξ1(k)ξ2(k)F2/ ‖ξ1(k)ξ2(k)F2≤0.001;

      (e) 结束循环;

      (f) 输出L =fξ1(Z1)fξ2(Z2)。

    • 本文中采用模拟数据集和真实数据集测试和评估SSDTS算法对高光谱图像的去噪能力。在此基础上,选取4种广泛使用的算法作为对比算法,包括低秩矩阵恢复(low-rank matrix recovery,LRMR)[17]、全变分正则化的低秩矩阵分解(the TV-regularized low-rank matrix factorization,LRTV)[18]、利用子空间和深度图像先验的高光谱图像混合噪声去除方法(hyperspectral image mixed noise removal method using subspace representation and deep CNN image prior,HySuDeep)[19]和2维深度图像先验(deep image prior 2D,DIP2D)[20]。与此同时,为了准确可靠地评价图像重建性能,采用4个定量评价指标,分别为平均峰值信噪比(mean peak signal-to-noise ratio,MPSNR)、平均结构相似度(mean structural similarity index measure,MSSIM)、光谱角制图(spectral angle mapper,SAM)和相对无量纲全局误差(erreur relative globale adimensionnelle de synthèse,ERGAS)。另外,作为实验的预处理,将高光谱图像的灰度值归一化到[0, 1]区间。上述所有深度学习的实验结果均在GeForce GTX 2080 Ti处理器上使用Python环境的pytorch库产生。

    • 对于模拟实验,本文作者设计了两个高光谱图像数据集作为参考。一个是Washington DC Mall的子图像,尺寸为120×256×256个像素; 另一个是Salinas数据集,包含192×192个空间像素和130个光谱波段。

    • 方案Ⅰ(高斯噪声与椒盐噪声):采用分布比例为0.1的高斯噪声与椒盐噪声污染高光谱图像的所有波段。

      方案Ⅱ(高斯噪声与条带噪声):对于受到与方案Ⅰ相同的高斯噪声污染的高光谱图像,随机选择波段添加条带噪声,其波段数量占所有波段数目的0.5,每个波段中条带的数量从5~15间随机变化。

      方案Ⅲ(高斯噪声与截止噪声):包含与方案Ⅰ相同的高斯噪声和随机选择的波段上的截止噪声,其波段数量占所有波段数目的0.5。与此同时,截止噪声的宽度从1~3随机变化,每个波段存在的截止噪声总数在[6, 10]之间。

      方案Ⅳ(高斯噪声与混合稀疏噪声):在每个高光谱图像波段中,添加与方案Ⅰ、方案Ⅱ和方案Ⅲ相同的高斯噪声、椒盐噪声、条带噪声和截止噪声。

    • 图 2所示,Washington DC Mall图像遭受到严重的高斯噪声与椒盐噪声的污染,LRTV和DIP2D算法生成的去噪图像仍残存着明显的噪声,LRMR和HySuDeep算法去除噪声效果较好,但存在着图像细节信息的丢失,本文中提出的SSDTS算法可以最大程度地消除噪声,并准确地描述图像的细节。对比图 3可以发现,本文中所提出的SSDTS算法还具有较为理想的去噪结果,LRMR、LRTV和DIP2D算法对于高斯噪声与多种稀疏噪声的混合具有较差的抑制性,HySuDeep算法对应的重构图像面临着过度平滑的现象。综上所述,SSDTS算法在各种复杂、严重的噪声干扰下均表现出较好的视觉恢复性能。

      图  2  Washington DC Mall数据集第100个波段在方案Ⅰ下的去噪图像

      Figure 2.  The denoised results of the 100th band in Washington DC Mall dataset under case Ⅰ

      图  3  Salinas数据集第100个波段在方案Ⅳ下的去噪图像

      Figure 3.  The denoised results of the 100th band in Salinas dataset under case Ⅳ

    • 表 1表 2中对比了SSDTS算法与4种算法在Washington DC Mall和Salinas数据集上产生的评价指标值。相对于其它算法,SSDTS算法产生的平均峰值信噪比值提高了1 dB以上,对应的ERGAS值至少降低了10%。这说明本文中提出的方法在严重的高斯噪声或稀疏噪声的污染下,依然能获得更为理想的重构图像。从整体结果来看,SSDTS算法在几乎所有评价指标上都取得了令人满意的性能。

      表 1  Washington DC Mall的去噪图像性能对比

      Table 1.  Performance comparison of denoising images on Washington DC Mall

      case index LRMR LRTV HySuDeep DIP2D proposed
      MPSNR/dB 32.63 27.63 29.43 26.97 33.31
      MSSIM 0.926 0.859 0.907 0.849 0.938
      SAM 0.0837 0.127 0.153 0.121 0.069
      ERGAS 75.86 152.31 127.10 145.63 70.14
      MPSNR/dB 32.93 32.12 29.72 27.59 33.81
      MSSIM 0.934 0.928 0.913 0.844 0.948
      SAM 0.082 0.094 0.150 0.129 0.065
      ERGAS 73.46 90.12 125.68 140.33 66.39
      MPSNR/dB 31.43 31.96 29.54 32.31 34.15
      MSSIM 0.925 0.934 0.913 0.934 0.949
      SAM 0.101 0.083 0.151 0.071 0.065
      ERGAS 92.39 89.38 126.43 78.87 63.85
      MPSNR/dB 30.24 26.42 28.92 25.04 32.73
      MSSIM 0.906 0.829 0.901 0.789 0.931
      SAM 0.114 0.166 0.156 0.154 0.075
      ERGAS 103.71 181.25 136.37 187.67 74.83

      表 2  Salinas的去噪图像性能对比

      Table 2.  Performance comparison of denoising images on Salinas

      scase index LRMR LRTV HySuDeep DIP2D proposed
      MPSNR/dB 34.69 29.26 31.98 29.62 36.03
      MSSIM 0.848 0.778 0.907 0.763 0.895
      SAM 0.040 0.089 0.069 0.068 0.034
      ERGAS 89.86 628.62 107.14 338.15 66.70
      MPSNR/dB 34.35 33.95 32.22 32.01 35.86
      MSSIM 0.857 0.880 0.917 0.823 0.894
      SAM 0.043 0.068 0.069 0.053 0.035
      ERGAS 186.45 583.89 112.05 271.69 65.24
      MPSNR/dB 30.68 31.42 32.16 35.39 36.69
      MSSIM 0.815 0.855 0.926 0.884 0.905
      SAM 0.083 0.088 0.071 0.035 0.033
      ERGAS 127.43 109.72 86.83 78.07 55.54
      MPSNR/dB 29.19 26.40 31.04 27.92 35.20
      MSSIM 0.767 0.715 0.884 0.728 0.881
      SAM 0.090 0.127 0.074 0.093 0.036
      ERGAS 197.29 961.37 154.44 583.71 91.20
    • 图 4图 5中绘制了SSDTS算法与所有对比算法在受到不同噪声方案污染的Washington DC Mall和Salinas数据集上产生的峰值信噪比(peak signal-to-noise ratio,PSNR)和ERGAS曲线。值得注意的是,本文中提出的SSDTS算法产生的PSNR曲线优于由对比算法生成的其它曲线;而SSDTS算法对应的ERGAS曲线在绝大多数波段得到最低值。上述性能曲线变化情况表明,SSDTS去噪算法在大部分波段获得了最理想的结果。同时,也从侧面证明,不同于仅采用深度图像先验的DIP2D算法,本文中所提出的空谱深度图像先验结合紧框架域平滑正则在图像去噪领域中可以产生更加满意的结果。

      图  4  在方案Ⅰ与Ⅲ下Washington DC Mall数据集所有波段的PSNR与ERGAS值

      Figure 4.  PSNR and ERGAS values of all bands in Washington DC Mall dataset under case Ⅰ and Ⅲ

      图  5  在方案Ⅱ与Ⅳ下Salinas数据集所有波段的PSNR与ERGAS值

      Figure 5.  PSNR and ERGAS values of all bands in Salinas dataset under case Ⅱ and Ⅳ

    • 为了验证本文作者所提出的算法对于真实噪声的去除仍具有有效性,选取由传感器直接采集的WHU HongHu数据集,包含150个光谱波段和192×192个空间像素。图 6展示出经过所有去噪方法的优化处理后的WHU HongHu数据集在第2个波段的重构结果。可以明显观察到,HySuDeep与DIP2D算法对真实噪声的抑制效果有限。其它两个对比算法可以实现较好地去噪,但会造成图像局部特征信息的模糊。相比之下,由于深度图像先验模型与传统的变换域平滑先验的结合,本文作者提出的算法能够在最大限度地消除噪声的同时, 精确地保留图像细节信息。

      图  6  WHU HongHu数据集第2个波段的去噪结果

      Figure 6.  The denoised results of the 2nd band in WHU HongHu dataset

      由于缺乏干净图像作为参考,采用水平均值剖面图作为图像质量评价指标,通过遥感影像平均像元亮度值(digital number,DN)记录地物的灰度值。仔细对比图 7中各个剖面图的变化趋势可知,由LRMR、LRTV、HySuDeep与DIP2D这4种对比算法产生的剖面图在局部位置仍存在明显的波动,这说明对应的去噪图像中存在着噪声残留。而本文作者提出的SSDTS算法对应的水平均值剖面图平滑效果最好。

      图  7  WHU HongHu数据集第2个波段的水平均值剖面图

      Figure 7.  Horizontal mean profile of the 2nd band in WHU HongHu dataset

    • 图 8反映了方案Ⅱ下的模拟数据集的MPSNR与λAλXλS和端元数目r的关系。由图可知,当λA的值设为0.1、λX的值设为0.2、λS值设为0.1、r选择为5时,在Washington DC Mall与Salinas数据集上产生的MPSNR值均达到了最优性能的近似值。

      图  8  MPSNR与各参数值间的关系

      Figure 8.  Relationship between parameter values and MPSNR

    • 图 9中可以明显观察到,随着迭代次数的增加,MPSNR对应的曲线均逐渐趋向于平稳的理想结果,这表明本文作者提出的SSDTS算法具有理想的收敛性,同时也从侧面证明SSDTS算法中采用的噪声稀疏与变换域平滑正则项可以有效改善深度图像网络存在的半拟合问题,在充分学习图像特征达到最佳评价指标结果后, 没有产生继续学习噪声特征导致性能下降的现象。

      图  9  不同方案下MPSNR与迭代次数间的关系

      Figure 9.  Relationship between iteration number and MPSNR in different cases

    • 为了验证本文作者提出的将深度学习与传统先验结合的有效性,设计了空谱深度图像先验(spatial spectral depth image prior,SSDIP)算法、空谱深度图像先验结合稀疏噪声正则(spatial spectral depth sparse noise,SSDSN) 算法、空谱深度图像先验结合紧框架平滑先验正则(spatial spectral depth frame smoothing,SSDFS)算法和提出的SSDTS算法的对比实验。从表 3可知,在受到不同程度混合噪声干扰下,相对于其它3种算法,本文作者提出的SSDTS算法均呈现出更加理想的去噪表现,这证明了本文中将空谱深度图像先验与紧框架平滑以及噪声稀疏先验相结合的合理性。

      表 3  不同张量核范数方法的性能对比

      Table 3.  Performance comparison of different tensor nuclear norm method

      data case method MPSNR/dB MSSIM SAM ERGAS
      Washington DC Mall SSDIP 31.69 0.931 0.087 86.25
      SSDSN 32.41 0.935 0.071 78.03
      SSDFS 31.90 0.926 0.096 89.81
      proposed 33.81 0.948 0.065 66.39
      SSDIP 26.53 0.849 0.124 157.01
      SSDSN 31.89 0.925 0.075 82.64
      SSDFS 27.21 0.850 0.124 155.91
      proposed 33.11 0.939 0.070 71.68
      Salinas SSDIP 33.87 0.863 0.054 537.44
      SSDSN 35.37 0.894 0.036 67.93
      SSDFS 34.38 0.869 0.048 196.51
      proposed 36.18 0.901 0.035 67.72
      SSDIP 28.78 0.777 0.083 499.51
      SSDSN 34.63 0.870 0.042 95.88
      SSDFS 29.22 0.787 0.082 511.01
      proposed 35.20 0.881 0.036 91.20
    • 表 4中的图像去噪运行时间来看,LRMR算法恢复图像最耗时,HySuDeen和本文作者所提出的算法运行时间很接近,两者相差非常小,这证明了本文作者提出的算法不止在客观评价指标和视觉恢复效果上有良好的表现,在运行时间上也具有一定的优势。

      表 4  不同方法在4种方案下的平均运行时间对比/s

      Table 4.  Comparison of average running times of different methods under four cases/s

      data LRMR LRTV HySuDeep DIP2D proposed
      Washington DC Mall 74.56 55.69 29.12 59.91 28.82
      Salinas 65.39 47.72 26.47 52.65 27.53
    • 为解决深度图像的半拟合问题,改善矩阵分解对立体特征的破坏,本文作者利用特定的深度图像先验网络分别学习矩阵分解得到的更加明显的端元与丰度矩阵上特征信息;同时,构建端元与丰度矩阵上的紧框架平滑正则可以有效改善网络的半拟合现象并加速网络训练; 最后,设计了高效迭代算法来实现神经网络与优化问题相结合模型的高效求解。多组模拟高光谱图像数据实验结果表明,所提出的SSDTS算法可以实现MPSNR性能1 dB以上的提升,ERGAS性能有至少10%的降低,进一步验证了本文中算法在混合噪声去除方面具有优异的表现。

参考文献 (20)

目录

    /

    返回文章
    返回