基于改进条件生成对抗网络的水下图像增强方法
由于陆地资源急剧消耗,对海洋资源的探索愈发刻不容缓。拍摄的水下图像在获取海洋资源信息中具有不可替代的作用,例如海洋石油勘探、海洋沉船探索[
近年来,水下图像的增强方法有很多种。对水下图像的增强大致可分为物理模型[
本文对传统条件生成对抗网络(ConditionalGAN)进行改进,在编码与解码过程中引入链接块,链接块由5层残差块组成,并在编码解码的每层对应卷积处加入了跳跃连接结构。对水下图像进行处理时,先将原始图像使用动态阈值算法进行全局颜色校正,将校正后图像输入到改进后CGAN网络模型中进行训练,之后将网络模型生成好的图像采取双边滤波处理,使处理后的图像拥有较好的视觉效果。同时使用L1与L2损失结合和焦点损失函数,用来解决图像颜色色差和样本不平衡问题。此方法可有效去除水下图像的颜色失真,消除图像模糊,获得了较好的图像增强效果。
2 相关理论
白平衡是相机领域一个非常重要的概念,可以解决一系列的颜色恢复和色调问题。白平衡是由电子图像通过再现真色而产生的。在专业成像领域,对白平衡的使用很早。能准确反映物体颜色状态的相机图像的获取有手动白平衡、自动白平衡等方法。动态阈值算法[
生成式对抗网络(GAN)是深度学习领域研究热点之一[
(1) |
式中:表示分布函数的期望值,真实数据为x,表示真实图像分布,表示定义在低维的噪声分布,为生成分布,为判别网络判断真实图像是否真实的概率[
图1 CGAN模型
Fig.1 CGAN model
残差网络(ResNet)是由Microsoft Research 4位专家提出的卷积神经网络[
3 本文方法
本文方法首先对水下图像使用动态阈值算法进行全局的颜色初步矫正,之后将处理后图像和正常图像输入到改进的条件生成对抗网络中进行训练,最后将训练好的图像进行双边滤波去噪处理,进而使网络中生成的图像更接近正常图像,拥有更好的视觉效果。本文方法整体流程如
图2 本文算法流程图
Fig.2 Algorithm flow chart of this paper
3.1 动态阈值算法
3.1.1 白点检测
将图像从RGB色彩空间转换到YCrCb色彩空间,并且对图像进行划分,各区域为100×100像素,之后计算各区域的Cb、Cr分量平均值Mb、Mr,然后使用如
(2) |
(3) |
其中N为每个区域的像素数。
若Db、Dr的值较小,则忽略此区域,因为此区域的颜色分布平均。统计其他区域的Mb、Mr、Db、Dr的平均值作为图像的Mb、Mr、Db、Dr值。使用
(4) |
(5) |
对于初步确定属于白色参照点的像素,按数值大小取亮度值前10%为最终的白色参照点。
3.1.2 白点调整
首先计算白色参考点亮度值的平均值分别为Raver、Gaver、Baver,使用公式(
(6) |
(7) |
(8) |
其中,Ymax为YCrCb色彩空间中Y分量在图像中的最大值。
(9) |
(10) |
(11) |
其中R、G、B为在原始的颜色空间中值。
经过动态阈值算法处理后的水下图像会在全局范围内进行颜色修正,如
图3 图像预处理。(a) 原始水下图像; (b) 动态阈值预处理后的水下图像。
Fig.3 Image pre-processing. (a) Original underwater image; (b) Underwater image after dynamic threshold pre-processing.
3.2 CGAN模型
本文受传统的CGAN模型的启发。由于随机噪声z作为生成网络输入会导致每次生成的图像有很大差异,因此本文将作为约束条件的随机噪声去除,将模型输入的条件信息y即原始的水下图像作为生成网络的唯一输入。本文的CGAN模型如
图4 本文CGAN模型
Fig.4 CGAN model of this paper
将正常的水下图像输入进生成网络,经过生成网络的增强输出生成图像。再将正常清晰的图像与生成的图像同时输入到判别网络中,由判别网络输出0~1的概率值,并且计算误差,更新参数。
3.2.1 生成网络
本文使用的生成网络在不丢失图像重要信息的前提下对图像进行增强。设计生成器时采用U-Net模型[
图5 生成器结构
Fig.5 Generator structure
生成器网络采用跳跃连接结构,将模型浅层与深层进行连接,对浅层与其对应的深层提取的特征进行融合。在编码过程中引入批处理归一化层和LeakyRelu激活函数。批处理归一化层旨在提高网络泛化能力,防止过拟合;LeakyRelu激活函数目的在于加速收敛。在解码过程中采用批处理归一化层和LeakyRelu激活函数的同时,加入Dropout操作[
3.2.2 判别网络
判别网络用以鉴别生成网络所生成的图像和正常清晰图像,最大程度地将生成图像与真实图像区分开来,同时判别图像真假。本文所使用的判别网络是一个5层卷积的二分类模型。在判别网络中同时引入LeakyRelu激活函数和批处理归一化层,目的就是加速收敛,控制过拟合。在进行5层卷积操作后通过sigmoid函数处理[
图6 判别器结构
Fig.6 Discriminator structure
3.3 损失函数
设和分别表示正常水下图像与对应清晰图像。CGAN使用目标函数训练,损失函数为
(12) |
式中:表示判别网络;表示生成器G增强后的图像。同时,为了保留结构并且矫正图像色彩与质量引入正则化与正则化结合得到,公式定义为
(13) |
(14) |
(15) |
式中:与表示总变差正则化;与表示内容方向的损失表示正则化权重[
由于样本类别不同,不同类别样本量不同,样本量少的类别很难从样本中提取规则。就算解决了样本的分类问题,也很容易发生有限的样本导致过拟合现象。由此采用焦点损失函数缓解样本不平衡性。函数定义为
(16) |
式中:表示交叉熵损失函数,表示权重因子,为调质因子。经过多次测试,在本算法中=2=0.25。
最后,将CGAN原始损失、损失以及焦点损失函数结合,得出本文生成对抗网络所使用的损失函数,定义为
(17) |
3.4 双边滤波去噪
为了获得更好的人眼视觉效果,本文对生成后的图像进行去噪操作。通过采用双边滤波算法对图像进行去噪可以获得良好的视觉体验。双边滤波是一种非线性的滤波方法,它是结合图像的空间邻近度和像素值相似度的一种折中处理,同时考虑空域信息和灰度相似性,达到保留边缘信息同时进行去噪的目的[
(18) |
式中:g(i,j)表示输出点,S(i, j)是指以(i,j)为圆心的(2N+1)(2N+1)大小范围,f(k,l)代表多个输出点,ω(i,j,k,l)代表经过两个高斯函数获得的值。如
图7 处理前(a)后(b)图片对比
Fig.7 Image comparison before (a) and after (b) processing
4 实验与分析
4.1 实验环境及参数设置
本实验在Pycharm仿真平台进行代码编写,CPU为AMD R5-3600,内存为16 GB,GPU为Nvidia 1 650 s。模型参数中epoch设置为200,batchsize值设置为1,优化算法选用Adam算法,学习率调整为0.000 2。编程语言上选用python语言,在Tensorflow深度学习框架下进行实验,网络训练时间约为36 h,测试时间约为5 min。
4.2 数据集使用
本实验所使用的数据集为UIEB[
4.3 实验结果对比
4.3.1 消融实验
双边滤波作为无监督的增强方法,可在一定程度上提高主观效果,但会牺牲客观评价指标,因此本文增加消融实验来验证双边滤波算法对客观评价指标的提高,实验结果见
Method | MSE(×103) | PSNR/dB | SSIM |
---|---|---|---|
Fusion-based | 1.128 0 | 17.607 7 | 0.772 1 |
Retinex-based | 1.292 4 | 17.016 8 | 0.607 1 |
Histogram Prior | 1.701 9 | 15.821 5 | 0.539 6 |
Blurriness-based | 1.911 1 | 15.318 0 | 0.602 9 |
GDCP | 4.016 0 | 12.092 9 | 0.512 1 |
消融实验 | 0.539 4 | 20.804 5 | 0.754 9 |
Ours | 0.526 0 | 22.008 5 | 0.797 1 |
4.3.2 主观评价
UIEB数据集中所包含图片是在不同的海水水压以及海水浑浊度中拍摄的。在损失函数中引入焦点损失函数是为了使处于不同水压和浑浊度中拍摄的图片在模型训练中不会发生过拟合现象。为验证本文方法的实际优化效果,我们将本文方法与Fusion-based、Retinex-based、Histogram prior、Blurriness-based、GDCP方法进行比较。从UIEB数据集中随机选取3张真实的水下图像进行增强,从主观评价上进行对比,如
图8 不同算法的主观对比
Fig.8 Subjective comparison of the different algorithms
从
5 结论
对于水下图像的颜色失真与模糊问题,本文利用深度学习原理,采用动态阈值、改进条件生成对抗网络与双边滤波算法三者相结合的方法对水下模糊图像进行增强。网络中采用U-Net结构,编码解码中引入链接块来对图像不同的相似特征进行组合,同时采用批处理归一化层和LeakyRelu激活函数来防止过拟合。在损失函数中加入L1与L2结合损失函数对颜色和结构进行恢复以及焦点噪声损失函数以消除类别不均衡的问题。通过对主观以及客观评价的分析,本文算法在进行水下原始图像增强的过程中,避免了颜色失真问题,同时也消除了图像的噪声影响,有效地对水下图像进行了增强。
- 我用了一个很复杂的图,帮你们解释下“23版最新北大核心目录有效期问题”。
- 重磅!CSSCI来源期刊(2023-2024版)最新期刊目录看点分析!全网首发!
- CSSCI官方早就公布了最新南核目录,有心的人已经拿到并且投入使用!附南核目录新增期刊!
- 北大核心期刊目录换届,我们应该熟知的10个知识点。
- 注意,最新期刊论文格式标准已发布,论文写作规则发生重大变化!文字版GB/T 7713.2—2022 学术论文编写规则
- 盘点那些评职称超管用的资源,1,3和5已经“绝种”了
- 职称话题| 为什么党校更认可省市级党报?是否有什么说据?还有哪些机构认可党报?
- 《农业经济》论文投稿解析,难度指数四颗星,附好发选题!
- 期刊知识:学位论文完成后是否可以拆分成期刊论文发表?
- 号外!出书的人注意啦:近期专著书号有空缺!!