改进的CycleGAN网络用于水下显微图像颜色校正
深海热液矿床富含锰、铜、镍和钴等元素,是一种具有潜在开发价值的矿产资源,热液中的微生物在矿物沉积和结核生成过程中发挥了重要作用[
现阶段关于水下图像的质量复原研究,主要采用机器学习的方法。Zhang等人[
对于水下显微图像,由于其具有更高的分辨率以及更低的像素差异度,一般的算法较难获得很好的处理效果。因此,本文提出一种改进的循环一致性生成对抗网络(Cycle-consistent Adversarial Network, CycleGAN)对水下显微成像系统拍摄的大量水下目标物的数据集进行训练处理,所获结果在水下目标物显微图像的颜色校正方面能得到广泛的应用。
2 改进的CycleGAN
2.1 CycleGAN
CycleGAN[
图1 循环一致性对抗网络结构
Fig.1 Structure of cycle-consistent adversarial network
以
(1) |
其中,X,Y分别代表源域和目标域,x∊X,y∊Y,Pdata(x)为源域X的数据分布,Pdata(y)为目标域Y的数据分布,代表y服从Pdata(y)的情况下求期望,代表x服从Pdata(x)的情况下求期望。
同样,生成器F和判别器DX之间的损失函数可以表达成如下形式[
(2) |
为避免源域X中部分图像映射为目标域Y中同一图像的情况发生,CycleGAN引入循环一致性损失(Cycle-Consistency Loss)函数用于计算x和x̃之间的损失。利用F(G(x))≈y和G(F(x))≈x定义循环一致性损失Lcyc如
(3) |
2.2 引入结构相似性损失函数
通常自然图像是高度结构化的,降质的水下图像的像素与空气中标准图像的像素之间存在很强的相关性。特别是在空间环境相似的情况下,这些相关性携带着视觉场景中物体结构的重要信息。文献[
(4) |
其中:μx为x的均值,μy为y的均值,σxy为x,y的协方差,σx2为x的方差,σy2为y的方差,c1,c2为常数。
文献[
受此启发,本文使用的SSIM损失函数只是限制输入的原始水下降质图像X和重构的水下图像在颜色和边缘纹理结构上保持一致性。所以,在彩色图像X和的R、G、B三个通道上分别计算SSIM损失函数的值。然后将三个通道的SSIM值取平均值,得到最终的SSIM值。该改进可以加强对水下降质图像R、G、B三通道颜色的精准校正,进一步增强CycleGAN网络的性能,改进的网络结构如
图2 改进的循环一致对抗网络结构
Fig.2 Structure of improved cycle-consistent adversarial network
综上,输入图像X和重构图像之间的损失函数可被定义为:
(5) |
其中,
(6)
其中:N为一幅图像中像素个数,P为图像中心像素值。
改进后的CycleGAN网络总损失函数为对抗损失、循环一致损失、结构相似损失三部分的加权组合:
(7) |
这里将权重系数λ与β赋值为1。
2.3 网络结构和训练细节
经典的CycleGAN网络呈镜像结构,主要由两部分构成,每部分都是基于GAN的子网络。每个GAN网络的生成器均由编码器、转换器以及解码器构成。本文使用的生成器网络结构如
图3 生成器网络结构
Fig.3 Structure of generator network
本文中GAN网络的判别器采用原网络中70×70的PatchGAN[
图4 判别器网络结构
Fig.4 Structure of discriminator network
3 水下图像颜色恢复实验
本文模型训练使用计算机配置是CPU为Intel Xeon W-2123、3.60 GHz、RAM 16 GB、显卡为NVIDIA TITAN RTX,利用搭建的水下显微成像系统,采集了模拟水体下的自制标靶图像。训练数据集的数据量为550张512×512的模拟水体中自制标靶及矿石图像数据、550张512×512对应的空气中图像数据。优化器采用性能较好的Adam算法,学习率设置为0.000 2,迭代次数80,批次(batch size)为1。
3.1 水下显微成像系统
为研究水下显微成像过程及其影响因素,在显微成像的光学结构基础之上,搭建了如
图5 水下显微成像系统装置简图
Fig.5 Device diagram of underwater microscopic imaging system
图像采集模块主要采用了一台200万像素的彩色相机(BFLY-PGE-23S6C-C)对水下目标物进行高分辨率的彩色成像。照明模块由白色的环形LED光源及光源控制器构成,为水下显微成像提供所需的均匀照明环境。显微成像模块由显微物镜(5×)和管透镜(1×)组成,以实现对水下目标的显微成像,本文实验基于此套系统对水下目标物进行显微图像采集。
3.2 模拟水体及数据集制备
为了更好地模拟复杂海水环境以及悬浮颗粒对光的强散射与强吸收作用,文中在实验室条件下制备了模拟水体,即通过向清水中加入脱脂牛奶模拟海水的散射作用,脱脂牛奶主要含有酪蛋白分子,其平均直径在0.04~0.3 nm之间,可模拟瑞利散射的机制[
如
图6 典型的海水和蓝绿染料墨水的吸收光谱
Fig.6 Absorption spectra of typical seawater and blue-green dye inks
在样品的选择方面,由于天然岩石标本颜色种类单一,水下矿物样品难以获得,无法满足训练要求,为了增加训练神经网络的泛化能力。采用Photoshop软件中的颜色库PANTONE+Color Bridge Uncoated制作了颜色形状种类丰富的水下目标物标靶,并以此作为训练网络模型的训练数据集,部分自制标靶图像如
图7 部分自制标靶图像
Fig.7 Some self-made target images
4 结果分析与对比
4.1 实验结果主观分析
利用改进的CycleGAN算法对自制的水下目标物标靶数据集进行训练处理;同时,为了对比处理效果,本文采用传统图像处理方法中的带色彩恢复系数的多尺度Retinex算法(Multi Scale Retinex With Color Restoration,MSRCR)[
图8 不同算法处理水下自制标靶图像结果
Fig.8 Results of underwater self-made target images processed by different algorithms
从主观视觉角度可以看出,
本文利用训练好的改进CycleGAN网络对天然矿石的水下降质图像进行了处理。所选用天然矿石为斑点石(Dalmatian)、花绿石(Unakite)、图画石(Picture Jasper),这几种矿石的表面颜色和纹理均有较为明显的区别。通过对天然矿石特征区域的显微图像进行处理,得到如
图9 不同算法处理水下天然矿石图像结果对比
Fig.9 Comparison of underwater natural stone images processed by different algorithms
从以上处理结果可以看出,带色彩恢复系数的多尺度Retinex算法(MSRCR)处理后图像虽然亮度得到明显提升,但颜色恢复效果不佳。改进后的CycleGAN算法图像颜色恢复得更加自然真实,图像亮度有了很大改善,纹理边界更加清晰,颜色上也更加接近空气中的原图。
4.2 实验结果客观评价
为了更加客观地说明本文算法对水下显微图像处理的适用性和优越性,本文通过客观评价指标峰值信噪比(Peak Signal-to-Noise Ratio, PSNR)和SSIM[
要计算PSNR必须先计算当前图像和参考图像的均方误差(MSE)。假设两幅图像X和Y,他们的分辨率均为m×n,则它们的均方误差可以定义为:
(8) |
则峰值信噪比PSNR可通过MSE得出来:
(9) |
其中:MAXI代表图像像素点的最大值,MSE的值越小,PSNR越大,说明处理后图像的质量越好。
UCIQE是用CIELab空间的色度、饱和度、对比度三者的加权组合来评价图像质量,其定义为:
(10) |
其中:σc是色度的标准差,conl为对比度,μs是饱和度的平均值,c1,c2,c3是加权系数。
通过客观评价指标对水下目标物图像进行处理,得到如
Target | Image | PSNR | SSIM | UCIQE difference * |
---|---|---|---|---|
Self-made target | Image in air | - | - | 0 |
MSRCR | 15.582 3 | 0.568 2 | 0.137 5 | |
CycleGAN | 19.579 1 | 0.728 5 | 0.074 2 | |
Improved CycleGAN | 22.103 4 | 0.770 6 | 0.021 7 | |
Underwater stone | Image in air | - | - | 0 |
MSRCR | 15.112 0 | 0.399 4 | 0.102 6 | |
CycleGAN | 16.976 0 | 0.664 0 | 0.058 4 | |
Improved CycleGAN | 18.232 2 | 0.702 4 | 0.018 3 |
注: (*UCIQE difference is the difference between the UCIQE value of the standard image in the air and the processed image)
从
5 结 论
为解决水下显微图像颜色失真的问题,本文提出了一种改进的CycleGAN算法。通过在原始水下降质图像和重构水下图像之间加入R、G、B三个通道的SSIM损失函数,度量二者图像间的信息损失;并通过主观视觉感受和客观评价指标验证了改进算法对水下图像色彩恢复的有效性。结果表明,在强吸收与强散射混合水体中,自制标靶图像组中本文所提改进的CycleGAN算法处理后的效果表现良好,图像的PSNR、SSIM指标分别较改进前提高了12.89%和5.78%,较传统MSRCR提高了41.85%和35.62%,UCIQE也与空气中图像最为接近;水下岩石样品图像的PSNR、SSIM指标分别较改进前提高7.40%和5.78%,较传统MSRCR提高了20.65%和75.86%,达到对水下显微图像颜色校正的需求,为研究水下矿石表面微生物矿化过程和深海菌席的研究提供了技术支撑,有望在海洋地质和海洋生物学方面得到应用。
- 2025年中科院分区表已公布!Scientific Reports降至三区
- 官方认定!CSSCI南大核心首批191家“青年学者友好期刊名单”
- 2023JCR影响因子正式公布!
- 国内核心期刊分级情况概览及说明!本篇适用人群:需要发南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的学者
- 我用了一个很复杂的图,帮你们解释下“23版最新北大核心目录有效期问题”。
- 重磅!CSSCI来源期刊(2023-2024版)最新期刊目录看点分析!全网首发!
- CSSCI官方早就公布了最新南核目录,有心的人已经拿到并且投入使用!附南核目录新增期刊!
- 北大核心期刊目录换届,我们应该熟知的10个知识点。
- 注意,最新期刊论文格式标准已发布,论文写作规则发生重大变化!文字版GB/T 7713.2—2022 学术论文编写规则
- 盘点那些评职称超管用的资源,1,3和5已经“绝种”了