多图正则多核非负矩阵分解高光谱图像解混
高光谱图像[
早期高光谱解混算法主要采用线性混合模型(Linear Mixture Model, LMM),如基于几何的顶点成分分析法(Vertex Component Analysis, VCA)[
NMF是一种典型的线性解混算法,不适合提取数据的非线性混合结构[
在许多复杂自然场景中存在大量的非线性混合现象,如沙地和矿物混合区的密集混合现象,以及植被和建筑物覆盖区的多级混合现象。基于线性混合模型的线性解混算法不适合于非线性混合情况,所以,本文提出了一种非线性解混算法——多图正则多核非负矩阵分解(Multi-graph Regularized Multi-kernel Nonnegative Matrix Factorization,MGMKNMF),先使用多核函数构造适合于高光谱数据的核空间,然后在多核空间的基础上为目标函数添加多图正则项。本文提出的算法有以下两个优点:(1)与KNMF算法相比,MGMKNMF算法采用核函数权重将多个不同参数的高斯核函数联合起来,并在学习过程中不断更新核函数权重,避免了单核的唯一性,使构造的核空间更合适,也解决了多个高斯核函数权重选择困难的问题。(2)与GNMF和MGNMF算法相比,MGMKNMF算法是非线性方法,在多核空间构造多图,图权重将多个图拉普拉斯矩阵线性组合,并与丰度矩阵最终构成多核空间的多图正则项,且在学习过程中不断更新图权重。相比原空间的单图和多图,多核空间中的多图可更精确地刻画原始数据的非线性流形结构,更适合对真实场景中复杂的非线性光谱混合结构进行非线性解混。本文采用两个真实高光谱数据集Jasper Ridge和Cuprite,并采用广义双线性模型(GBM)[
2 相关工作
2.1 非负矩阵分解NMF
NMF可用于高光谱遥感影像的无监督解混。给定一个数据矩阵,其中X的每一列都是样本向量。NMF通过矩阵分解将原始高秩矩阵分解为两个低秩矩阵和的相乘,并加上非负的约束。
(1) |
非负矩阵分解的目标函数:
(2) |
其中:X是原始数据矩阵,在高光谱数据中,A和S分别代表端元矩阵与丰度矩阵。
2.2 图正则非负矩阵分解GNMF
NMF将非负矩阵X分解为基矩阵A和编码矩阵S的乘积,用于高光谱图像的无监督解混时,即将高光谱数据集X分解为端元矩阵A与丰度矩阵S的乘积。GNMF将图正则项添加到NMF的目标函数中,改善了未考虑数据流形结构所带来的问题。对有N个样本的数据集X构造一个K近邻图,图中顶点为X中各像素点。Nn为X中样本xn的K近邻集,将每个顶点xn与属于它的Nn连接,并定义图权重矩阵,原空间中顶点xn和xm间的权重越大,在子空间中的sn和sm距离也越近。通过权重矩阵W构造图正则项:
(3) |
其中:sn和sm为像元xn和xm在端元基向量上的编码向量,即丰度;为xn和xm间的权重;S为丰度矩阵;D为对角矩阵,;是图拉普拉斯矩阵;“tr(·)”表示矩阵的对角线元素之和。常用定义权重矩阵W的方法有:0-1加权、热核加权和点积加权等。
(4) |
其中:α为权重参数,GNMF求解约束最小化问题。
2.3 多图正则非负矩阵分解MGNMF
根据不同定义权重矩阵的模型,可计算相应的图权重矩阵和图拉普拉斯矩阵。MGNMF采用不同数量的最近邻构建图并进行加权,经过算法自动选择,得到最优多图正则项。若已知一组M种模型的图权重矩阵{W1,W2,…,WM}和相应的图拉普拉斯矩阵{L1,L2,…,LM},将这M个图权重矩阵线性组合,则相应的图拉普拉斯矩阵也进行相同的线性组合:
(5) |
其中,γm是第M个图权重矩阵和图拉普拉斯矩阵的权重。MGNMF为一组预先计算得到的候选图确定最佳的图权重,而不是先选最佳图矩阵模型并估计参数。MGNMF的多图正则项为:
(6) |
多图正则项比单图正则项更精准,GNMF的唯一权重不可靠。MGNMF无需选择唯一的图权重矩阵模型,且通过学习所得图权重向量对M个图拉普拉斯矩阵进行最优线性组合。
2.4 多核非负矩阵分解MKNMF
NMF是线性方法,不能很好地处理数据中的非线性结构,而KNMF通过核方法,将原始数据映射到高维核空间:,可以解决数据的非线性问题。核矩阵,。则在高维核空间,NMF可以表示为。其中A为端元矩阵,S为丰度矩阵。以核空间中样本作为基向量,得到端元矩阵,,P为端元个数,F矩阵包含核空间中所有样本对构造各端元的贡献,且,为矩阵F中第n行p列个元素,F矩阵中的第p列为核空间中所有样本对构造第p个端元的贡献。当核函数确定后,KNMF有唯一的核空间,这种选择核空间的方式并不准确。
MKNMF算法将L个不同核函数对应的核空间联合起来,以构造一个更合适的希尔伯特空间,这L个不同核空间对应的核矩阵为。核函数权重向量将这L个不同的核空间线性组合,组合后的多核核空间的核矩阵为:
(7) |
通过将学习好的参数带入上式,避免了不同核函数权重分配的问题;而多个核函数可构造出更适合原数据的核空间,比单核更可靠。将
(8) |
3 MGMKNMF
本文提出的MGMKNMF在多核空间构造多图,为更新多图,给定参数τ,用欧几里德距离的平方重新定义多核空间中xn的K近邻集:
(9) |
多核空间中的多图正则化项为:
(10) |
其中,是核空间中的图拉普拉斯矩阵。和MGNMF类似,为一组预先计算所得图拉普拉斯矩阵确定最佳权重,精准的多图正则项应用在多核空间将更加合理。
最终将
(11) |
多核空间可更好地挖掘数据间的非线性关系,在多核空间嵌入多图能更好地表达数据的非线性流形结构。
根据参考文献[
假设和分别是和的拉格朗日乘子,令,,则式(12)的拉格朗日函数为:
(13) |
(14) |
结合卡罗需-库恩-塔克(KKT)条件:,有:
(15) |
得到F和S的乘法更新法则分别为:
(16) |
(17) |
(18) |
其中,,。
(19) |
MGMKNMF解混算法总结如下:
4 实验结果与分析
将所提MGMKNMF算法与GNMF、npKNMF、KSNMF、KDP和MGKNMF解混算法进行对比,使用SAD和RMSE作为评估指标,采用HAPKE和GBM模拟数据,以及Cuprite和Jasper Ridge真实数据验证该算法的有效性。所有实验中,我们选择0-1加权图、热核加权图和点积加权图的图权重矩阵模型构成最终图正则项。多核函数选择高斯核函数,所选取的核参数为1/32,1/16,1/8,1/4,1/2,1,2,4,8,16,32以构成不同的核函数。各算法的迭代次数T均设置为200。
4.1 评价标准
SAD值反映了解混所得端元光谱与原端元光谱之间相似性,定义为,其中,a,b是两个端元光谱。
RMSE值反映解混所得丰度与实验室测量的实际丰度间的差别,定义为,其中,和分别是实际丰度和解混所得丰度。
4.2 模拟数据实验与分析
本文采用HAPKE和GBM两种非线性模型生成模拟数据集。HAPKE模型是一种紧密混合模型;GBM是一种双线性混合模型,是LMM线性结构与端元间的二次散射项的加权组合。本文从美国光谱库(USGS)随机选择6种地物光谱作为端元,如
图1 光谱库中随机生成的端元光谱
Fig.1 Endmember spectra randomly generated by spectrum library
4.3 模拟数据实验结果及分析
表
SNR/dB | NMF | GNMF | npKNMF | KSNMF | KDP | MGKNMF | MGMKNMF |
---|---|---|---|---|---|---|---|
10 | 0.494 8 | 0.456 7 | 0.170 2 | 0.169 3 | 0.167 1 | 0.190 1 | 0.213 3 |
20 | 0.382 9 | 0.309 4 | 0.164 8 | 0.160 4 | 0.154 3 | 0.157 6 | 0.154 1 |
30 | 0.341 7 | 0.296 0 | 0.162 1 | 0.153 1 | 0.148 2 | 0.129 4. | 0.124 8 |
40 | 0.308 4 | 0.251 9 | 0.159 6 | 0.149 2 | 0.142 7 | 0.146 6 | 0.137 5 |
SNR/dB | NMF | GNMF | npKNMF | KSNMF | KDP | MGKNMF | MGMKNMF |
---|---|---|---|---|---|---|---|
10 | 0.401 1 | 0.283 9 | 0.180 3 | 0.172 3 | 0.171 4 | 0.169 3 | 0.258 8 |
20 | 0.395 9 | 0.236 4 | 0.174 2 | 0.166 8 | 0.164 3 | 0.145 5 | 0.121 9 |
30 | 0.341 3 | 0.214 2 | 0.168 1 | 0.161 1 | 0.160 8 | 0.139 0 | 0.113 1 |
40 | 0.300 1 | 0.199 8 | 0.161 3 | 0.159 1 | 0.157 7 | 0.149 9 | 0.145 6 |
SNR/dB | NMF | GNMF | npKNMF | KSNMF | KDP | MGKNMF | MGMKNMF |
---|---|---|---|---|---|---|---|
10 | 0.185 0 | 0.186 9 | 0.079 2 | 0.068 9 | 0.067 2 | 0.099 0 | 0.091 0 |
20 | 0.162 4 | 0.183 9 | 0.076 9 | 0.063 7 | 0.061 1 | 0.061 8 | 0.060 1 |
30 | 0.149 5 | 0.180 1 | 0.071 3 | 0.058 7 | 0.058 0 | 0.052 3 | 0.049 0 |
40 | 0.129 9 | 0.178 3 | 0.066 2 | 0.052 3 | 0.051 8 | 0.051 5 | 0.050 6 |
SNR/dB | NMF | GNMF | npKNMF | KSNMF | KDP | MKGNMF | MGMKNMF |
---|---|---|---|---|---|---|---|
10 | 0.321 7 | 0.290 6 | 0.081 7 | 0.071 1 | 0.070 8 | 0.079 0 | 0.112 3 |
20 | 0.307 4 | 0.253 1 | 0.079 4 | 0.062 4 | 0.061 8 | 0.060 6 | 0.059 7 |
30 | 0.292 3 | 0.233 7 | 0.073 6 | 0.060 3 | 0.059 3 | 0.052 2 | 0.050 1 |
40 | 0.258 6 | 0.201 2 | 0.069 1 | 0.058 4 | 0.058 0 | 0.057 7 | 0.057 0 |
表
Endmember | NMF | GNMF | npKNMF | KSNMF | KDP | MGKNMF | MGMKNMF |
---|---|---|---|---|---|---|---|
P=6 | 0.308 4 | 0.281 7 | 0.159 6 | 0.149 0 | 0.142 2 | 0.145 7 | 0.141 1 |
P=5 | 0.251 0 | 0.218 7 | 0.124 0 | 0.118 2 | 0.107 7 | 0.096 8 | 0.081 4 |
P=4 | 0.198 5 | 0.195 4 | 0.100 4 | 0.089 8 | 0.081 2 | 0.080 2 | 0.078 9 |
P=3 | 0.172 9 | 0.143 8 | 0.073 5 | 0.068 2 | 0.060 0 | 0.044 3 | 0.034 3 |
Endmember | NMF | GNMF | npKNMF | KSNMF | KDP | MGKNMF | MGMKNMF |
---|---|---|---|---|---|---|---|
P=6 | 0.271 1 | 0.278 9 | 0.169 5 | 0.159 8 | 0.158 0 | 0.148 3 | 0.147 1 |
P=5 | 0.268 3 | 0.241 9 | 0.125 1 | 0.121 5 | 0.113 6 | 0.100 2 | 0.095 1 |
P=4 | 0.209 2 | 0.202 1 | 0.091 4 | 0.085 4 | 0.081 7 | 0.070 0 | 0.063 2 |
P=3 | 0.182 0 | 0.143 5 | 0.067 9 | 0.060 5 | 0.057 2 | 0.042 3 | 0.029 9 |
Endmember | NMF | GNMF | npKNMF | KSNMF | KDP | MGKNMF | MGMKNMF |
---|---|---|---|---|---|---|---|
P=6 | 0.189 9 | 0.176 4 | 0.084 1 | 0.068 1 | 0.066 9 | 0.060 3 | 0.059 4 |
P=5 | 0.175 3 | 0.162 1 | 0.078 3 | 0.062 3 | 0.061 1 | 0.060 1 | 0.056 3 |
P=4 | 0.151 5 | 0.160 1 | 0.074 5 | 0.058 9 | 0.057 4 | 0.054 7 | 0.052 3 |
P=3 | 0.203 0 | 0.157 7 | 0.066 2 | 0.055 3 | 0.051 8 | 0.051 4 | 0.050 8 |
Endmember | NMF | GNMF | npKNMF | KSNMF | KDP | MGKNMF | MGMKNMF |
---|---|---|---|---|---|---|---|
P=6 | 0.227 2 | 0.200 1 | 0.086 3 | 0.079 2 | 0.077 5 | 0.060 1 | 0.061 0 |
P=5 | 0.180 4 | 0.173 4 | 0.081 2 | 0.068 3 | 0.066 2 | 0,0 622 | 0.060 3 |
P=4 | 0.153 4 | 0.149 7 | 0.079 9 | 0.065 1 | 0.064 3 | 0.064 0 | 0.063 3 |
P=3 | 0.119 6 | 0.139 6 | 0.069 1 | 0.058 4 | 0.058 0 | 0.041 2 | 0.035 4 |
4.4 真实数据实验结果及分析
本文采用真实地物Cuprite和Jasper Ridge数据集对MGMKNMF的有效性进行验证,两个数据集均可以在https://rslab.ut.ac.ir/data中下载。
Cuprite是高光谱解混研究常用的数据集,包含美国内华州Cuprite矿区。在除去低信噪比和吸水通道后,留有188个通道可以使用。每张图像大小为250×191,共有12种类别。
Item | NMF | GNMF | npKNMF | KSNMF | KDP | MGKNMF | MGMKNMF |
---|---|---|---|---|---|---|---|
Alunite | 0.297 9 | 0.243 4 | 0.063 2 | 0.085 9 | 0.062 9 | 0.078 7 | 0.069 5 |
Andradite | 0.383 9 | 0.262 6 | 0.079 5 | 0.101 4 | 0.204 5 | 0.066 0 | 0.079 4 |
Buddingtonite | 0.367 2 | 0.266 6 | 0.079 6 | 0.073 7 | 0.116 1 | 0.088 5 | 0.119 6 |
Dumortierite | 0.283 9 | 0.574 3 | 0.156 2 | 0.071 7 | 0.071 2 | 0.084 8 | 0.082 9 |
Kaolinite_1 | 0.235 9 | 0.336 2 | 0.080 2 | 0.061 3 | 0.081 3 | 0.082 1 | 0.087 5 |
Kaolinite_2 | 0.309 5 | 0.344 3 | 0.262 2 | 0.189 0 | 0.114 0 | 0.056 5 | 0.073 3 |
Muscovite | 0.379 4 | 0.318 3 | 0.113 7 | 0.052 1 | 0.147 2 | 0.102 4 | 0.104 1 |
Montmorillonite | 0.473 1 | 0.355 7 | 0.131 0 | 0.140 2 | 0.107 0 | 0.054 5 | 0.055 6 |
Nontronite | 0.451 6 | 0.451 6 | 0.129 3 | 0.064 7 | 0.078 8 | 0.121 4 | 0.104 3 |
Pyrope | 0.292 7 | 0.455 0 | 0.054 1 | 0.142 0 | 0.074 5 | 0.117 8 | 0.065 5 |
Sphene | 0.282 1 | 0.287 9 | 0.091 3 | 0.279 8 | 0.097 6 | 0.201 5 | 0.197 1 |
Chalcedony | 0.318 6 | 0.318 6 | 0.213 2 | 0.149 5 | 0.132 7 | 0.071 5 | 0.065 9 |
Average | 0.339 6 | 0.337 1 | 0.120 8 | 0.117 6 | 0.107 8 | 0.093 8 | 0.092 1 |
图2 MGMKNMF算法在Cuprite数据上的丰度图
Fig.2 Abundance graphs of MGMKNMF algorithm on Cuprite
由于Jasper Ridge数据集太复杂无法处理,我们仅考虑100×100像素的子图像,子图像的第一个像素从原始图像中的第(105,269)像素开始,且去除了低噪声和水吸收波段,保留198个通道。所以,该高光谱遥感数据中只有树、水、土壤和道路这4类端元。
从
Item | NMF | GNMF | npKNMF | KSNMF | KDP | MGKNMF | MGMKNMF |
---|---|---|---|---|---|---|---|
Tree | 0.267 7 | 0.238 1 | 0.139 7 | 0.144 6 | 0.095 3 | 0.079 3 | 0.096 4 |
Water | 0.319 2 | 0.338 8 | 0.118 6 | 0.114 3 | 0.102 5 | 0.091 1 | 0.120 3 |
Soil | 0.428 9 | 0.081 9 | 0.131 7 | 0.105 3 | 0.123 7 | 0.124 2 | 0.097 1 |
Road | 0.410 8 | 0.309 3 | 0.127 2 | 0.094 2 | 0.086 9 | 0.097 4 | 0.074 1 |
Average | 0.356 6 | 0.242 0 | 0.129 3 | 0.114 6 | 0.102 1 | 0.098 0 | 0.097 0 |
图3 各算法在Jasper Ridge的丰度图
Fig.3 Abundance graphs of each algorithm on Jasper Ridge
从
5 结 论
本文提出了一种MGMKNMF高光谱非线性解混算法。该算法用多个核函数构造出了多核空间,且在学习过程中不断更新核函数权重,更有利于揭示原始数据的非线性结构;并在多核空间用图权重向量将多个图拉普拉斯矩阵线性组合,与丰度矩阵最终构成多核空间的多图正则项。相比单图正则项,多核空间的多图正则项将更加逼近原始数据的非线性流形结构。基于2个真实数据集和2个模拟数据集的实验结果表明,相比GNMF、npKNMF、KSNMF、MGKNMF和KDP算法,MGMKNMF算法确实是最优的,它更合适于复杂的高光谱数据。
- 2025年中科院分区表已公布!Scientific Reports降至三区
- 官方认定!CSSCI南大核心首批191家“青年学者友好期刊名单”
- 2023JCR影响因子正式公布!
- 国内核心期刊分级情况概览及说明!本篇适用人群:需要发南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的学者
- 我用了一个很复杂的图,帮你们解释下“23版最新北大核心目录有效期问题”。
- 重磅!CSSCI来源期刊(2023-2024版)最新期刊目录看点分析!全网首发!
- CSSCI官方早就公布了最新南核目录,有心的人已经拿到并且投入使用!附南核目录新增期刊!
- 北大核心期刊目录换届,我们应该熟知的10个知识点。
- 注意,最新期刊论文格式标准已发布,论文写作规则发生重大变化!文字版GB/T 7713.2—2022 学术论文编写规则
- 盘点那些评职称超管用的资源,1,3和5已经“绝种”了