基于低秩约束的熵加权多视角模糊聚类算法

作者：张嘉旭王骏张春香林得富周塔王士同来源：《自动化学报》日期：2022-08-26人气：342

随着多样化信息获取技术的发展, 人们可以从不同途径或不同角度来获取对象的特征数据, 即多视角数据. 多视角数据包含了同一对象不同角度的信息. 例如: 网页数据中既包含网页内容又包含网页链接信息; 视频内容中既包含视频信息又包含音频信息; 图像数据中既涉及颜色直方图特征、纹理特征等图像特征, 又涉及描述该图像内容的文本. 多视角学习能有效地对多视角数据进行融合, 避免了单视角数据数据信息单一的问题[1-4].

多视角模糊聚类是一种有效的无监督多视角学习方法[5-7]. 它通过在多视角聚类过程中引入各样本对不同类别的模糊隶属度来描述各视角下样本属于该类别的不确定性程度. 经典的工作有: 文献[8]以经典的单视角模糊C均值(Fuzzy C-means, FCM)算法作为基础模型, 利用不同视角间的互补信息确定协同聚类的准则, 提出了Co-FC (Collaborative fuzzy clustering)算法; 文献[9]参考文献[8]的协同思想提出Co-FKM (Multiview fuzzy clustering algorithm collaborative fuzzy K-means)算法, 引入双视角隶属度惩罚项, 构造了一种新型的无监督多视角协同学习方法; 文献[10]借鉴了Co-FKM和Co-FC所使用的双视角约束思想, 通过引入视角权重, 并采用集成策略来融合多视角的模糊隶属度矩阵, 提出了WV-Co-FCM (Weighted view colla-borative fuzzy C-means) 算法; 文献[11]通过最小化双视角下样本与聚类中心的欧氏距离来减小不同视角间的差异性, 基于K-means聚类框架提出了Co-K-means (Collaborative multi-view K-means clustering)算法; 在此基础上, 文献[12]提出了基于模糊划分的TW-Co-K-means (Two-level wei-ghted collaborative K-means for multi-view clustering)算法, 对Co-K-means算法中的双视角欧氏距离加入一致性权重, 获得了比Co-K-means更好的多视角聚类结果. 以上多视角聚类方法都基于成对视角来构造不同的正则化项来挖掘视角之间的一致性和差异性信息, 缺乏对多个视角的整体考虑.

一致性和差异性是设计多视角聚类算法需要考虑的两个重要原则[10-14]. 一致性是指在多视角聚类过程中, 各视角的聚类结果应该尽可能保持一致. 在设计多视角聚类算法时, 往往通过协同、集成等手段来构建全局划分矩阵, 从而得到最终的聚类结果[14-16]. 差异性是指多视角数据中的每个视角均反映了对象在不同方面的信息, 这些信息互为补充[10], 在设计多视角聚类算法时需要对这些信息进行充分融合. 综合考虑这两方面的因素, 本文拟提出新型的低秩约束熵加权多视角模糊聚类算法(Entropy-weighting multi-view fuzzy C-means with low rank constraint, LR-MVEWFCM), 其主要创新点可以概括为以下3个方面:

1)在模糊聚类框架下提出了面向视角一致性的低秩约束准则. 已有的多视角模糊聚类算法大多基于成对视角之间的两两关系来构造正则化项, 忽视了多个视角的整体一致性信息. 本文在模糊聚类框架下从视角全局一致性出发引入低秩约束正则化项, 从而得到新型的低秩约束多视角模糊聚类算法.

2) 在模糊聚类框架下同时考虑多视角聚类的一致性和差异性, 在引入低秩约束的同时进一步使用面向视角差异性的多视角香农熵加权策略; 在迭代优化的过程中, 通过动态调节视角权重系数来突出具有更好分离性的视角的权重, 从而提高聚类性能.

3)在模糊聚类框架下首次使用交替方向乘子法(Alternating direction method of multipliers, ADMM)[15]对LR-MVEWFCM算法进行优化求解.

在本文中, 令 $N$ 为样本总量, $D$ 为样本维度, $K$ 为视角数目, $C$ 为聚类数目, $m$ 为模糊指数. 设 $x_{j, k}$ 表示多视角场景中第 $j$ 个样本第 $k$ 个视角的特征向量, $j = 1, \dots, N$ , $k = 1, \dots, K$ ; $v_{i, k}$ 表示第 $k$ 个视角下, 第 $i$ 个聚类中心, $i = 1, \dots, C$ ; $U_{k} = [μ_{i j, k}]$ 表示第 $k$ 个视角下的模糊隶属度矩阵, 其中 $μ_{i j, k}$ 是第 $k$ 个视角下第 $j$ 个样本属于第 $i$ 个聚类中心的模糊隶属度, $i = 1, \dots, C$ , $j = 1, \dots, N .$

本文第1节在相关工作中回顾已有的经典模糊C均值聚类算法FCM模型[17]和多视角模糊聚类Co-FKM模型[9]; 第2节将低秩理论与多视角香农熵理论相结合, 提出本文的新方法; 第3节基于模拟数据集和UCI (University of California Irvine)数据集验证本文算法的有效性, 并给出实验分析; 第4节给出实验结论.

1. 相关工作

1.1 模糊C均值聚类算法FCM

设单视角环境下样本 $x_{1}, \dots, x_{N} \in R^{D}$ , $U = [μ_{i, j}]$ 是模糊划分矩阵, $V = [v_{1}, v_{2}, \dots, v_{C}]$ 是样本的聚类中心. FCM算法的目标函数可表示为

(1)

可得到 $J_{F C M}$ 取得局部极小值的必要条件为

v i = \sum j = 1 N ( μ i j ) m x j \sum j = 1 N ( μ i j ) m

(2)

μ i j = 1 \sum s = 1 c ( ∥ ∥ x j - v i ∥ ∥ 2 ∥ ∥ x j - v s ∥ ∥ 2 ) 1 m - 1

(3)

根据式(2)和式(3)进行迭代优化, 使目标函数收敛于局部极小点, 从而得到样本属于各聚类中心的模糊划分矩阵 $U$ .

1.2 多视角模糊聚类Co-FKM模型

在经典FCM算法的基础上, 文献[9]通过引入视角协同约束正则项, 对视角间的一致性信息加以约束, 提出了多视角模糊聚类Co-FKM模型.

多视角模糊聚类Co-FKM模型需要满足如下条件:

(4)

多视角模糊聚类Co-FKM模型的目标函数 $J_{C o - F K M}$ 定义为

(5)

(6)

式(5)中, $η$ 表示协同划分参数; $Δ$ 表示视角一致项, 由式(6)可知, 当各视角趋于一致时, $Δ$ 将趋于0.

迭代得到各视角的模糊隶属度 $μ_{i j, k}$ 后, 为了最终得到一个具有全局性的模糊隶属度划分矩阵, Co-FKM算法对各视角下的模糊隶属度采用几何平均的方法, 得到数据集的整体划分, 具体形式为

(7)

其中, ${\hat{μ}}_{i j}$ 为全局模糊划分结果.

2. 基于低秩约束的熵加权多视角模糊聚类算法

针对当前多视角模糊聚类算法研究中存在的不足, 本文提出一种基于低秩约束的熵加权多视角模糊聚类新方法LR-MVEWFCM. 一方面通过向多视角模糊聚类算法的目标学习准则中引入低秩约束项, 在整体上控制聚类过程中各视角的一致性; 另一方面基于香农熵理论, 通过熵加权机制来控制各视角之间的差异性. 同时使用交替方向乘子法对模型进行优化求解.

设多视角隶属度 $U_{1}, \dots, U_{K}$ 融合为一个整体的隶属度矩阵 $U$ , 将矩阵 $U$ 的秩函数凸松弛为核范数, 通过对矩阵 $U$ 进行低秩约束, 可以将多视角数据之间的一致性问题转化为核范数最小化问题进行求解, 具体定义为

(8)

其中, $U = [U_{1} \dots U_{K}]^{T}$ 表示全局划分矩阵, ${‖ \cdot ‖}_{*}$ 表示核范数. 式(8)的优化过程保证了全局划分矩阵的低秩约束. 低秩约束的引入, 可以弥补当前大多数多视角聚类算法仅能基于成对视角构建约束的缺陷, 从而更好地挖掘多视角数据中包含的全局一致性信息.

目前已有的多视角的聚类算法在处理多视角数据时, 通常默认每个视角平等共享聚类结果[11], 但实际上某些视角的数据往往因空间分布重叠而导致可分性较差. 为避免此类视角的数据过多影响聚类效果, 本文拟对各视角进行加权处理, 并构建香农熵正则项从而在聚类过程中有效地调节各视角之间的权重, 使得具有较好可分离性的视角的权重系数尽可能大, 以达到更好的聚类效果.

令视角权重系数 $\sum_{k = 1}^{K} w_{k} = 1$ 且 $w_{k} \geq 0$ , 则香农熵正则项表示为

(9)

综上所述, 本文作如下改进: 首先, 用本文提出的低秩约束全局模糊隶属度矩阵 $U$ ; 其次, 计算损失函数时考虑视角权重 $w_{k}$ , 并加入视角权重系数的香农熵正则项. 设 $U = [U_{1} \dots U_{K}]^{T}$ ; $w w = [w_{1}, \dots, w_{k}, \dots, w_{K}]$ 表示 $K$ 个视角下的视角权重. 本文所构建LR-MVEWFCM的目标函数为

(10)

其中, 约束条件为

(11)

本文取模糊指数 $m = 2$ .

2.1 基于ADMM的求解算法

在本节中, 我们将使用ADMM方法, 通过交替方向迭代的策略来实现目标函数 $(11)$ 的最小化.

(12)

(13)

最小化式 $(10)$ 可改写为如下约束优化问题:

(14)

其求解过程可分解为如下几个子问题:

1) $V$ -子问题. 固定 $w$ 和 $U$ , 更新 $V$ 为

(15)

通过最小化式 $(15)$ , 可得到 $v_{i, k}^{(t + 1)}$ 的闭合解为

(16)

2) $U$ -子问题. 固定 $w$ , $Q$ 和 $Z$ , 更新 $U$ 为

(17)

通过最小化式 $(17)$ , 可得到 $U^{(t + 1)}$ 的封闭解为

(18)

3) $w$ -子问题. 固定 $V$ 和 $U$ , 更新 $w$ 为

(19)

4) $Z$ -子问题. 固定 $Q$ 和 $U$ , 更新 $Z$ 为

(20)

通过引入软阈值算子, 可得式 $(20)$ 的解为

(21)

其中, $U^{(t + 1)} + Q^{(t)} = A {Σ B}^{T}$ 为矩阵 $U^{(t + 1)} + Q^{(t)}$ 的奇异值分解, 核范数的近邻算子可由软阈值算子 $S_{θ / ρ} (Σ) = d i a g ({max (0, σ_{i} - θ / ρ)}) (i = 1, 2, \dots, N)$ 给出.

5) $Q$ -子问题. 固定 $Z$ 和 $U$ , 更新 $Q$ 为

(22)

经过上述迭代过程, 目标函数收敛于局部极值, 同时得到不同视角下的模糊隶属度矩阵. 本文借鉴文献[10]的集成策略, 使用视角权重系数 $w =$ $[w_{1}, \dots, w_{k}, \dots, w_{K}]$ 和模糊隶属度矩阵 $U$ 来构建具有全局特性的模糊空间划分矩阵 $\tilde{U}$ :

(23)

其中, $w_{k}$ , $U_{k}$ 分别表示第 $k$ 个视角的视角权重系数和相应的模糊隶属度矩阵.

LR-MVEWFCM算法描述如下:

输入. 包含 $K (1 \leq k \leq K)$ 个视角的多视角样本集, 其中任意一个视角对应样本集 $X_{k} = {x_{1, k}, \dots, x_{N, k}}$ , 聚类中心 $C$ , 迭代阈值 $ϵ$ , 最大迭代次数 $T$ ;

输出. 各视角聚类中心 $v_{i, k}^{(t)}$ , 模糊空间划分矩阵 $\tilde{U}$ 和各视角权重 $w_{k}$ ;

步骤1. 随机初始化 $V^{(t)}$ , 归一化 $U^{(t)}$ 及 $w^{(t)}$ , $t = 0$ ;

步骤2. 根据式 $(21)$ 更新 $v_{i, k}^{(t + 1)}$ ;

步骤3. 根据式 $(23)$ 更新 $U^{(t + 1)}$ ;

步骤4. 根据式 $(24)$ 更新 $w_{k}^{(t + 1)}$ ;

步骤5. 根据式 $(26)$ 更新 $Z^{(t + 1)}$ ;

步骤6. 根据式 $(27)$ 更新 $Q^{(t + 1)}$ ;

步骤7. 如果 $‖ L^{(t + 1)} - L^{(t)} ‖ < ϵ$ 或者 $t > T$ , 则算法结束并跳出循环, 否则, 返回步骤2;

步骤8. 根据步骤7所获取的各视角权重 $w_{k}$ 及各视角下的模糊隶属度 $U_{k}$ , 使用式 $(23)$ 计算 $\tilde{U}$ .

2.2 讨论

2.2.1 与低秩约束算法比较

近年来, 基于低秩约束的机器学习模型得到了广泛的研究. 经典工作包括文献[16]中提出LRR (Low rank representation)模型, 将矩阵的秩函数凸松弛为核范数, 通过求解核范数最小化问题, 求得基于低秩表示的亲和矩阵; 文献[14]提出低秩张量多视角子空间聚类算法(Low-rank tensor constrained multiview subspace clustering, LT-MSC), 在各视角间求出带有低秩约束的子空间表示矩阵; 文献 [18] 则进一步将低秩约束引入多模型子空间聚类算法中, 使算法模型取得了较好的性能. 本文将低秩约束与多视角模糊聚类框架相结合, 提出了LR-MVEWFCM算法, 用低秩约束来实现多视角数据间的一致性. 本文方法可作为低秩模型在多视角模糊聚类领域的重要拓展.

2.2.2 与多视角Co-FKM算法比较

图1和图2分别给出了多视角Co-FKM算法和本文LR-MVEWFCM算法的工作流程.

图 1 Co-FKM算法处理多视角聚类任务工作流程

Fig. 1 Co-FKM algorithm for multi-view clustering task

图 2 LR-MVEWFCM算法处理多视角聚类任务工作流程

Fig. 2 LR-MVEWFCM algorithm for multi-view clustering task

本文算法与经典的多视角Co-FKM算法在多视角信息的一致性约束和多视角聚类结果的集成策略上均有所不同. 在多视角信息的一致性约束方面, 本文将Co-FKM算法中的视角间两两约束进一步扩展到多视角全局一致性约束; 在多视角聚类结果的集成策略上, 本文不同于Co-FKM算法对隶属度矩阵简单地求几何平均值的方式, 而是将各视角隶属度与视角权重相结合, 构建具有视角差异性的集成决策函数.

3. 实验与分析

3.1 实验设置

本文采用模拟数据集和UCI中的真实数据集进行实验验证, 选取FCM[17]、CombKM[19]、Co-FKM[9]和Co-Clustering[20]这4个聚类算法作为对比算法, 参数设置如表1所示. 实验环境为: Intel Core i5-7400 CPU, 其主频为2.3 GHz, 内存为8 GB. 编程环境为MATLAB 2015b.

表 1 参数定义和设置

Table 1 Parameter setting in the experiments

算法	算法说明	参数设置
FCM	经典的单视角模糊聚类算法	模糊指数 $m = \frac{min (N, D - 1)}{min (N, D - 1) - 2}$ , 其中, $N$ 表示样本数, $D$ 表示样本维数
CombKM	组合 $K - m e a n s$ 算法	—
Co-FKM	多视角协同划分的模糊聚类算法	模糊指数 $m = \frac{min (N, D - 1)}{min (N, D - 1) - 2}$ , 协同学习系数 $η \in \frac{K - 1}{K}$ , 其中, $K$ 为视角数, 步长 $ρ = 0.01$
Co-Clustering	基于样本与特征空间的协同聚类算法	正则化系数 $λ \in {10^{- 3}, 10^{- 2}, \dots, 10^{3}}$ , 正则化系数 $μ \in {10^{- 3}, 10^{- 2}, \dots, 10^{3}}$
LR-MVEWFCM	基于低秩约束的熵加权多视角模糊聚类算法	视角权重平衡因子 $λ \in {10^{- 5}, 10^{- 4}, \dots, 10^{5}}$ , 低秩约束正则项系数 $θ \in {10^{- 3}, 10^{- 2}, \dots, 10^{3}}$ , 模糊指数 $m = 2$
MVEWFCM	LR-MVEWFCM 算法中低秩约束正则项系数 $θ = 0$	视角权重平衡因子 $λ \in {10^{- 5}, 10^{- 4}, \dots, 10^{5}}$ , 模糊指数 $m = 2$

本文采用如下两个性能指标对各算法所得结果进行评估.

1) 归一化互信息(Normalized mutual information, NMI)[10]

(24)

其中, $N_{i, j}$ 表示第 $i$ 类与第 $j$ 类的契合程度, $N_{i}$ 表示第 $i$ 类中所属样本量, $N_{j}$ 表示第 $j$ 类中所属样本量, 而 $N$ 表示数据的样本总量;

2) 芮氏指标(Rand index, RI)[10]

(25)

其中, $f_{00}$ 表示具有不同类标签且属于不同类的数据配对点数目, $f_{11}$ 则表示具有相同类标签且属于同一类的数据配对点数目, $N$ 表示数据的样本总量. 以上两个指标的取值范围介于 $[0, 1]$ 之间, 数值越接近1, 说明算法的聚类性能越好. 为了验证算法的鲁棒性, 各表中统计的性能指标值均为算法10次运行结果的平均值.

3.2 模拟数据集实验

为了评估本文算法在多视角数据集上的聚类效果, 使用文献[10]的方法来构造具有三维特性的模拟数据集A( $x, y, z$ ), 其具体生成过程为: 首先在MATLAB环境下采用正态分布随机函数normrnd构建数据子集 $A_{1}$ ( $x, y, z$ ), $A_{2}$ ( $x, y, z$ )和 $A_{3}$ ( $x, y, z$ ), 每组对应一个类簇, 数据均包含200个样本. 其中第1组与第2组数据集在特征z上数值较为接近, 第2组与第3组数据集在特征x上较为接近; 然后将3组数据合并得到集合A( $x, y, z$ ), 共计600个样本; 最后对数据集内的样本进行归一化处理. 我们进一步将特征x, y, z按表2的方式两两组合, 从而得到多视角数据.

表 2 模拟数据集特征组成

Table 2 Characteristic composition of simulated dataset

视角	包含特征
视角 1	$x, y$
视角 2	$y, z$
视角 3	$x, z$

将各视角下的样本可视化, 如图3所示.

图 3 模拟数据集及各视角数据集

Fig. 3 Simulated data under multiple views

通过观察图3可以发现, 视角1中的数据集在空间分布上具有良好的可分性, 而视角2和视角3的数据在空间分布上均存在着一定的重叠, 从而影响了所在视角下的聚类性能. 通过组合不同视角生成若干新的数据集, 如表3所示, 并给出了LR-MVEWFCM重复运行10次后的平均结果和方差.

表 3 模拟数据实验算法性能对比

Table 3 Performance comparison of the proposed algorithms on simulated dataset

编号	包含特征	NMI	RI
1	视角1	1.0000 ± 0.0000	1.0000 ± 0.0000
2	视角2	0.7453 ± 0.0075	0.8796 ± 0.0081
3	视角3	0.8750 ± 0.0081	0.9555 ± 0.0006
4	视角1, 视角2	1.0000 ± 0.0000	1.0000 ± 0.0000
5	视角1, 视角3	1.0000 ± 0.0000	1.0000 ± 0.0000
6	视角2, 视角3	0.9104 ± 0.0396	0.9634 ± 0.0192
7	视角2, 视角3	1.0000 ± 0.0000	1.0000 ± 0.0000

对比LR-MVEWFCM在数据集1~3上的性能, 我们发现本文算法在视角1上取得了最为理想的效果, 在视角3上的性能要优于视角2, 这与图3中各视角数据的空间可分性是一致的. 此外, 将各视角数据两两组合构成新数据集4~6后, LR-MVEWFCM算法都得到了比单一视角更好的聚类效果, 这都说明了本文采用低秩约束来挖掘多视角数据中一致性的方法, 能够有效提高聚类性能.

基于多视角数据集7, 我们进一步给出本文算法与其他经典聚类算法的比较结果.

从表4中可以发现, 由于模拟数据集在某些特征空间下具有良好的空间可分性, 所以无论是本文的算法还是Co-Clustering算法、FCM算法等算法均取得了很好的聚类效果, 而CombKM算法的性能较之以上算法则略有不足, 分析其原因在于CombKM算法侧重于挖掘样本之间的信息, 却忽视了多视角之间的协作, 而本文算法通过使用低秩约束进一步挖掘了多视角之间的全局一致性, 因而得到了比CombKM算法更好的聚类效果.

表 4 模拟数据集7上各算法的性能比较

Table 4 Performance comparison of the proposed algorithms on simulated dataset 7

数据集	指标	Co-Clustering	CombKM	FCM	Co-FKM	LR-MVEWFCM
A	NMI-mean	1.0000	0.9305	1.0000	1.0000	1.0000
	NMI-std	0.0000	0.1464	0.0000	0.0000	0.0000
	RI-mean	1.0000	0.9445	1.0000	1.0000	1.0000
	RI-std	0.0000	0.1171	0.0000	0.0000	0.0000

3.3 真实数据集实验

本节采用5个UCI数据集: 1) Iris数据集; 2) Image Segmentation (IS) 数据集; 3) Balance数据集; 4) Ionosphere数据集; 5) Wine数据集来进行实验. 由于这几个数据集均包含了不同类型的特征, 所以可以将这些特征进行重新分组从而构造相应的多视角数据集. 表5给出了分组后的相关信息.

表 5 基于UCI数据集构造的多视角数据

Table 5 Multi-view data constructded based on UCI dataset

编号	原数据集	说明	视角特征	样本	视角	类别
8	IS	Shape	9	2 310	2	7
8	IS	RGB	9	2 310	2	7
9	Iris	Sepal长度	2	150	2	3
		Sepal宽度	2
		Petal长度	2
		Petal宽度	2
10	Balance	天平左臂重量	2	625	2	3
		天平左臂长度	2
		天平右臂重量	2
		天平右臂长度	2
11	Iris	Sepal长度	1	150	4	3
		Sepal宽度	1
		Petal长度	1
		Petal宽度	1
12	Balance	天平左臂重量	1	625	4	3
		天平左臂长度	1
		天平右臂重量	1
		天平右臂长度	1
13	Ionosphere	每个特征单独作为一个视角	1	351	34	2
14	Wine	每个特征单独作为一个视角	1	178	13	3

我们在多视角数据集上运行各多视角聚类算法; 同时在原数据集上运行FCM算法. 相关结果统计见表6和表7.

表 6 5种聚类方法的NMI值比较结果

Table 6 Comparison of NMI performance of five clustering methods

编号	Co-Clustering		CombKM		FCM		Co-FKM		LR-MVEWFCM
编号	均值	P-value	均值	P-value	均值	P-value	均值	P-value	均值
8	0.5771 ± 0.0023	0.0019	0.5259 ± 0.0551	0.2056	0.5567 ± 0.0184	0.0044	0.5881 ± 0.0109	3.76×10−4	0.5828 ± 0.0044
9	0.7582 ± 7.4015 ×10−17	2.03×10−24	0.7251 ± 0.0698	2.32×10−7	0.7578 ± 0.0698	1.93×10−24	0.8317 ± 0.0064	8.88×10−16	0.9029 ± 0.0057
10	0.2455 ± 0.0559	0.0165	0.1562 ± 0.0749	3.47×10−5	0.1813 ± 0.1172	0.0061	0.2756 ± 0.0309	0.1037	0.3030 ± 0.0402
11	0.7582 ± 1.1703×10−16	2.28×10−16	0.7468 ± 0.0079	5.12×10−16	0.7578 ± 1.1703×10−16	5.04×10−16	0.8244 ± 1.1102×10−16	2.16×10−16	0.8768 ± 0.0097
12	0.2603 ± 0.0685	0.3825	0.1543 ± 0.0763	4.61×10−4	0.2264 ± 0.1127	0.1573	0.2283 ± 0.0294	0.0146	0.2863 ± 0.0611
13	0.1385 ± 0.0085	2.51×10−9	0.1349 ± 2.9257×10−17	2.35×10−13	0.1299 ± 0.0984	2.60×10−10	0.2097 ± 0.0329	0.0483	0.2608 ± 0.0251
14	0.4288 ± 1.1703×10−16	1.26×10−08	0.4215 ± 0.0095	7.97×10−09	0.4334 ± 5.8514×10−17	2.39×10−08	0.5295 ± 0.0301	0.4376	0.5413 ± 0.0364

通过观察表6和表7中的 $N M I$ 和 $R I$ 指标值可知, Co-FKM算法的聚类性能明显优于其他几种经典聚类算法, 而相比于Co-FKM算法, 由于LR-MVEWFCM采用了低秩正则项来挖掘多视角数据之间的一致性关系, 并引入多视角自适应熵加权策略, 从而有效控制各视角之间的差异性. 很明显, 这种聚类性能更为优异和稳定, 且收敛性的效果更好. 表6和表7中的结果也展示了在IS、Balance、Iris、Ionosphere和Wine数据集上, 其NMI和RI指标均提升3 ~ 5个百分点, 这也说明了本文算法在多视角聚类过程中的有效性.

表 7 5种聚类方法的RI值比较结果

Table 7 Comparison of RI performance of five clustering methods

编号	Co-Clustering		CombKM		FCM		Co-FKM		LR-MVEWFCM
编号	均值	P-value	均值	P-value	均值	P-value	均值	P-value	均值
8	0.8392 ± 0.0010	1.3475 ×10−14	0.8112 ± 0.0369	1.95×10−7	0.8390 ± 0.0115	0.0032	0.8571 ± 0.0019	0.0048	0.8508 ± 0.0013
9	0.8797 ± 0.0014	1.72×10−26	0.8481 ± 0.0667	2.56×10−5	0.8859 ± 1.1703×10−16	6.49×10−26	0.9358 ± 0.0037	3.29×10−14	0.9665 ± 0.0026
10	0.6515 ± 0.0231	3.13×10−4	0.6059 ± 0.0340	1.37×10−6	0.6186 ± 0.0624	0.0016	0.6772 ± 0.0227	0.0761	0.6958 ± 0.0215
11	0.8797 ± 0.0014	1.25×10−18	0.8755 ± 0.0029	5.99×10−12	0.8859 ± 0.0243	2.33×10−18	0.9267 ± 2.3406×10−16	5.19×10−18	0.9527 ± 0.0041
12	0.6511 ± 0.0279	0.0156	0.6024 ± 0.0322	2.24×10−5	0.6509 ± 0.0652	0.1139	0.6511 ± 0.0189	0.008	0.6902 ± 0.0370
13	0.5877 ± 0.0030	1.35×10−12	0.5888 ± 0.0292	2.10×10−14	0.5818 ± 1.1703×10−16	4.6351 ×10−13	0.6508 ± 0.0147	0.0358	0.6855 ± 0.0115
14	0.7187 ± 1.1703×10−16	3.82×10−6	0.7056 ± 0.0168	1.69×10−6	0.7099 ± 1.1703×10−16	8.45×10−7	0.7850 ± 0.0162	0.5905	0.7917 ± 0.0353

为进一步说明本文低秩约束发挥的积极作用, 将LR-MVEWFCM算法和MVEWFCM算法共同进行实验, 算法的性能对比如图4所示.

图 4 低秩约束对算法性能的影响(横坐标为数据集编号, 纵坐标为聚类性能指标)

Fig. 4 The influence of low rank constraints on the performance of the algorithm (the X-coordinate is the data set number and the Y-coordinate is the clustering performance index)

从图4中不难发现, 无论在模拟数据集上还是UCI真实数据集上, 相比较MVEWFCM算法, LR-MVEWFCM算法均可以取得更好的聚类效果. 因此可见, LR-MVEWFCM目标学习准则中的低秩约束能够有效利用多视角数据的一致性来提高算法的聚类性能.

为研究本文算法的收敛性, 同样选取8个数据集进行收敛性实验, 其目标函数变化如图5所示.

图 5 LR-MVEWFCM算法的收敛曲线

Fig. 5 Convergence curve of LR-MVEWFCM algorithm

从图5中可以看出, 本文算法在真实数据集上仅需迭代15次左右就可以趋于稳定, 这说明本文算法在速度要求较高的场景下具有较好的实用性.

综合以上实验结果, 我们不难发现, 在具有多视角特性的数据集上进行模糊聚类分析时, 多视角模糊聚类算法通常比传统单视角模糊聚类算法能够得到更优的聚类效果; 在本文中, 通过在多视角模糊聚类学习中引入低秩约束来增强不同视角之间的一致性关系, 并引入香农熵调节视角权重关系, 控制不同视角之间的差异性, 从而得到了比其他多视角聚类算法更好的聚类效果.

3.4 参数敏感性实验

LR-MVEWFCM算法包含两个正则项系数, 即视角权重平衡因子 $λ$ 和低秩约束正则项系数 $θ$ , 图6以LR-MVEWFCM算法在模拟数据集7上的实验为例, 给出了系数从0到1000过程中, 算法性能的变化情况, 当低秩正则项系数 $θ$ = 0时, 即不添加此正则项, 算法的性能最差, 验证了本文加入的低秩正则项的有效性, 当 $θ$ 值变化过程中, 算法的性能相对变化较小, 说明本文算法在此数据集上对于 $θ$ 值变化不敏感, 具有一定的鲁棒性; 而当香农熵正则项系数 $λ$ = 0时, 同样算法性能较差, 也说明引入此正则项的合理性. 当 $λ$ 值变大时, 发现算法的性能也呈现变好趋势, 说明在此数据集上, 此正则项相对效果比较明显.

图 6 模拟数据集7上参数敏感性分析

Fig. 6 Sensitivity analysis of parameters on simulated dataset 7

4. 结束语

本文从多视角聚类学习过程中的一致性和差异性两方面出发, 提出了基于低秩约束的熵加权多视角模糊聚类算法. 该算法采用低秩正则项来挖掘多视角数据之间的一致性关系, 并引入多视角自适应熵加权策略从而有效控制各视角之间的差异性,从而提高了算法的性能. 在模拟数据集和真实数据集上的实验均表明, 本文算法的聚类性能优于其他多视角聚类算法. 同时本文算法还具有迭代次数少、收敛速度快的优点, 具有良好的实用性. 由于本文采用经典的FCM框架, 使用欧氏距离来衡量数据对象之间的差异,这使得本文算法不适用于某些高维数据场景. 如何针对高维数据设计多视角聚类算法, 这也将是我们今后的研究重点.

关键字：优秀论文

上一篇：污水处理过程递推双线性子空间建模及无模型自适应控制
下一篇：β-淀粉样蛋白的聚集及其调控

栏目分类

热门排行

推荐信息

期刊知识