多视图数据的一步聚类与双重表示学习方法
在现实世界的应用中,多视图数据(multi-view data)广泛存在。多视图数据指的是从多个来源或通过多种表示方式收集的数据,例如同一新闻故事的不同语言版本或通过不同医学检测手段获得的疾病数据。多视图学习(multi-view learning)是挖掘多视图数据的有效方法,而多视图聚类(multi-view clustering)作为多视图学习的重要组成部分,近年来受到越来越多的关注。然而,如何设计一种有效的多视图数据挖掘方法,并使其更具针对性,仍然是一个具有挑战性的任务。
传统多视图聚类方法主要分为两类:基于原始视图的方法(original views-based methods)和基于共同潜在视图的方法(common latent view-based methods)。前者通常通过扩展传统聚类算法(如K-means、模糊聚类或谱聚类)来处理多视图数据,而后者则通过表示学习技术(如自表示、矩阵分解和典型相关分析)来探索视图之间的共同潜在表示。然而,现有方法存在两个关键挑战:首先,多视图数据中既包含视图之间的一致性知识(consistent knowledge),也包含每个视图的独特知识(unique knowledge),但现有方法往往无法同时充分挖掘这两种知识。其次,大多数基于共同潜在视图的方法将表示学习与聚类分割分开进行,导致表示学习与聚类任务之间的互动不足,影响了聚类的效果。
针对这些问题,本文提出了一种新的基于双重表示学习(dual representation learning)的一步多视图聚类方法(one-step multi-view clustering),旨在同时挖掘视图之间的一致性知识和每个视图的独特知识,并将表示学习与聚类分割统一到一个框架中,以实现更高效的聚类性能。
论文来源
本文由Wei Zhang、Zhaohong Deng、Kup-Sze Choi、Jun Wang和Shitong Wang共同撰写。作者分别来自Nantong University、Jiangnan University、The Hong Kong Polytechnic University和Shanghai University。论文于2025年2月28日被接受,并发表在《Artificial Intelligence Review》期刊上,DOI为10.1007/s10462-025-11183-0。
研究内容与流程
1. 双重表示学习机制
本文提出了一种基于矩阵分解(matrix factorization)的双重表示学习机制,用于同时挖掘多视图数据中的一致性知识和独特知识。具体来说,对于给定的多视图数据集,假设一致性知识和独特知识是线性可分的,本文通过优化以下目标函数来学习共同表示和特定表示:
[ \min_{h, w_k, s_k, pk} \sum{k=1}^{K} |X_k - h^T w_k - s_k^T p_k|_F^2 + \gamma (|h^T|_F^2 + |s_k^T|_F^2) ]
其中,(h) 是视图之间的共同潜在表示,(s_k) 是第 (k) 个视图的特定表示,(w_k) 和 (p_k) 是映射矩阵,(\gamma) 是正则化参数。通过这一机制,本文能够同时学习到视图之间的一致性表示和每个视图的特定表示。
2. 一步多视图聚类框架
为了增强表示学习与聚类任务之间的相关性,本文提出了一种新颖的一步多视图聚类框架,将双重表示学习与聚类分割统一到一个优化框架中。具体来说,本文引入了一个最大熵机制(maximum entropy mechanism)和一个正交约束(orthogonal constraint)来进一步优化聚类性能。最终的目标函数如下:
[ \min_{h, w_k, s_k, p_k, u, v_k, \alphak} \sum{k=1}^{K} |X_k - h^T w_k - s_k^T p_k|_F^2 + \gamma (|h^T|_F^2 + |s_k^T|F^2) + \sum{k=1}^{K} \alpha_k |s_k - v_k u|F^2 + \alpha{K+1} |h - v_{K+1} u|F^2 + \beta \sum{k=1}^{K+1} |v_k^T v_k - I|F^2 - \delta \sum{k=1}^{K+1} \alpha_k \ln \alpha_k ]
其中,(u) 是聚类指示矩阵,(v_k) 是聚类中心矩阵,(\alpha_k) 是视图权重,(\beta) 和 (\delta) 是平衡参数。通过这一框架,本文实现了表示学习与聚类分割的相互促进,从而提高了聚类性能。
3. 优化过程
本文采用交替优化(alternating optimization)的方法来求解上述目标函数。具体来说,优化过程分为七个步骤,分别更新 (h)、(s_k)、(w_k)、(p_k)、(\alpha_k)、(v_k) 和 (u)。通过迭代更新这些变量,本文能够逐步优化聚类结果。
4. 实验结果与分析
本文在七个真实的多视图数据集上进行了广泛的实验,验证了所提出方法的有效性。实验结果表明,与现有的多视图聚类方法相比,本文提出的方法在大多数数据集上取得了最佳的聚类性能。具体来说,本文方法在归一化互信息(NMI)、准确率(ACC)、纯度(Purity)和调整兰德指数(ARI)等指标上均优于其他对比方法。
此外,本文还进行了消融实验(ablation study),分别验证了双重表示学习机制、一步学习机制和正则化项对聚类性能的贡献。实验结果表明,同时挖掘一致性知识和独特知识、将表示学习与聚类分割统一到一个框架中以及引入正则化项,均能显著提高聚类性能。
结论与意义
本文提出了一种基于双重表示学习的一步多视图聚类方法,旨在同时挖掘多视图数据中的一致性知识和独特知识,并将表示学习与聚类分割统一到一个框架中。通过引入最大熵机制和正交约束,本文进一步优化了聚类性能。实验结果表明,本文方法在多个真实数据集上均取得了优异的聚类效果,证明了其在实际应用中的有效性。
本文的主要贡献包括: 1. 提出了一种新的双重表示学习机制,能够同时挖掘视图之间的一致性知识和每个视图的独特知识。 2. 设计了一种新颖的一步多视图聚类框架,将双重表示学习与聚类分割统一到一个自适应框架中。 3. 在多个真实数据集上进行了广泛的实验,验证了所提出方法的高效性和有效性。
本文的研究为多视图聚类领域提供了新的思路和方法,具有重要的科学价值和应用前景。未来的研究可以进一步探索如何将本文方法应用于更复杂的多视图数据场景中,例如高维数据或非线性数据。
研究亮点
- 双重表示学习机制:本文首次提出了一种基于矩阵分解的双重表示学习机制,能够同时挖掘多视图数据中的一致性知识和独特知识。
- 一步聚类框架:本文设计了一种新颖的一步多视图聚类框架,将表示学习与聚类分割统一到一个优化框架中,实现了两者的相互促进。
- 最大熵与正交约束:本文引入了最大熵机制和正交约束,进一步优化了聚类性能,提高了模型的鲁棒性。
- 广泛的实验验证:本文在多个真实数据集上进行了广泛的实验,验证了所提出方法的高效性和有效性,为多视图聚类领域提供了新的研究思路。
通过本文的研究,多视图聚类领域在理论和应用层面都得到了进一步的推进,为未来的相关研究提供了重要的参考。