深度单类分类与异常检测方法的探讨

分享自：
深度单类分类与异常检测方法的探讨

期刊:Proceedings of the 35 th International Conference on Machine Learning
学术报告主要作者及研究机构这篇文章的主要作者是 Lukas Ruff, Robert A. Vandermeulen, Nico Görnitz, Lucas Deecke, Shoaib A. Siddiqui, Alexander Binder, Emmanuel Müller 和 Marius Kloft。他们分别隶属于以下机构：Hasso Plattner Institute（德国波茨坦）、TU Kaiserslautern（德国凯撒斯劳滕）、TU Berlin（德国柏林）、University of Edinburgh（英国爱丁堡）、German Research Center for Artificial Intelligence（德国凯撒斯劳滕）、Singapore University of Technology and Design（新加坡）。该研究发表于 Proceedings of the 35th International Conference on Machine Learning（ICML 2018），这是机器学习领域的重要会议之一。
学术背景本文聚焦于异常检测（Anomaly Detection, AD）这一机器学习中的核心问题。异常检测指的是在数据集中识别不寻常的样本，通常被视为一种无监督学习任务，其中异常样本在训练时并不被明确标注。从广义上看，这种技术被广泛应用于工业监控、网络安全入侵检测、欺诈检测和医疗诊断等领域。
目前，传统的异常检测方法如一类支持向量机（One-Class SVM, OC-SVM）和核密度估计（Kernel Density Estimation, KDE）通常在高维和复杂数据场景中表现有所不足，主要原因包括计算规模不佳以及维度灾难对模型的影响。而深度学习在特征自动化提取方面表现优异，特别是在计算机视觉任务中，这为异常检测提供了新的机会。然而，将深度学习的优势引入异常检测领域的挑战在于，难以设计出有效的无监督深度学习目标函数。现有的深度学习异常检测研究常依赖于重建误差等启发式方法，没有直接优化与异常检测相关的目标函数。
基于这一背景，本文提出了一种全新的激励于一类分类（One-Class Classification）和最小体积估计（Minimum Volume Estimation）的深度学习方法——Deep Support Vector Data Description（Deep SVDD），通过优化数据围绕超球体的紧致分布，实现对异常样本的检测。
研究工作流程及方法研究设计旨在提出并验证 Deep SVDD 方法。本文分为以下几个关键步骤：
1. 提出Deep SVDD模型及其理论背景
Deep SVDD 受传统的支持向量数据描述（SVDD）的启发。SVDD 是一种基于超球体的异常检测方法，其目标是找到包含数据特征的最小超球体。
在 Deep SVDD 中，使用神经网络将输入数据映射到一个潜在表示空间，并找到一个最小体积的超球体来包含大多数数据点。这一过程通过最优化目标函数实现，该函数包含三部分：超球体半径的平方，数据点的边界违规罚项，以及网络权重的正则化项（权值衰减）。
2. 模型优化与理论保证
使用 SGDs（随机梯度下降）优化模型参数，通过交替优化半径和网络参数的方法提升效率。
为了防止网络学到无意义的“塌陷解决方案”，研究提供了一系列理论分析，证明了某些构架特性（如偏置项和有界激活函数）会导致模型过拟合到一个恒定的超球体中心，因此在构建神经网络时需要去除偏置项且使用非饱和的激活函数（例如 ReLU）。
3. 数据集实验设计
本文验证了该方法在以下几个任务上的性能：
在 MNIST 和 CIFAR-10 数据集上进行一类分类实验，每次选取一个类别作为正常类别，其余类别作为异常数据。
在 GTSRB Stop Signs 数据集上测试模型对抗对抗性攻击（Adversarial Attack）的检测能力。实验使用下采样及归一化的图像数据，并在未受攻击的训练数据集上进行训练，目标是检测非正常的对抗样本。
对比基线方法包括核OC-SVM、KDE、Isolation Forest（IF）、深度卷积自编码器（Deep Convolutional Autoencoder, DCAE）和基于生成对抗网络（GAN）的 AnoGAN 方法。
主要结果1. MNIST 和 CIFAR-10
整体表现：Deep SVDD 在 MNIST 数据集上的表现显著优于传统浅层方法（如 OC-SVM, KDE）以及其他深度学习方法（如 DCAE 和 AnoGAN）；在 CIFAR-10 数据集上，Deep SVDD 的性能依然强劲，但局部类别如“truck”数据中，传统核方法同样表现较好。
数据表现细节：例如，对 MNIST 的“正常类别”为数字“1”的实验，Deep SVDD 在 Area Under Curve (AUC) 指标上达到了99.7%；而 CIFAR-10 的“automobile”类别中其 AUC 指标为65.9%。
2. GTSRB Stop Signs 对抗性攻击
Deep SVDD 在检测对抗性攻击中取得了良好效果，对比基线中性能最佳，与 DCAE 方法的 AUC 相近，为80.3%。
分析显示，该模型能够检测到训练外的异常样本，如不常见的角度拍摄的停车标志或边缘裁剪不完整的图片等。
研究结论与价值本文提出了一种新的异常检测方法 Deep SVDD，它在理论上解决了传统深度学习异常检测方法存在的问题，例如过分依赖重建误差的启发式指标，以及优化目标不符合异常检测需求的问题。从实验结果来看，Deep SVDD 显示出在高维数据和非结构化数据上的可靠性能，尤其在无监督的问题场景下表现突出。
与此同时，该方法无需存储支持向量，具有低内存复杂性，预测阶段仅需执行神经网络前向传播，这显著提高了其效率与可扩展性。
这项研究不仅在学术上有重要意义，也为工业监控、欺诈检测、网络安全和自动驾驶领域的异常检测提供了有效的新工具和方法。
研究亮点全新优化目标：与现有深度异常检测方法不同，Deep SVDD 提出的目标函数直接面向异常检测需求，充分利用神经网络的特性。
理论创新：通过理论分析规避了模型可能出现的塌陷问题，确保方法的鲁棒性。
实际应用能力：Deep SVDD 在检测复杂数据和对抗性攻击方面展现出优秀性能，为实际应用场景提供了技术支持。
总结Deep SVDD 是一种面向异常检测的创新方法，其创新点在于将最小体积估计理论与深度学习相结合。本文通过理论分析、数据实验及实际应用等多方面验证了其优越性，表明该方法在当前快速增长的高维和无监督数据场景中具有广泛应用潜力。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问