分享自:

基于统计模式分析和K近邻方法的非高斯非线性过程故障检测与隔离

期刊:ACS OmegaDOI:10.1021/acsomega.2c01279

类型a:这篇文档报告了一项原创研究。

主要作者与机构
该研究的主要作者包括周哲(Zhe Zhou)、王健(Jian Wang)、杨春杰(Chunjie Yang)、温成龙(Chenglin Wen)和李祖新(Zuxin Li*)。其中,通讯作者李祖新来自湖州学院科学与工程学院(Huzhou College, School of Science and Engineering),其他作者分别隶属于湖州大学工程学院(Huzhou University, School of Engineering)、浙江大学工业控制技术国家重点实验室(Zhejiang University, State Key Laboratory of Industrial Control Technology)以及广东石油化工学院自动化学院(Guangdong University of Petrochemical Technology, School of Automation)。该研究发表于《ACS Omega》期刊,出版时间为2022年。

学术背景
本研究属于工业过程监控领域。随着工业过程的快速发展和复杂性增加,如何从大量的运行数据中提取有价值的信息以实现早期故障检测,成为提高生产安全性和效率的关键问题。传统的主成分分析(Principal Component Analysis, PCA)方法仅能处理低阶统计信息(如均值、方差和协方差),无法有效应对具有强动态性、非线性和非高斯特性的连续过程。为解决这一问题,统计模式分析(Statistics Pattern Analysis, SPA)方法被提出,通过提取高阶统计量(Higher-Order Statistics, HOS)来描述复杂过程特性。然而,SPA提取的统计量通常不服从高斯分布,且存在非线性关系,这使得基于PCA的传统监控方法在实际应用中表现不佳。因此,本研究旨在结合SPA和K近邻算法(K-Nearest Neighbor, KNN),开发一种新的过程监控方法,以克服上述缺陷。

研究流程
该研究主要包括以下步骤:
1. 统计量提取:使用SPA方法从过程数据中提取统计模式(SP),这些统计量包括一阶统计量(FOS,如均值)、二阶统计量(SOS,如方差、相关性、自相关性和互相关性)以及高阶统计量(HOS,如偏度和峰度)。提取过程中,采用滑动窗口技术对原始数据进行分段处理,窗口宽度和滑动步长根据具体过程特性设定。
2. 训练阶段:基于正常操作条件下的训练数据集,计算每个样本的K近邻,并利用欧几里得距离公式(eq 10)确定其距离统计量(eq 11)。随后,通过经验四分位数法(eq 12)计算故障检测的控制限。
3. 在线监控:对于待测样本,首先通过SPA提取其统计量,然后在训练集中找到其K近邻并计算距离统计量。将该统计量与控制限进行比较,若超出控制限则判定为故障样本,否则为正常样本。
4. 故障诊断:当检测到故障时,使用变量贡献KNN(VCKNN)方法确定不同统计量对检测指标的贡献。该方法通过分解距离统计量(eq 23)计算每个统计量的贡献值,并根据贡献值判断故障变量。

研究对象包括数值模拟数据和田纳西伊士曼基准过程(Tennessee Eastman Benchmark Process, TEP)的实际数据。数值模拟部分生成了10,000个训练样本和5,000个验证样本,测试样本则包含500个正常样本和9,500个故障样本。TEP部分则涉及52个监控变量和21种故障模式。实验中采用了SPCA、SKPCA、SKICA和SKNN四种方法进行对比分析。

主要结果
1. 非高斯性和非线性分析:通过负熵(Negative Entropy, NE)定量评估统计量的非高斯性,发现提取的统计量均显著偏离标准正态分布(NE > 10^-3)。此外,使用替代数据法(Surrogate Data Method)检测统计量的非线性,结果表明所有统计量均表现出显著的非线性特征(tr > 1.96)。
2. 故障检测性能:在数值模拟和TEP实验中,SKNN方法的故障检测率(FDR)和误报率(FAR)均优于SPCA、SKPCA和SKICA方法。例如,在TEP实验中,SKNN的平均FDR为89.35%,而SPCA、SKPCA和SKICA分别为61.98%、56.43%和60.86%。
3. 故障诊断能力:SKNN方法能够准确隔离故障变量,且不受故障扩散效应的影响。例如,在TEP的故障7和故障10中,SKNN成功识别出第45个变量的均值和第18个变量的方差为主要故障统计量。相比之下,SPCA方法由于受到故障扩散效应的影响,错误地将许多非故障统计量识别为故障变量。

结论与意义
本研究开发了一种基于SPA和KNN的新过程监控方法(SKNN),能够有效克服传统方法在处理非高斯性和非线性统计量时的局限性。该方法不仅提高了故障检测的准确性,还通过VCKNN方法实现了精准的故障诊断。研究结果表明,SKNN在数值模拟和TEP实验中的性能均优于现有方法,具有重要的科学价值和应用前景。例如,在化工行业中,该方法可用于实时监控复杂工业过程,从而减少停机时间并提高生产安全性。

研究亮点
1. 提出了结合SPA和KNN的新方法,解决了传统PCA方法在处理非高斯性和非线性统计量时的不足。
2. 开发了VCKNN方法,用于故障诊断,避免了故障扩散效应的影响。
3. 验证了SKNN方法在多种工业场景中的优越性能,特别是在早期故障检测和安全报警方面的潜力。

其他重要内容
研究还探讨了窗口宽度对统计量非高斯性的影响,发现窗口宽度越大,统计量的非高斯性越弱。此外,作者指出该方法在处理多模态过程时仍存在一定局限性,未来可通过改进统计量提取策略进一步优化其性能。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com