(论文速读)基于堆叠胶囊自编码器的类不平衡小数据风电机组故障诊断
论文题目Wind Turbine Fault Diagnosis for Class-Imbalance and Small-Size Data Based on Stacked Capsule Autoencoder基于堆叠胶囊自编码器的类不平衡小数据风电机组故障诊断期刊IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS摘要风力发电对于减少二氧化碳排放、减少环境污染、增强能源供应的可持续性具有战略意义。风力发电机组健康监测是保证并网发电质量的关键技术。标记数据不足和类不平衡问题是风电机组智能故障诊断的两个关键问题。针对堆叠式自编码器中标签数据不足和类别不平衡的问题提出了一种基于堆叠式自编码器的智能故障诊断方法。采用基于先验知识的卷积层优化胶囊的初始化使其更有利于光谱信息的学习。改进了零件和物体的姿态表示提出了一种嵌入光谱模板的方法。基于堆叠胶囊自编码器的风机故障诊断破解小样本与类别不平衡难题1. 研究背景风机为什么难以做好故障诊断风力发电因其零碳排放、低建设成本的特性已成为可再生能源领域最具潜力的主流能源形式之一。然而由于气象条件复杂、电网并网要求严苛风机组WTGs的高效低成本运维始终是一项技术挑战。配图论文Fig. 1——风机内部结构及机械部件连接形式示意图在风机的所有故障类型中轴承和齿轮的故障频率最高。随着风电装机容量的持续扩大基于数据驱动的智能故障诊断IFD方法越来越受到学界和工业界的关注。振动信号因其采集方便、信息丰富是目前最主流的数据来源。然而要真正将IFD方法落地应用必须正视两个核心难题1.1 数据不平衡问题在实际生产场景中风机的故障属于小概率事件。这意味着与正常运行状态相比带有故障标签的样本数量极少形成严重的标签/类别不平衡。以本文使用的齿轮箱数据集为例某些故障类别的训练样本数仅有正常类别的 1/10不平衡率 0.1。1.2 小样本问题除了不平衡之外故障数据的绝对数量也严重不足原因包括风机结构复杂、工况多变故障形式多样难以收集到足够的标注样本多风场、多监控系统之间存在数据壁垒传感器选型不当、安装或校准误差导致数据质量下降在这样的数据贫困条件下如何让深度学习模型依然能够准确、稳定地完成故障诊断正是本文要解决的核心问题。2. 现有方法的局限性针对上述问题学界已有不少尝试主要分为以下两类2.1 数据增强方法上采样/下采样通过生成或删除样本来平衡数据集。其中 SMOTE合成少数类过采样技术是最经典的方法GAN生成对抗网络则能生成更高质量的合成样本。缺陷这类方法改变了训练集的真实分布在极少数类情况下容易引发过拟合且数据增强步骤与模型训练步骤往往无法端到端联合优化训练性能受限。2.2 权重分配方法通过为少数类样本赋予更大的学习权重来平衡训练过程。但权重的设定本身就是一个难题难以自动化泛化性较差。2.3 原始SCAE方法的内在局限本文的方法基于堆叠胶囊自编码器SCAE。SCAE由 Kosiorek 等人于2019年提出其核心思想是用部件构成对象、对象构成样本的三层表达结构来理解数据。然而将原始SCAE直接用于振动信号的故障诊断存在两个关键问题盲初始化原始SCAE用普通CNN初始化胶囊缺乏领域先验知识导致训练困难、收敛慢。仿射变换不适用原始SCAE的仿射变换函数是为图像设计的直接迁移到一维振动信号会造成信息冗余和位姿表达错误严重影响特征提取效果。3. 本文方法基于SCAE的半监督故障诊断框架本文提出了三大核心创新共同构成一个完整的半监督故障诊断框架。配图论文Fig. 5——所提出的SCAE方法整体框架图包含PCAE和OCAE两个子模块3.1 创新一先验知识卷积核PACK问题胶囊的盲初始化导致训练困难且引入注意力机制会增加模型复杂度。解决思路既然振动信号的频谱中存在已知的物理规律如特征频率的分布特性那么完全可以利用这些先验知识来设计卷积核范式从而在初始化阶段就为胶囊编码器提供有意义的起点。本文提出四种卷积核范式这些范式通过预设分布生成初始卷积核权重再通过反向传播对分布参数进行精细调优在保持先验知识注入的同时保留了充分的学习灵活性。3.2 创新二频谱模板变换STT问题原始SCAE的仿射变换是为二维图像设计的无法正确表达一维振动信号频谱中的位姿关系。解决思路基于振动信号频谱的特征分析重新设计适用于频谱信号的位姿框架和变换方法。配图论文Fig. 4——CWRU数据集上频谱中峰值的不变性与等变性分布图红框展示不变特征黑框展示等变特征本文的位姿向量包含以下语义丰富的参数尺寸模板的整体缩放比例偏移模板在频率轴上的平移量对应转速变化导致的频率偏移间隔谐波分量之间的频率间距不平衡度反映频谱的非对称性衰减参数描述峰值周围的幅值衰减方式包含三种模型完整的STT变换可以表达为其中G为零填充函数用于将模板扩展至信号长度。3.3 创新三半监督训练框架本文方法的精髓在于充分利用大量正常状态数据这些数据在风机运维中极为丰富且易得进行无监督预训练然后再利用少量标注的故障数据进行有监督微调。训练流程分为两个阶段阶段一无监督预训练PCAE通过最大化输入与重建频谱之间的似然函数进行训练学习部件模板不变特征OCAE通过最大化部件似然函数进行训练学习对象-部件关系等变特征大量无标签的正常状态数据即可用于此阶段阶段二有监督微调将PCAE和OCAE输出的部件胶囊与对象胶囊拼接输入MLP进行分类采用边际损失Margin Loss进行监督学习。配图论文Fig. 10——有监督学习与半监督学习在充足/不足数据集上的损失收敛曲线对比图4. 实验验证与结果分析4.1 Case ICWRU轴承数据集——小样本鲁棒性验证数据集设置CWRU滚动轴承故障数据集包含内圈故障IR、滚珠故障B、外圈故障OR共12类损伤直径从0.007到0.028英寸采样频率12kHz电机转速1797~1720 RPM。测试集每类100个样本训练集大小分别取100、75、50、25进行对比。配图论文Table I——不同训练集大小下各方法的准确率对比表加粗为本文方法关键结论训练集充足100样本/类时本文方法达到100.00±0.00%为所有方法中唯一完美得分训练集仅有25样本/类时本文方法仍保持97.17±1.68%相比第二名DBN: 94.83±4.37%准确率更高且标准差更小稳定性更好随着训练集缩减本文方法的优势愈加显著充分体现了对小样本问题的适应能力噪声鲁棒性测试在原始信号中叠加不同强度的高斯白噪声SNR从60dB降至10dB配图论文Table II——不同信噪比下各方法准确率对比表本文方法在各噪声水平下绝对精度均最高且整体精度下降幅度仅12.93%展现出优异的噪声鲁棒性。4.2 Case IIGDS齿轮箱数据集——类别不平衡验证数据集设置来自齿轮箱动力学模拟器GDS包含1种正常状态和8种故障状态太阳轮和传动齿轮的根裂、缺齿、裂齿、表面故障采样频率25.6kHz。设置四种不同的不平衡训练配置数据集A/B/C/D。配图论文Fig. 6——GDS实验数据采集平台实物图配图论文Fig. 7——各类故障齿轮的实物图共8种故障模式对比方法SMOTE-SAE、GAN-DAC、代价敏感CNN每种方法各重复20次取平均值和四分位范围评估稳定性。配图论文Fig. 8——四种不平衡数据集上各方法的箱线图对比红线为均值蓝框为四分位范围关键结论本文方法在四种不平衡配置下均取得最佳平均性能和最好稳定性箱体最窄SMOTE-SAE和GAN-DAC等数据增强方法在极端少数类情况数据集A不平衡率0.1下出现明显过拟合精度波动大本文方法不依赖数据增强不改变真实分布天然具备更强的泛化能力4.3 Case III消融实验——各模块贡献分析为验证各创新模块的有效性进行消融对比包括原始SCAEOri-SCAE、仅加PACKPACK-SCAE、仅加STTSTT-SCAE、完整方法。配图论文Fig. 9——消融实验结果柱状图关键结论STT模块对精度提升的贡献显著大于PACK模块证明原始仿射变换函数确实不适合处理1-D振动信号是制约原始SCAE性能的主要瓶颈PACK模块PACK-SCAE与Ori-SCAE较接近对精度的提升相对有限但能有效降低模型复杂度、加速训练半监督训练Fig. 10相比纯监督训练收敛更快、初始损失更低大规模数据约20轮收敛小规模数据约80轮收敛4.4 t-SNE可视化分析配图论文Fig. 11——部件胶囊特征的t-SNE二维可视化图四种对比条件通过对部件胶囊特征进行t-SNE降维可视化可以直观评估特征的可分性数据集B1000个标签样本不平衡率0.5最佳结果13个类别边界清晰可辨无正常样本参与无监督训练Fig. 11c特征可分性明显下降说明正常状态数据对无监督训练至关重要无无监督训练Fig. 11d最差结果仅3个类别可清晰区分充分证明半监督训练机制的核心价值4.5 Case IV真实风机数据NREL数据集——实际场景验证数据集由美国能源部/国家可再生能源实验室NREL提供包含健康状态和三种损伤模式磨损、过热、微动腐蚀采样率10kHz转速1800/1200 RPM训练集50样本/类测试集100样本/类输入长度2048。配图论文Fig. 12——四种方法在真实风机数据集上的混淆矩阵对比a: DBCF, b: ResNet, c: Transformer, d: 本文方法方法诊断准确率DBCF约80%估算ResNet约84%估算Transformer约87%估算本文方法91.25%本文方法在真实数据上的91.25%的诊断准确率显著超越所有对比方法验证了方法在实际工程场景中的有效性和优越性。5. 方法优势总结优势维度本文方法传统方法数据分布保真不改变真实训练集分布SMOTE/GAN改变分布引入偏差特征共享学习类间共享的不变/等变特征仅关注类间数量/权重平衡正常数据利用充分利用丰富的正常状态数据进行无监督预训练无法有效利用正常/无标签数据端到端训练半监督框架可端到端联合优化数据增强与模型训练分离领域知识融合PACK将频谱先验知识嵌入初始化完全依赖数据驱动无先验引导6. 不足与未来工作作者在论文中也坦诚指出了方法的现有局限运行效率由于程序框架问题PACK卷积核在代码运行时间上尚未体现出优势需要进一步优化实现方式。高斯协方差估计OCAE中多元高斯混合分布的协方差矩阵由神经网络估计优化该模块有望进一步提升精度。边际损失参数m^0.9, m^-0.1的设定方式需要进一步研究探索自适应优化技术以提升跨数据集的泛化能力。7. 总结本文针对风机智能故障诊断中的两大核心痛点——小样本和类别不平衡提出了一种基于堆叠胶囊自编码器SCAE的半监督故障诊断方法。三大创新点相辅相成PACK解决了胶囊盲初始化问题STT解决了仿射变换不适用于1-D信号的问题半监督框架解决了对标注数据的过度依赖问题。在CWRU、GDS、NREL三个数据集上的系统性实验表明该方法在小样本、不平衡、噪声干扰和真实工程场景等多种挑战条件下均展现出超越现有先进方法的诊断精度和稳定性。这一工作为数据贫困条件下的工业设备健康管理提供了一个极具参考价值的新思路与其想方设法造数据不如让模型更聪明地用数据。