嘉峪检测网 2024-08-24 14:17
导读:针对工业生产中滚动轴承剩余使用寿命(RUL)预测任务中数据挖掘不足导致预测精度低的问题,提出了一种多通道融合的滚动轴承剩余寿命预测方法。
摘 要
针对工业生产中滚动轴承剩余使用寿命(RUL)预测任务中数据挖掘不足导致预测精度低的问题,提出了一种多通道融合的滚动轴承剩余寿命预测方法。
该方法通过互补集合经验模态分解(CEEMD)对原始振动信号进行降噪化处理和特征增强并将其作为模型输入;构建三通道网络模型,引入 3 种不同的神经网络:时间卷积网络( TCN)、卷积长短时间记忆网络(ConvLSTM)、双向门控循环单元神经网络(Bi-GRU),从时序、空间、感受野等多维度对特征进行差异化提取;在结构基础上添加多头注意力机制(multi-head attention mechanism,MA),重新调整网络输出权重、加快模型收敛速度;最后,设计一个特征融合输出模块,实现对滚动轴承剩余寿命预测。在两种数据集上进行实验验证,并与其他文献中先进模型进行对比。
结果表明,所提模型能够更准确地捕捉轴承寿命退化曲线并且在多种评价指标上均优于对比模型。
引 言
针对当下研究的局限性,提出了一种多通道融合的滚动轴承剩余寿命预测模型。
主要贡献有 3 个方面:
1)引入了一种改进的信号处理方法:互补集合经验 分解互补集合经验模态分解 (CEEMD)算法,对振动信号 进行模态分解和降噪。
2)提出了一种多通道网络融合框架并引入 3 种传统 网络的改进网络,对输入特征通过时序、时间、空间等多 种维度进行深度挖掘并自适应各自学习到的权重。
3)为了加快模型训练收敛速度,引入一种目前热门 的大语言模型 Transfomer 中的注意力机制:多头注意 力机制,将网络学得的多种特征权重映射到子空间,进行 权重重构,重点关注对于退化趋势影响大的特征,找到最 佳的优化方案。
为了验证所提方法的有效性,分别通过 PHM2012 公开轴承数据集和实验室自采集数据集进行验证。
1、RUL 预测模型
1. 1 预测方法整体框架
提出基于多通道融合的滚动轴承 RUL 预测方法框 架如图 1 所示:
主要包括数据预处理和网络预测两部分。数据预处理包含振动信号时、频域分解、互补集合经验模态分解、标准化及时间窗处理,将预处理后的特征输入到搭建的多通道融合网络中,得到最终的预测值。
1. 2 算法介绍
1)互补集合经验模态分解
CEEMD 信号分解方法,其主要计算过程包括如下3方面:
(1)在原始振动序列 C 上添加 a 组互为相反数的正 负噪声对,得到新的序列 I1 、I2 。
2)时间卷积神经网络
为了使得神经网络能够对序列数据进行时 间建模,引入 CNN 的一种变体即 TCN,其由膨胀因果卷 积和残差模块组成。在解决时序问题上,需要追溯历史信息,历史信息越久远,隐藏层越多,计算量越大。为了既能够增大感受野又不使得隐藏层过多,膨胀因果卷积引入了一个新的超参数—扩张率 d ,在不损失信息的情况下,允许模型间隔 采样。残差模块使信息能够跨越层数传递,从而避免层数过多而造成信息损失。
3)卷积长短时间记忆网络
许多研究证明,LSTM 在剩余寿命预测领域的有效 性,但是其本身由于复杂的结构导致计算复杂度高并且 对于更加长期的关系依赖建模仍存在不足。因此引入ConvLSTM,在 LSTM 结构的基础上加入了卷积结构,使其不仅有着稀疏连通性和参数共享的优点,在计算速度提 高的同时还能够捕获数据长期依赖关系。
4)双向门控循环单元神经网络
它在门控循环单元神经网络(GRU)的基础上增加了反向循环机制,从而实现双向时间 信息的处理。Bi-GRU 能够同时考虑前向和后向的隐藏 层信息,比 GRU 具有更强大、更稳定的特征学习能力。
5)多头注意力机制
1. 3 整体网络结构
多通道融合网络整体结构由三通道网络特征提取模 块、多头注意力模块及 FNN 预测模块组成,如图 2 所示:
3 种网络模型利用各自的优势学得不同的时序特征,由 多头注意力模块将学得的特征映射到不同的子空间,重新分配特征权重,重点关注对于退化趋势影响大的特征向量,最后将所有特征融合,通过 FNN 模块将特征映射 输出得到最终的 RUL 预测值。
2、实例分析
为验证多通道融合的预测方法在发动机剩余寿命预 测中的有效性,基于 Python3. 8 和 TensorFlow2. 0 框架进行实验验证。
2. 1 实例 1:PHM2012 公开数据集
本实验采用 PHM2012 数据挑战发布的轴承完整寿命周期数据集。如图 3 所示,在 PRONOSTIA 实验平台上通过水平和垂直位置的加速度传感器来收集两个方向的振动信号。
设定设备的采样频率为 25. 6 kHz,每间 隔 10 s 记录一次数据,每次采集数据时长为 0. 1 s。从实 验安全的角度考虑,当振动数据的振幅超过 20 g(1 g = 9. 8 m / s²)时,停止实验。
如表 1 所示,数据集共采集 3 种工况条件下的 17 组数据。
训练集和测试集包含每个轴承的全寿命历史振动数据,每个采样周期包含 2560 个振动数据。本次实验对于同一工况的轴承,采用“留一法”,将目标轴承数据作为测试集,将其他轴承数据设为训练集。
如图 4 所示,将整个轴承的生命周期定义为从 1 ~ 0 的均匀下降直线并以此作为轴承训练的训练标签。
1)评价指标
由定义可知,更低的 MAE 和 RMSE 代表更好的预测 结果。
2)参数设置
经过多次实验,模型中 TCN 模块、ConvLSTM、BiGRU 模块的具体结构和参数设置如表 2 所示。
所提模型中的多头注意力机制涉及到注意力头数的选择,不同头数对于预测精度是有一定影响。
为了探究精度最高的参数设置方案,本文设置不同注意力头数:1、 2、4、8、16、32、64、128 共 8 种情况。为了防止偶然性,对 每一种情况运行实验 5 次取平均,得到其预测结果的 MAE 值和 RMSE 值如图 5 所示:
可以看到,不同注意力 头数对应的预测精度不同且差异较大,注意力头数的增 加与准确度的提高没有正负相关性,在本文实验中,当注 意力头数为 2 时的预测模型精度最高,因此本文后续的 实验都在这个参数的基础上进行。
3)消融实验
为了验证所提多通道融合的预测方法相比于原始模 型改进的有效性。将本文模型进行部分模块拆解,构成4 种消融模型: TCN + MA 模型、 ConvLSTM + MA 模型、 BiGRU+MA 模型、多通道+普通注意力模型。
本文在工况 1 的条件下,测试 7 个轴承的 RUL,每个 轴承的预测实验重复 5 次并取平均值得到最终的预测误 差。评价指标对比结果如表 3 所示:
如图 6 所示,为了能够更加直观地显示本文模型相 较于其他消融模型的优越性,以轴承 B1-7 为例,对剩余寿命预测进行可视化分析。
4)对比实验
为了验证本文提出模型的优越性,分别构建了其他 文献中提出的 4 种优秀深度学习方法进行对比:双通道BiLSTM 模 型 [14]、 CNN-BiLSTM 模 型[20]、 ConvGRU 模 型[21]、多尺度特征模型[22],并从 MAE、RMSE、时间 3 个 维度进行分析。在 FD001 测试集上进行误差比较,以轴 承 1-3 为例,所得结果如表 4 所示
2. 2 实例 2:实验室自采集数据集
为了验证本文提出的多通道寿命预测模型的泛化性能,运用实验室轴承寿命预测实验平台对测试轴承进行全寿命周期振动信号的数据采集并用于寿命预测。
实验平台如图 7 所示,该平台由变速驱动电机、轴承、齿轮箱、轴、偏重转盘和调速器等组成。
选取轴承型 号为 N205,数字信号的采样频率为 12 kHz,间隔 10 s 采 样,每次采样 0. 1 s。实验安全的角度考虑,当振动数据 的振幅超过 20 g(1 g = 9. 8 m / s2)时,停止实验。
在上述工作条件下,共采得 5 组轴承全周期寿命振 动数据,如表 5 所示。本实验对数据集的划分以及标签 处理与前文实验相同。
对 5 个测试轴承进行剩余寿命预测,其可视化结果 如图 8 所示:
为了能够更加直观地显示本文模型相较于其他对比 模型的优越性,以轴承 5 为例,对剩余寿命预测进行可视化分析。如图 9 所示:
3、结 论
针对现有数据驱动方法在滚动轴承剩余寿命预测中 对振动信号特征挖掘深度不足导致预测精度不高的问 题,提出了一种基于多头注意力机制和多通道模型融合 的滚动轴承剩余寿命预测方法。
首先将原始振 动信号进行时、频域分解并运用 CEEMD 将特征信号进 行降噪、 增强。
然后, 构建三通道网络结构: TCN、ConvLSTM、BiGRU,对特征信号从时间、空间、时序等多个维度进行深度挖掘,提取其高维退化特征。
最后结合 多头注意力机制,将高维特征映射到子空间进行权重调 整和融合,最终实现对滚动轴承剩余寿命的回归预测。
通过在 PHM2012 和实验室平台数据集的实验结果表明, 相比于 ConvGRU、CNN-BiLSTM、双通道 BiLSTM 等数据 驱动方法,本文模型在预测精度上有着明显的提升,在时 间维度上,相较引文的双通道、多特征模型也有较大提 升,是一种高效的滚动轴承剩余寿命预测方法。
虽然经过实验验证,本文模型在多种工况下都有着 良好的预测精度,但是并未考虑到 1工况训练、2工况测试这种跨工况问题,这是深度学习在滚动轴承剩余寿命预测领域的难点也是下一步工作应该探究的重点。
参考文献:
车鲁阳,高军伟,付惠琛.基于多通道融合的滚动轴承剩余寿命预测[J].电子测量与仪器学报, 2023(12).
来源:滚动轴承故障诊断与寿命
关键词: 滚动轴承剩余使用寿命