买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种基于Vision Transformer的齿轮声振信号融合故障诊断方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种基于Vision Transformer的齿轮声振信号融合故障诊断方法

￥22200

专利号： 2025105063630

申请人：山东科技大学

专利类型：发明专利

专利状态：已下证

更新日期：2025-10-27

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于Vision Transformer的齿轮声振信号融合故障诊断方法，其特征在于，包括如下步骤：S1、将声信号和振动信号均分割成多个向量块并基于线性映射进行嵌入，分别生成声信号输入序列和振动信号输入序列；公式为：式中，xp为分段块序列中的一个块，Z0为patch嵌入；

S2、为声信号输入序列和振动信号输入序列的每个位置动态分配可学习位置编码，结合位置感知缩放因子调整位置编码的权重；

S3、将调整权重后的声信号和振动信号在独立ViT模块分别进行特征提取和融合；

S4、将步骤S3得到的声信号特征和振动信号特征进行融合，得到拼接特征；

S5、使用Mahalanobis距离来度量域间特征分布差异，结合故障分类器和域分类器进行跨域故障诊断；

步骤S2包括：

S21、生成可学习位置编码，在输入序列中引入生成的位置索引，通过查找位置编码矩阵来获取对应的可学习位置编码向量；公式为：PE(i)＝Embedding(i)；

(L+1)×D D

式中，f0∈R 为编码器输入序列，R是实数集，L是序列长度，D是嵌入维度，xclass∈R(P×Q)×D为分类头向量，E∈R 为线性映射矩阵，P和Q分别表示分段的数量和每个分段的特征维P×C度，xp∈R 为分段块序列，表示分段块序列中的第p个块，PE(i)是一个可学习的嵌入函数，(L+1)×D用于生成位置i的嵌入向量，Epos∈R 为位置编码矩阵通过PE(i)生成，Embedding表示嵌入操作或嵌入矩阵，用于将离散的索引值转换为连续的向量表示；

S22、将可学习位置编码与输入序列相加后乘以位置感知缩放因子，公式为：B×L×C

式中，X∈R 为输入序列张量，其中，B为批次大小，L为序列长度，C为通道数，α为位置感知缩放因子，ψ为对位置感知缩放因子α梯度的损失函数，b是批次大小的索引变量，D是嵌入维度，d是嵌入维度的索引变量，c是通道数的索引变量，Yb,c,l表示第b个批次、第c个通道、第l个位置的输出值；

步骤S3中，将调整权重后的声信号和振动信号依次执行Z‑Pool层降维、卷积层特征提取、批量归一化及非线性激活操作，在卷积层特征提取后加权，将加权后的特征结合起来，并采用逐元素相乘方式进行融合，其中，Z‑Pool层降维过程为：MaxPool(h)i,j,k＝maxm,nhi+m,j+n,k；

Z‑Pool(h)＝Concat(MaxPool(h),AvgPool(h))；

式中，i,j,k是输出特征的坐标，m,n是池化窗口内的相对坐标，M和N是池化窗口的高度和宽度，MaxPool(h)i,j,k是最大池化操作，AvgPool(h)i,j,k是平均池化操作，Z‑Pool(h)为特征降维操作，Z表示将最大池化和平均池化的结果进行拼接的操作，Pool(h)为对输入序列向量h进行池化操作；

步骤S5中，Mahalanobis距离的计算公式为：

式中，μ是均值向量，S是协方差矩阵，(e‑μ)是向量e与均值向量μ之间的差值向量，DM(e,μ)是Mahalanobis距离。

2.根据权利要求1所述的一种基于Vision Transformer的齿轮声振信号融合故障诊断方法，其特征在于，步骤S4中，将步骤S3卷积层处理后的声信号和振动信号分别使用M层Vision Transformer编码器，每层编码器包含前馈网络和多头注意力机制，在编码器的输出过程中，多头注意力的输出通过残差连接与前馈网络的输出相结合，经过编码器的逐层处理，网络提取特定的特征标识符，并对这些特征进行层归一化处理，最终，将提取并归一化后的声信号和振动信号进行水平拼接，完成特征融合；过程为：z′γ＝MSA(MN(zγ‑1))+zγ‑1；

z′γ＝MLP(MN(zγ‑1))+zγ‑1；

式中，γ是对应的序列，z′γ是M层编码器的内部输出序列，MSA是多头注意力，MLP是前馈网络，MN是层归一化函数，y是经过层归一化函数MN处理后的最终输出序列，是第M层编码器的初始输入序列，zγ‑1是第γ‑1层编码器的内部输出序列，作为第γ层编码器的输入。

3.根据权利要求1所述的一种基于Vision Transformer的齿轮声振信号融合故障诊断方法，其特征在于，步骤S4包括对拼接特征的每个向量除以欧几里得范数，使向量长度变为

1，用于消除不同特征之间的尺度差异，公式为：

式中，U表示向量，u表示向量的分量。

4.根据权利要求1所述的一种基于Vision Transformer的齿轮声振信号融合故障诊断方法，其特征在于，Mahalanobis距离损失函数为：式中，是类别yi的协方差矩阵，λ是超参数，R(θ)是正则化项。