利索能及
我要发布
收藏
专利号: 2025102138349
申请人: 昆明学院
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.基于改进YOLOv11模型的变电站异物入侵检测方法,其特征在于,包括如下步骤:步骤1.获取多幅变电站的设备及线路图像,并对获取的变电站的设备及线路图像进行图像预处理和标注,得到用于下述变电站异物入侵检测模型的训练数据集;

步骤2.搭建基于YOLOv11模型架构的变电站异物入侵检测模型,该变电站异物入侵检测模型包括主干网络、颈部网络以及检测头网络;

其中,主干网络包括一个卷积块、四组卷积块和C3k2‑Dual模块、一个非局部注意力机制模块、一个SPPF模块以及一个C2PSA‑DHSA模块;

定义四组卷积块和C3k2‑Dual模块分别为第一组、第二组、第三组及第四组卷积块和C3k2‑Dual模块,且每组中均包括一个卷积块和一个C3k2‑Dual模块;

C3k2‑Dual模块是在传统的C3k2模块基础上,将传统C3k2模块中的Conv卷积替换为Dual Conv卷积,使得模型能够同时处理相同的输入特征图通道,并利用组卷积技术高效地排列卷积滤波器;所述Dual Conv卷积通过将N个卷积核分成G组,通过调整G组的数量来控制卷积核的比例,以减少浮点运算次数,每组处理全部输入变电站的设备及线路特征图;

定义M/G输入的线路特征图通通过并行的3×3和1×1卷积核保留输入特征图的全部信息,以帮助深层卷积层更有效地提取信息,其余(M‑M/G)输入通道仅由1×1卷积核处理,以减少模型的参数数量;最后3×3和1×1卷积核的结果会进行求和,得到输出特征图;

C2PSA‑DHSA模块是在传统C2PSA模块中插入DHSA模块得到的;

DHSA模块通过BHR和FHR的并行处理,使得模型能够同时捕捉电网图像的全局和局部特征,然后通过自注意力机制融合全局和局部特征,最终实现图像的高质量恢复;

输入至YOLOv11模型架构的图像特征,首先进入主干网络并进行如下处理:

图像特征首先经过一个卷积块进行特征提取,然后依次经过第一组、第二组、第三组及第四组卷积块和C3k2‑Dual模块进行特征提取,再经过一个非局部注意力机制模块,使得网络不仅能够捕捉输入变电站的设备及线路图像的局部细节,还能获取全局上下文信息;非局部注意力机制模块的输出特征再经过SPPF模块后,最后经C2PSA‑DHSA模块输出;

颈部网络用于实现不同层次特征的深度融合,检测头网络包含四个检测头;

步骤3.基于步骤1的训练数据集对搭建的变电站异物入侵检测模型进行训练,得到训练好的变电站异物入侵检测模型,并利用训练好的模型对变压器异物进行入侵检测。

2.根据权利要求1所述的基于改进YOLOv11模型的变电站异物入侵检测方法,其特征在于,所述颈部网络包括C3k2‑Dual模块、卷积块、上采样模块以及组合层;

定义颈部网络中C3k2‑Dual模块有六个,且分别为第一、第二、第三、第四、第五以及第六C3k2‑Dual模块;定义颈部网络中卷积块有两个,且分别为第一、第二卷积块;

定义颈部网络中组合层有六个,且分别为第一、第二、第三、第四、第五以及第六组合层,定义颈部网络中上采样模块有三个,且分别为第一、第二、第三上采样模块;

C2PSA‑DHSA模块的输出特征首先经过第一上采样模块,并进入第一组合层,在第一组合层内与第四组卷积块和C3k2‑Dual模块中的C3k2‑Dual模块的输出特征进行融合;

第一组合层的输出特征依次经过第一C3k2‑Dual模块以及第二上采样模块;

第二上采样模块的输出特征进入第二组合层,并在第二组合层内与第三组卷积块和C3k2‑Dual模块中的C3k2‑Dual模块的输出特征进行融合;

第二组合层的输出特征依次经过第二C3k2‑Dual模块以及第三上采样模块;

第三上采样模块的输出特征进入第三组合层,并在第三组合层内与第二组卷积块和C3k2‑Dual模块中的C3k2‑Dual模块的输出特征进行融合;

第三组合层的输出特征依次经过第三C3k2‑Dual模块和第一卷积块;第一卷积块的输出特征进入第四组合层,并在第四组合层内与第二组合层的输出特征进行融合;

第四组合层的输出特征依次经过第四C3k2‑Dual模块和第二卷积块;第二卷积块的输出特征进入第五组合层,并在第五组合层内与第一组合层的输出特征进行融合;

第五组合层的输出特征经过第五C3k2‑Dual模块后进入第六组合层,并在第六组合层内与C2PSA‑DHSA模块的输出特征进行融合,第六组合层的输出进入第六C3k2‑Dual模块;

其中,第三、第四、第五、第六C3k2‑Dual模块的输出端分别连接一个所述检测头。

3.根据权利要求1所述的基于改进YOLOv11模型的变电站异物入侵检测方法,其特征在于,所述C2PSA‑DHSA模块包括一个数据分割层、n个PSAB‑DHSA模块以及两个卷积层;

其中,C2PSA‑DHSA模块的处理流程如下:输入C2PSA‑DHSA模块的图像特征首先经过一个卷积层进行特征提取,然后经过一个数据分割层得到两个特征并分别对应输入到一个分支;其中一个分支特征经过n个PSAB‑DHSA模块进行处理,另一个分支特征不做处理;

将以上两个分支的输出特征进行连接,连接后的特征经过一个卷积层后输出;

所述PSAB‑DHSA模块包括一个DHSA模块以及一个由两个卷积层组成的前馈神经网络。

4.根据权利要求3所述的基于改进YOLOv11模型的变电站异物入侵检测方法,其特征在于,所述DHSA模块的处理流程如下:C×H×W

定义输入到DHSA模块的一个变电站的设备及线路图像特征张量F∈R ;其中C是通道数,H是高度,W是宽度;输入特征图经过动态范围卷积,将F分割为两个分支特征,即特征F1和F2;对特征F1进行水平和垂直排序,得到排序后的特征,将排序后的特征与特征F2拼接,形成新的特征F′;通过1×1点卷积和3×3深度卷积对特征F′进行处理,得到动态范围卷积的特征;接着,对动态范围卷积的特征进行直方图重塑操作,即BHR和FHR操作,将动态范围卷积的输出分为值特征V和查询‑键对FQ,K,即:Q=X·WQ;

K=X·WK;

V=X·WV;

其中,Q表示查询特征,K表示键特征,V表示值特征,WQ表示查询特征矩阵,WK表示键特征矩阵,WV表示值特征矩阵,X表示输入图像特征张量F;

对V进行排序,并根据排序索引重排FQ,K,将排序后的特征V为 的形式;

其中B是直方图箱的数量,BHR操作用于捕捉整个线路的全局特征;FHR操作用于捕捉线路的局部特征;然后对BHR和FHR路径的特征分别计算自注意力映射AB和AF,即:其中RB和RF分别代表BHR和FHR的重塑操作,k是缩放因子;

Q1和Q2表示表示不同通道的Query向量,K1和K2表示表示不同通道的Key向量;下标1表示用于计算全局范围内计算自注意力,下标2表示用于在局部范围内计算自注意力;

RB(Q1)、RB(K1)、RF(V)表示对BHR通道中Q1、K1、V进行重塑操作,使每个直方图箱包含元素的数量和频率固定,并将Value特征重新组织为能够进行自注意力计算的形状;

RF(Q2)、RF(K2)、RF(V)表示对FHR通道中Q2、K2、V进行重塑操作,使每个直方图箱包含元素的数量和频率固定,并将Value特征重新组织为能够进行自注意力计算的形状;

最后将两个自注意力映射AB和AF进行元素级乘法得到输出特征AE,即AE=AB⊙AF;

其中水平排序和垂直排序后的特征数据输出,在进行通道分割后,进行元素投影,并与输出特征AE重组得到最终的自注意力输出设备及线路的特征图A;最后通过1×1点卷积将排序后的特征重新投影回原始空间位置,以保持空间一致性。

5.根据权利要求1所述的基于改进YOLOv11模型的变电站异物入侵检测方法,其特征在于,所述非局部注意力机制模块通过在全局范围内捕捉特征图中所有位置的相互关系,即:其中yi是获取特征图输出位置i的响应,x是输入信号,f()是成对函数,用于计算位置i和j之间的关系,g()是单变量函数,用于计算位置j的特征表示,C(x)是归一化因子;xi表示位置i的输入信号,xj表示位置j的输入信号;

非局部注意力机制模块通过三个分支θ、φ、g生成降维后的特征表示,用于计算变压器线路及设备特征之间的相似性并进行加权;

其中θ分支用于将输入特征降维到512通道,用于生成查询向量query;φ分支同样降维为512通道,用于生成键向量key,用于与查询向量计算相似性;g分支降维为512通道,生成输入特征的值向量value,用于加权聚合;

接着通过θ和φ的相似性计算生成注意力权重矩阵attentionweights,并将其与g分支的特征v相乘,得到全局加权后的特征表示y,公式表达如下:y=attentionweights·v;

T

其中,similarity=qk,q是查询向量,k是键向量,dk是键向量的维度;

最后将全局加权后的特征表示y通过1×1卷积恢复通道数,并采用残差结构保留原始特征与全局加权后的特征,结合局部与全局信息,以提升模型的感知能力。

6.根据权利要求1所述的基于改进YOLOv11模型的变电站异物入侵检测方法,其特征在于,所述步骤1中,在利用变电站异物入侵检测模型对变电站进行异物检测之前,首先获取用于模型训练的变电站的设备及线路图像,并进行预处理操作,包括将变电站的设备及线路图像文件读取到内存中,将图像缩放到模型所支持的640×640尺寸,使用Z分数归一化。

7.根据权利要求6所述的基于改进YOLOv11模型的变电站异物入侵检测方法,其特征在于,所述步骤1中,Z分数归一化通过计算每个数据点与数据集均值的偏差,并将其除以数据集的标准差,来将原始数据转换为具有零均值和单位方差的新数据集;计算公式如下所示:其中,Z是归一化后的值;x是原始数据点即变电站的设备及线路图像数据中的某个像素值或特征图中的某个线路特征特征值,μ是所有图像像素值或特征值的均值,σ是原始数据集的标准差。

8.根据权利要求1所述的基于改进YOLOv11模型的变电站异物入侵检测方法,其特征在于,所述步骤3中,在对搭建的变电站异物入侵检测模型进行训练时,设置学习率为0.08;模型优化算法采用AdamW优化算法;批大小为32,模型的迭代数为400;

所述步骤3中,AdamW优化器,在初始化后,定义一阶矩阵估计mt和二阶矩阵估计vt的初值分别为m0=0,v0=0,通过不断更新一阶矩阵估计mt和二阶矩阵估计vt来计算偏差修正的t t一阶矩阵估计m和二阶矩阵估计v,最后更新优化模型参数θ;其计算公式如下:

其中gt指第t次迭代中计算梯度,mt、vt指第t次迭代的一阶矩估计和二阶矩估计,β1指一阶矩估计的衰减率,值为0.9,β2指二阶矩估计的衰减率,值为0.999,ε是一个常数,用于防止分母为零的情况;λ是权重衰减系数,用于正则化,防止过拟合;η指学习率,控制每次更新步长的大小;θt、θt‑1分别表示第t、t‑1次迭代中的模型参数θ。

9.基于改进YOLOv11模型的变电站异物入侵检测系统,包括摄像头和计算机设备,其中,计算机设备包括存储器和至少一个处理器;其特征在于,所述存储器中存储有可执行代码;处理器执行可执行代码时,用于实现如上述权利要求1至8任一项所述的基于改进YOLOv11模型的变电站异物入侵检测方法。