利索能及
我要发布
收藏
专利号: 2024107418197
申请人: 广东工业大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-03-10
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于深度学习的变电站红外图像老鼠识别方法,其特征在于,包括以下步骤:

获取变电站内老鼠的红外图像数据集,并进行预处理;

基于特征提取模块、空间金字塔池化结构以及多感知目标检测头,构建变电站红外图像老鼠检测算法;

基于预处理后的红外图像数据集对所述变电站红外图像老鼠检测算法进行训练;

将训练后的变电站红外图像老鼠检测算法部署在变电站的红外摄像头中,对变电站内老鼠进行实时监控和预警;

基于特征提取模块对变电站内老鼠的红外图像进行处理的过程包括:对待处理的红外图像进行特征提取,获得第一特征图,将第一特征图输入可变形卷积进行可变形卷积运算,对可变形卷积运算后的第一特征图进行批归一化和ReLU函数运算,获得第二特征图;将第二特征图在通道维度上进行通道分裂的操作,获得通道数均为第二特征图通道数一半的第三特征图和第四特征图;将第四特征图输入到可变形卷积中,随后再依次进行批归一化和ReLU函数运算,输出第五特征图;将第五特征图输入至可变形注意力模块中进行处理,输出第六特征图;将第三特征图和第六特征图在通道维度上进行残差连接,获得通道数为第三特征图和第六特征图通道数总和的第七特征图;对第七特征图进行卷积运算,随后再依次进行批归一化和ReLU函数运算,输出第八特征图;

将第五特征图输入至可变形注意力模块中进行处理的过程包括:输入第五特征图的维度进行处理,生成一个均匀的参考网格,将第五特征图与参数矩阵相乘进行线性投影,获得一个查询向量,随后将查询向量输入到一个偏移子网络中,获得基于参考网格的偏移量;将参考网格中的每个参考点与对应的偏移量相加,获得每个参考点偏移后的移位点;然后对移位点的坐标使用双线性插值进行特征采样,获得采样特征,将采样特征进行线性投影,获得关键向量和数值向量;基于多头注意力对关键向量和数值向量进行特征提取,将所提取的每个注意力头部的特征进行连接,然后将连接后的特征与输出权重矩阵相乘输出第六特征图;

基于空间金字塔池化结构对变电站内老鼠的红外图像进行处理的过程包括:对待处理的红外图像进行特征提取,获得第一池化特征图,将第一池化特征图输入到深度可分离卷积中,随后再输入批归一化层,输出第二池化特征图;将第二池化特征图输入到全局注意力机制模块中,进行通道注意力增强操作,输出第三池化特征图;将第三池化特征图输入到最大池化层,获得第四池化特征图,随后再依次输入两层最大池化层,分别得到第五池化特征图和第六池化特征图;将第三池化特征图、第四池化特征图、第五池化特征图和第六池化特征图沿通道维度进行拼接,输出第七池化特征图;将第七池化特征图输入到深度可分离卷积中,随后再输入批归一化层,输出第八池化特征图。

2.根据权利要求1所述的基于深度学习的变电站红外图像老鼠识别方法,其特征在于,对所述红外图像数据集进行预处理的过程包括:基于温度扰动模拟技术和图像变换技术对红外图像数据集进行预处理,并将预处理后的红外图像数据集划分为训练数据和验证数据。

3.根据权利要求1所述的基于深度学习的变电站红外图像老鼠识别方法,其特征在于,基于多感知目标检测头对变电站内老鼠的红外图像进行处理的过程包括:所述多感知目标检测头包括尺度感知模块、空间感知模块和任务感知模块;对待处理的红外图像进行特征提取,获得第一感知特征图,将第一感知特征图输入尺度感知模块,在尺度感知模块中,第一特征图首先输入到平均池化层,随后依次输入到SPD卷积层与批归一化层中,然后使用LeakyReLU函数进行激活,获得第二感知特征图,将第二感知特征图与第一感知特征图进行逐元素相乘,输出第三感知特征图;将第三感知特征图输入空间感知模块,在空间感知模块中,第三特征图首先输入自适应核SPD卷积,并将不同层级的输入统一成一个层级的输出,输出后随即进入批归一化层,然后依次进入偏移层与批归一化层,输出第四特征图;将第四特征图通过LeakyReLU函数进行激活,输出第五特征图,同时,将第四特征图输入卷积层与批归一化层,获得第六特征图;将第四特征图、第五特征图和第六感知特征图进行逐元素相乘,输出第七特征图;将第七特征图输入任务感知模块,在任务感知模块中,第七特征图首先输入平均池化层,输出第八感知特征图,随后将第八感知特征图依次输入全连接层、LeakyReLU函数、全连接层和H_Sigmoid激活函数中进行运算,输出第九感知特征图,同时,任务感知模块定义了阈值控制向量和固定向量,阈值控制向量和固定向量相加后对第九感知特征图进行缩放和偏移运算,得到第十感知特征图;将第十感知特征图与第八感知特征图进行逐元素相乘,输出第十一感知特征图。

4.根据权利要求1所述的基于深度学习的变电站红外图像老鼠识别方法,其特征在于,变电站红外图像老鼠检测算法的结构包括:输入处为一个卷积层加批归一化层;连接输入处的主干部分为两层的特征提取结构,其中,第一特征提取结构为特征提取模块、卷积层和特征提取模块的组合,第二特征提取结构为特征提取模块、卷积层、特征提取模块和空间金字塔池化结构的组合;然后采用特征金字塔与路径聚合结构连接主干部分,再采用多感知目标检测头分别连接特征金字塔与路径聚合结构,最后设计回归与分类器连接多感知目标检测头,完成变电站红外图像老鼠检测算法的构建。

5.根据权利要求2所述的基于深度学习的变电站红外图像老鼠识别方法,其特征在于,对变电站红外图像老鼠检测算法进行训练的过程包括:初始化变电站红外图像老鼠检测算法的各项参数与超参数,将训练数据和验证数据输入变电站红外图像老鼠检测算法进行训练,对各项参数与超参数进行更新,直至损失值趋于收敛,训练结束。

6.根据权利要求5所述的基于深度学习的变电站红外图像老鼠识别方法,其特征在于,对训练后的变电站红外图像老鼠检测算法进行验证的指标包括:准确率和召回率。

7.根据权利要求1所述的基于深度学习的变电站红外图像老鼠识别方法,其特征在于,对变电站内老鼠进行实时监控和预警的过程包括:首先设定变电站红外图像老鼠检测算法在检测老鼠时的概率阈值,当红外摄像头捕捉到的目标输出通道中的类别置信度超过所述概率阈值时,进行预警,保存预警相关信息,然后以通信形式发送给变电站内负责鼠患管控的工作人员;

其中,所述预警相关信息包括红外摄像头捕捉到老鼠目标时的红外图像、对应红外摄像头在变电站中的位置或编号、对应检测结果的目标坐标框位置、对应检测结果的目标坐标框数量、是否为老鼠的置信度值和检测结果对应的时间点。