利索能及
我要发布
收藏
专利号: 2023105048877
申请人: 电子科技大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于深度学习的输电线路视频山火检测方法,该方法包括:

步骤1:获取输电线路视频监控山火图像;

步骤2:对收集到的输电线路视频监控图像中的山火及烟雾进行标注,标签记为烟雾和火,获得训练数据集;

步骤3:采取泊松融合、随机裁剪、随机翻转和随机噪声添加的方法,对现有的输电线路视频监控山火图像进行数据集扩充;

步骤4:搭建山火检测网络;

步骤4.1:训练图像输入后首先经过特征提取网络,得到3个不同尺度的特征图,其中特征图1尺寸大小为20×20×1024,特征图2尺寸大小为40×40×512,特征图3尺寸大小为80×80×256;

步骤4.2:对获得的特征图进行特征融合,将特征图1进行1×1的卷积,降维到512维,得到融合特征图1,大小为20×20×512;再将特征图1上采样,之后进行1×1的卷积,降维到

256维度,与特征图2相加,获得融合特征图2,大小为40×40×256;再将特征图2上采样,之后进行1×1的卷积,降维到128维度,与特征图相加,获得融合特征图3,大小为80×80×

128;进一步地,对融合特征图3进行分支融合操作,上支为最大池化串联一个卷积操作,下支为两个卷积操作,上下支合并后,再与融合特征图2相加,得到第二路分支输出;对融合特征图2进行分支融合操作,上支为最大池化串联一个卷积操作,下支为两个卷积操作,上下支合并后,再与融合特征图1相加,得到第一路分支输出;

步骤4.3:对第一路分支输出、第二路分支输出和融合特征图3分别通过3×3的卷积层1和批归一化层1;再分别通过3×3的卷积层2、批归一化层2和激活层,分别得到预测特征图

1,大小为20×20×21,预测特征图2,大小为40×40×21,预测特征图3,大小为80×80×21;

并最终在三个预测特征图进行回归和分类操作,判断是否发生火灾和发生火灾的位置;

步骤5:将步骤3中获得的数据集作为输入,训练一个步骤4得到的山火监测网络;

步骤6:进行山火检测应用时,具体为输入输电线路监控图像,并进行图像1024×1024的缩放,最终获得山火烟雾的检测框,并进行山火烟雾报警。

2.如权利要求1所述的一种基于深度学习的输电线路视频山火检测方法,其特征在于,所述步骤4.1中,特征提取网络为:训练图像首先经过四个特征提取网络第一模块,再串联两个第二模块,再串联一个卷积核大小为3的第一模块结构,再并联两个第二模块后,通过注意力机制模块,注意力机制模块由通道自注意力模块和空间注意力模块串联而成;最后串联一个第三模块,第三模块的输出为特征提取网络的最后输出;

所述第一模块由卷积层、批归一化层和SiLU激活函数层组成;

所述第二模块由两支组成,上支结构经过卷积核大小为1的第一模块结构后作为上肢输出;下支为卷积核大小为1的第一模块结构,再串联四个卷积核大小为3的第一模块结构后作为输出;在下支中第三个卷积核大小为3的第一模块结构进行分路与上肢合并后再与下支的输出合并,作为第二模块的输出;

所述第三模块由两支组成,上支为最大池化和卷积核大小为1的池化下采样,下支为卷积核Kernel大小为1和卷积核Kernel大小为3,卷积步长为2的串联卷积池化下采样,最终将两个结果进行维度的拼接,作为第三模块的输出。

3.如权利要求1所述的一种基于深度学习的输电线路视频山火检测方法,其特征在于,所述步骤5中,训练轮次为200,采用随机梯度下降优化器,初始动量为0.9,动量衰减率为

0.002,初始学习率为0.01,学习率衰减为0.00002/轮,批尺寸为8。

4.如权利要求2所述的一种基于深度学习的输电线路视频山火检测方法,其特征在于,所述步骤4.1中,通道自注意力模块主要由池化层和卷积层构成,分为两支,一支为最大池化操作,另一支为平均池化操作,然后分别输入到共享卷积层中,主要为串联的两个全连接层,第一个全连接层神经元个数为64,第二个全连接神经元个数为512,然后再将两支输出进行相加操作,最后经过Sigmoid再与输入特征相乘,获得空间注意力机制的输入特征;空间注意力机制主要也由池化层和卷积层构成,也分为两支,一支为最大池化操作,另一支为平均池化操作,然后合并两个结果,然后经过一个7×7的卷积层,将维度降到1维,最后经过Sigmoid再与输入特征做乘法,获得最终特征图。