利索能及
我要发布
收藏
专利号: 2024103613082
申请人: 临沂大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-04-09
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种双光融合动态超分辨率分层感知方法,其特征在于,包括以下步骤:

S1:对遥感图像的可见光和红外图像进行预处理;

S2:将步骤S1中的处理后的图像数据划分为训练数据集和验证数据集;

S3:基于遥感多模态数据集构建一种双光融合动态超分辨率分层感知目标的检测模型;

S4:使用步骤S2中的训练数据集对步骤S3搭建的检测模型进行训练和优化,并将得到的最优模型权重进行保存;

S5:将步骤S2中的验证数据集输入S3中构建的模型,通过加载S4中的最优模型权重,以检测遥感图像的目标;

步骤S3包括以下步骤:

S31:训练的可见光和红外图像被重新分配尺寸,并分别被输入跨模态融合模块中,其中,可见光图像和红外图像分别被1×1卷积进行特征提取,提取的特征分别乘以高的0.5倍,并通过哈达玛乘积进行计算,再分别通过3×3卷积进行特征提取,提取到的特征被通道拼接为特征 的公式为: ,其中 表示卷积核为1的卷积, 表示卷积核为3的卷积, 是哈达玛乘积, 和分别表示可见光和红外数据, 是特征的高度, 是按照通道拼接, 被自适应平均池化处理,接着经过1×1卷积和激活函数处理,将处理后的特征与特征 按通道维度拼接得到跨模态融合模块的最终特征 公式为: ,其中是底为2的指数函数, 表示输入尺寸大小是宽度为 和高度为 的特征 , 表示步长, 表示填充值, 是卷积核大小, 是权重系数, 是偏置值, 是缩放因子;

S32:将跨模态融合模块的输出特征输入到5个普通卷积块和4个残差卷积块中进行特征提取的操作,将第4个残差卷积块提取的特征送入到空洞感知模块,对目标特征进行有效感知;其中空洞感知模块的结构为:对提取的特征分两条路径处理,第一条路径经过1×1组卷积后被3×3空洞卷积处理,接着被激活函数进行线性映射,提高表征能力,接着通过三个连续采样率为3的3×3空洞卷积对特征的不同尺度进行感知,将三个3×3空洞卷积处理后的特征分别按通道拼接,拼接后的特征被3×3空洞卷积处理,经过激活函数进行非线性映射得到特征 ;第二条路径经过1×1组卷积处理,将处理后的特征与 按通道拼接得到空洞感知模块的输出特征 ,空洞感知模块的流程表示为:,其中, 表示采样率大小, 表示

输入的样本向量, 表示分组数为 的标准卷积, 表示卷积核为3的空洞卷积, 是第个向量的权重系数, 是第 个向量的偏置值, 是激活函数, 表示空洞卷积的数量,表示样本的总量;

S33:将空洞感知模块的输出特征 和第4个残差卷积块的特征都输入到滑动注意力解码器中;滑动注意力解码器的具体结构为:将输入特征划分成三条路径进行处理,第一条路径用于生成向量 ,第二条路径被1×1卷积处理,并通过滑动窗口选取局部特征查询向量 ,第三条路径被3×3卷积进行特征提取,通过批归一化和激活函数进行初步处理,接着再继续用3×3卷积和批归一化进行处理,通过滑动窗口选取局部特征,并与第三条路径的输入特征通过残差连接进行逐元素加和得到特征查询向量 ,将 乘以参数 与 乘以参数 进行逐元素加和得到查询向量 和转置向量 ,将向量 、 和第一条路径的向量 进行逐元素相乘来计算注意力分数以得到特征向量 ,将向量 与向量 重新设置尺寸大小并按通道拼接并利用1×1卷积处理得到键向量 ,将向量 与特征向量逐元素相乘以计算注意力分数;特征向量 和转置向量 的计算公式为:,

,其中, 和 分别表示第二条路径和第三条路径的输入,

和 表示控制变量的参数, 表示重新调整尺寸大小, 表示卷积操作, 是批归一化操作, 是激活函数, 是向量 的转置, 表示滑动窗口的大小为宽度 和高度 , 表示矩阵的各个元素值;此外,滑动注意力解码器的注意力计算公式表示为: , ,,其中, , 和 是可学习权重, 表示某

一层的特征向量, 表示注意力的头数, 是比例因子, 是一个注意力头的计算分数, 是参数矩阵, 表示 和注意力头的注意力分数, 表示按通道维度拼接,表示将计算结果转换成权重概率;通过设置多个注意力头将特征映射到多组 ,和 中,使用相同的计算过程来得到最终的注意力分数,最后利用1×1卷积处理,并将处理后的特征与特征向量 按通道拼接得到最后的输出特征 表示为:,其中, 表示第三个分支在逐元素加和后的输出值,

是1×1卷积, 表示逐元素加和;

S34:将第四个普通卷积块的输出与滑动注意力解码器的输出输入到超分辨率模块中,超分辨率模块的结构为:输入特征先被1×1卷积进行通道压缩,再分两个分支分别被3×3卷积和采样率为3和采样率为2得到亚像素卷积进行上采样操作,然后上采样后的特征被批归一化处理,经过激活函数映射到复杂的空间,以增强模型的表征能力;超分辨率模块对特征的增强过程为: ,其中, 表示采样率为2的亚像素卷积, 表示采样率为3的亚像素卷积, 表示第四个普通卷积块的输出特征, 表示滑动注意力解码器的输出特征, 表示卷积核为1的标准卷积,表示卷积核为3的标准卷积, 表示批归一化操作, 表示激活函数, 表示超分辨率模块的输出特征;

S35:将超分辨率模块的输出特征 视为浅层特征,与滑动注意力解码器的输出特征按通道拼接得到中间层特征,将中间层特征与空洞感知模块的输出特征 按通道拼接得到深层特征,浅层特征、中间层特征和深层特征分别被两个普通卷积块分别处理,并按通道拼接得到最后的三个输出。

2.根据权利要求1所述双光融合动态超分辨率分层感知方法,其特征在于,步骤S1包括以下步骤:S11:对可见光和红外图像的数据进行筛选,将没有标签的图像和标签重复的图像筛除,保留有标签和没有重复标签的图像数据;

S12:对步骤S11中有标签和没有重复标签的图像数据重新调整输入图像的分辨率大小,保持所有图像分辨率一致。

3.根据权利要求1所述双光融合动态超分辨率分层感知方法,其特征在于,步骤S2包括以下步骤:S21:对步骤S12相同分辨率的可见光和红外图像数据的所有图片名字进行修改;

S22:根据S21中修改的图像将所对应的标签也进行修改名称,将可见光图像和红外图像名称与标签名称保持一致;

S23:对S22修改后的图像和标签分别建立图像和标签文件夹,并将可见光和红外图像放入图像文件夹,仅将可见光的标签放入标签文件夹;

S24:将所有步骤S23的图像样本按照8:2的比例划分为训练数据集和验证数据集。

4.根据权利要求1所述双光融合动态超分辨率分层感知方法,其特征在于,步骤S4具体方法为:S41:将多模态训练集输入到模型中进行模型的训练,进一步设置模型的相关超参数,其中动量值为0.935,学习率为0.001,总的训练轮数为500轮,每20轮保存一次权重,结束训练时保留最优权重;

S42:构建检测模型反向传播的损失函数,通过计算损失函数来不断优化模型的性能,模型的整体损失函数 由旋转检测损失函数 和超分辨率融合损失函数 表示为: ,其中 和 表示平衡系数;接着,通过分类损失函数 、回归损 失 和 旋 转 角 度损 失 函 数 构 成 旋 转 损 失 函 数 表 示 为 :,其中 、 和 表示损失函

数在不同层的权重值, 表示检测头部分的输出层数, 、 和 分别表示调节边界框的坐标、维度和角度的权重值, 表示每个类别的权重系数, 是标签,是标签的掩码矩阵, 是预测值, 是真实值, 是样本 预测为正样本的概率, 表示二进制交叉熵损失函数, 是预测旋转角度, 是实际的旋转角度,超分辨率损失函数 表示为:,其中, 表示图像对的数量, 表示真实值, 表示预测值;

S43:通过验证多模态数据集测试模型的性能,在模型预测部分需要计算平均精度指标来体现模型性能的好坏, 的数值越高,表示模型的性能越好, 的计算公式为: ,其中, ,精确率,召回率 , 是正确检测的正样本数, 是未

能被检测出来的正样本数, 是错误检测的正样本数, 是预测的类别数量;将计算的结果的最高权重文件进行保存;

S44:多模态数据训练过程中,利用SGD优化器优化模型以保证模型参数的优化更新,即将每个数据样本输入网络计算梯度后就进行一次更新,其计算公式为:,其中, 是模型的参数,

表示样本 和样本 输入模型后在 的范围内

对参数进行更新, 表示样本的个数, 表示批次大小, 是学习率,循环更新到训练次数结束,输出模型的最优权重;

S45:按照步骤S43继续计算 的数值,直到完成所有的500个训练轮数为止。

5.根据权利要求1所述双光融合动态超分辨率分层感知方法,其特征在于,步骤S5具体方法为:S51:将步骤S2的多模态验证数据集输入到步骤S3构建的模型中,设置交并比阈值

0.01,置信度为0.5;

S52:将步骤S4中保存的最优权重加载到步骤S3构建的模型中,冻结特征提取部分,测试输出 结果。