利索能及
我要发布
收藏
专利号: 2021107400293
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种安防检测模型训练方法,其特征在于,包括:

从安防检测系统上获取待检测图片,并提取所述待检测图片的二维特征向量与空间位置编码信息;

基于预设的降维方式,对所述二维特征向量与所述空间位置编码信息进行降维处理,获得图像特征矩阵;

基于Transformer算法的多层编码层,将所述图像特征矩阵分别与预设值矩阵、预设键矩阵、预设查询矩阵进行相乘,得到对应的第一值特征矩阵、第一键特征矩阵和第一查询特征矩阵;

对所述第一值特征矩阵与所述第一键特征矩阵进行卷积计算,获得第一局部特征矩阵,并将所述第一局部特征矩阵与所述第一查询特征矩阵进行第一预测处理,获得预测目标向量矩阵;

基于Transformer算法的多层解码层,将所述预测目标向量矩阵分别与所述第一值特征矩阵、所述第一键特征矩阵进行相乘,得到对应的第二值特征矩阵和第二键特征矩阵;

对所述第二值特征矩阵与所述第二键特征矩阵进行卷积计算,获得第二局部特征矩阵,并将所述第二局部特征矩阵与第二查询特征矩阵进行第二预测处理,获得安防检测结果。

2.根据权利要求1所述的方法,其特征在于,所述从安防检测系统上获取待检测图片,并提取所述待检测图片的二维特征向量与空间位置编码信息的步骤包括:从安防检测系统上获取待检测图片;

对所述待检测图片进行预处理,得到预处理图片;

基于卷积神经网络,对所述预处理图片进行特征提取,得到二维特征向量与空间位置编码信息。

3.根据权利要求2所述的方法,其特征在于,所述对所述待检测图片进行预处理,得到预处理图片的步骤包括:基于预设的宽高排序方式,对所有的待检测图片进行排序,并得到填充参照图片;

采用所述填充参照图片,对其他待检测图片的进行填充处理,并使用掩码矩阵对填充部分进行标记,得到规格一致的预处理图片。

4.根据权利要求1所述的方法,其特征在于,所述基于预设的降维方式,对所述二维特征向量与所述空间位置编码信息进行降维处理,获得图像特征矩阵的步骤包括:对所述二维特征向量进行降维处理,得到一维特征;

将所述一维特征与所述空间位置编码信息相加,得到一维特征序列;

将所述空间位置编码信息与预设位置权重矩阵进行相乘,得到位置编码向量矩阵;

将所述一维特征序列与所述位置编码向量矩阵输入Transformer算法的编码过程,以使所述Transformer算法的编码层根据所述位置编码向量对所述一维特征序列进行还原处理,得到所述图像特征矩阵。

5.根据权利要求1所述的方法,其特征在于,所述对所述第一值特征矩阵与所述第一键特征矩阵进行卷积计算,获得第一局部特征矩阵,并将所述第一局部特征矩阵与所述第一查询特征矩阵进行第一预测处理,获得预测目标向量矩阵的步骤包括:对所述第一值特征矩阵与所述第一键特征矩阵进行点乘处理,并除以预设常数值,获得第一局部特征矩阵;

对所述第一局部特征矩阵和所述第一查询特征矩阵进行注意力计算,得到第一注意力特征矩阵;

将所述第一注意力特征矩阵与所述图像特征矩阵进行相加,更新所述图像特征矩阵;

对所述图像特征矩阵进行归一化处理,并通过前馈神经网络,将所述图像特征矩阵作为第一局部特征矩阵返回对所述第一局部特征矩阵和所述第一查询特征矩阵进行注意力计算,得到第一注意力特征矩阵的步骤继续执行,直到基于Transformer算法的所有编码层执行完毕,将得到的图像特征矩阵作为预测目标向量矩阵。

6.根据权利要求1所述的方法,其特征在于,所述对所述第二值特征矩阵与所述第二键特征矩阵进行卷积计算,获得第二局部特征矩阵,并将所述第二局部特征矩阵与第二查询特征矩阵进行第二预测处理,获得安防检测结果的步骤包括:对所述第二值特征矩阵与所述第二键特征矩阵进行点乘处理,并除以预设常数值,获得第二局部特征矩阵;

对所述第二局部特征矩阵和所述第二查询特征矩阵进行注意力计算,得到第二注意力特征矩阵;

将所述第二注意力特征矩阵与所述预测目标向量矩阵进行相加,更新所述预测目标向量矩阵;

对所述预测目标向量矩阵进行归一化处理,并通过前馈神经网络,将所述预测目标向量矩阵作为第二局部特征矩阵返回对所述第二局部特征矩阵和所述第二查询特征矩阵进行注意力计算,得到第二注意力特征矩阵的步骤继续执行,直到基于Transformer算法的所有解码层执行完毕,将得到的预测目标向量矩阵作为安防预测结果。

7.根据权利要求1至6任一项所述的方法,其特征在于,所述对所述第二值特征矩阵与所述第二键特征矩阵进行卷积计算,获得第二局部特征矩阵,并将所述第二局部特征矩阵与第二查询特征矩阵进行第二预测处理,获得安防检测结果之后,所述方法还包括:对所述待检测图片进行文本描述分析,得到待检测图片的文本描述结果。

8.一种安防检测模型训练装置,其特征在于,包括:

第一数据获取模块,用于从安防检测系统上获取待检测图片,并提取所述待检测图片的二维特征向量与空间位置编码信息;

图像特征矩阵获取模块,用于基于预设的降维方式,对所述二维特征向量与所述空间位置编码信息进行降维处理,获得图像特征矩阵;

第二数据获取模块,用于基于Transformer算法的多层编码层,将所述图像特征矩阵分别与预设值矩阵、预设键矩阵、预设查询矩阵进行相乘,得到对应的第一值特征矩阵、第一键特征矩阵和第一查询特征矩阵;

预测目标向量矩阵获取模块,用于对所述第一值特征矩阵与所述第一键特征矩阵进行卷积计算,获得第一局部特征矩阵,并将所述第一局部特征矩阵与所述第一查询特征矩阵进行第一预测处理,获得预测目标向量矩阵;

第三数据获取模块,用于基于Transformer算法的多层解码层,将所述预测目标向量矩阵分别与所述第一值特征矩阵、所述第一键特征矩阵进行相乘,得到对应的第二值特征矩阵和第二键特征矩阵;

安防检测结果获取模块,用于对所述第二值特征矩阵与所述第二键特征矩阵进行卷积计算,获得第二局部特征矩阵,并将所述第二局部特征矩阵与第二查询特征矩阵进行第二预测处理,获得安防检测结果。

9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至

7中任一项所述安防检测模型训练方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述安防检测模型训练方法的步骤。