1.基于深度注意力的自适应多尺度视觉特征表达方法,其特征是,包括:
获取原始神经网络模型作为SDA网络模块的主干分支,用于分层特征的提取;设计SDA网络模块的轻量化深度注意力分支,用于动态加权分层特征,具体包括:通过使用元素求和方法来合并主干分支的层次结构特征获得融合特征F,利用GAP对F特征图的空间信息进行聚合,生成全局空间上下文描述符u,u被输入到两个1×1卷积中,v=W2(γ(β(W1u))),其中W2是一个可学习的线性变换,用于恢复通道维度,γ表示ReLU函数,β表示BN函数,W1是一个可学习的线性变换,W1u表示将u映射到一个低维空间,将v沿深度维度对齐,通过重塑操作得T t到v,再采用softmax激活函数实施软加权机制,s =δ(v),其中δ表示softmax函数,sT为注意力向量集合,在每个SDA模块的末尾,根据输入对象的尺度通过跨块特征进行软加权,自适应融合不同尺度的语义信息;堆叠多个SDA网络模块构成神经网络,即为基于深度注意力的自适应多尺度视觉特征表达的神经网络方法;对自适应多尺度特征表达神经网络SDA‑Net进行参数优化,所得到的神经网络模型作为网络主干对输入的图像进行图像分类、目标检测和实例分割。
2.如权利要求1所述的方法,其特征是,所述获取原始神经网络模型作为SDA网络模块的主干分支,用于分层特征的提取;还包括:从获取原始神经网络模型的主干分支中间块的输出特征中提取一个特征图序列Z=[Z1,Z2,…,Zm],m是块数。
3.基于深度注意力的自适应多尺度视觉特征表达系统,其特征是,包括:
主干分支模块,获取原始神经网络模型作为SDA网络模块的主干分支,用于分层特征的提取;深度注意力分支模块,设计SDA网络模块的轻量化深度注意力分支,用于动态加权分层特征,具体包括:通过使用元素求和方法来合并主干分支的层次结构特征获得融合特征F,利用GAP对F特征图的空间信息进行聚合,生成全局空间上下文描述符u,u被输入到两个1×1卷积中,v=W2(γ(β(W1u))),其中W2是一个可学习的线性变换,用于恢复通道维度,γ表示ReLU函数,β表示BN函数,W1是一个可学习的线性变换,W1u表示将u映射到一个低维空间,将vT T沿深度维度对齐,通过重塑操作得到v,再采用softmax激活函数实施软加权机制,s =δT
(v),其中δ表示softmax函数,s 为注意力向量集合,在每个SDA模块的末尾,根据输入对象的尺度通过跨块特征进行软加权,自适应融合不同尺度的语义信息;堆叠模块,多个SDA模块堆叠构成神经网络,即为基于深度注意力的自适应多尺度视觉特征表达的神经网络方法;优化模块,对自适应多尺度特征表达神经网络SDA‑Net进行参数优化,所得到的神经网络模型作为网络主干对输入的图像进行图像分类、目标检测和实例分割。
4.一种电子设备,其特征是,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述权利要求1‑2任一项所述的方法。
5.一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1‑2任一项所述的方法。