1.一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,其特征在于,包括如下步骤:步骤1,建立UUV避碰规划系统模型,获取前视声呐观测数据以及UUV位置、姿态、速度数据;
步骤2,构建UUV三维避碰规划动作集,对动作集中的动作进行编码;
步骤3,设计用于UUV三维自主避碰规划的双通道自注意力Transformer网络模型,包括两个编码器、一个特征融合层和一个解码器;
第一编码器接收[t‑n,t]时刻声呐观测数据Dp(t‑n,…,t),用于建立声呐观测中的注意,其中n表示历史观测时间步长;
第二编码器接收[t‑n,t]时刻目标相对UUV的方位角和深度以及UUV的纵荡速度、纵倾角度,利用第二编码器建立目标相对UUV的位姿以及UUV本体运动状态中的注意;
编码器特征融合层将两个编码器捕获的特征进行整合后形成融合特征图U(t‑n,…,t),与解码器的历史输出 共同构成了解码器输入,解码器输出UUV动作编码,其中,m为历史决策时间步长;
步骤4,构建UUV三维自主避碰规划数据集;
数据集由特征样本及标签样本组成,其中特征样本包括前视声呐观测、目标相对UUV的方位角、深度以及UUV本体的纵荡速度、纵倾角度,标签样本为期望的UUV动作编码;
步骤5,基于UUV三维自主避碰规划数据集,对双通道自注意力Transformer网络模型进行训练,优化模型参数;
步骤6,对获取的UUV位置、姿态进行预处理,得到目标相对UUV的方位角及深度;
采用线性比例变换法将前视声呐观测、目标相对UUV的方位角、深度以及UUV本体的纵荡速度、纵倾角度进行归一化处理;
将归一化后数据输入到训练后的双通道自注意力Transformer网络模型中,得到UUV动作编码,UUV执行该编码对应的动作。
2.根据权利要求1所述一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,其特征在于,步骤2中动作集包括UUV动作和填充标志位;
每个UUV动作是一组转艏角速度、纵倾角速度和纵荡加速度的组合;
动作集包括456个UUV动作和一个零填充标志位;
465个UUV动作由31个转艏角速度、3个纵倾角速度和5个纵荡加速度组合构成;
对动作集中466个元素进行one‑hot编码。
3.根据权利要求1所述一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,其特征在于,第一编码器包括Flatten层、输入嵌入层、位置编码层、Dropout层和4个第一编码器模块;
首先,将声呐观测数据序列Dp(t‑n,…,t)输入到Flatten层对其进行降维,再经过输入嵌入层、位置编码及Dropout层得到 经过4个依次连接的第一编码器模块处理后输出特征序列
4.根据权利要求1所述一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,其特征在于,第二编码器包括concatenate层、输入嵌入层、位置编码层、Dropout层和2个第二编码器模块;
将[t‑n,t]时刻目标相对UUV的方位角ψg(t‑n,…,t)、深度zg(t‑n,…,t)以及UUV本体的纵荡速度u(t‑n,…,t)、纵倾角度θ(t‑n,…,t)输入到concatenate层合并为Sp(t‑n,…,t)作为网络输入,随后,输入嵌入层、位置编码层、dropout层和2个依次连接的第二编码器模块,用于提取传感器观测数据特征,最后一个第二编码器模块输出特征序列
5.根据权利要求3所述一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,其特征在于:第一编码器模块包括多头自注意力和第一多层感知机模块两个子层,在每个子层前后分别进行Layer Normalizations和残差连接,第一多层感知机模块包含GELU非线性变换和线性变换两个子层,在每个子层后进行Dropout操作。
6.根据权利要求5所述一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,其特征在于:第二编码器模块包括多头自注意力和第二多层感知机模块两个子层,在每个子层前后分别进行Layer Normalizations和残差连接,第二多层感知机模块包含tanh非线性变换和线性变换两个子层,在每个子层后进行Dropout操作。
7.根据权利要求1所述一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,其特征在于:特征融合层通过张量融合网络将两个编码器输出的特征图融合,再利用Flatten层将融合特征图展平为二维特征图,最后采用包含64个隐藏单元的线性编码形成新的特征图,为解码器特征提取过程做准备。
8.根据权利要求1所述一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,其特征在于:解码器包括输入嵌入层、位置编码层、dropout层、4个解码器模块、以及一个全连接前馈网络层;
输入嵌入层对解码器历史输出 进行线性编码,为接下来的特征提取
过程做准备,随后,输入位置编码层、dropout层得到 4个依次连接的解码器模块从特征融合层输出及 中注意与UUV避碰决策相关的关键信息输出到全连接前馈网络层,全连接前馈网络层负责整体特征信息的拟合,并输出UUV动作编码。
9.根据权利要求8所述一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,其特征在于:所述解码器模块包括多头自注意力、掩码多头互注意力及tanh非线性变换多层感知机模块三个子层,每个子层前后分别为Layer Normalizations和残差连接,并在多头自注意力子层的残差连接后进行切片操作。
10.根据权利要求1所述一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法,其特征在于:在归一化处理之前,对目标在UUV本体坐标系下的深度 进行如下预处理: