1.基于图注意力机制和动态优先级回放的SDN路由方法,用于战术通信网络中信息的传输,其特征在于,包括以下步骤:
步骤1、使用网络仿真工具构建虚拟战术通信网络拓扑,包括定义终端节点、转发节点,建立节点设备间逻辑连接链路,配置节点设备间链路的参数包括带宽、时延;
步骤2、基于事件驱动的拓扑状态监听机制周期性地采集数据平面的网络拓扑数据,包括节点数量、链路数量和连接关系,构建网络拓扑图;
步骤3、基于南向接口协议周期性地采集并计算数据平面中的各转发节点设备端口的数据,包括转发节点设备端口的发送速率和接收速率,获得网络状态信息;
步骤4、基于网络拓扑图谱与网络状态信息,采用最短路径算法为战术通信网络中每对源‑目的节点生成备选转发路径集,并计算各转发路径的性能指标包括链路剩余带宽、时延、丢包率以及可行路径节点负载方差,输出结构化路径描述文件;
步骤5、构建GAT‑DPR模型结构,包括图注意力网络、策略网络、目标网络、经验回放池;
以结构化路径描述文件为输入,基于图注意力网络对网络拓扑图中的节点与链路特征进行聚合,获得网络拓扑图的全局特征向量;将网络拓扑图的全局特征向量输入策略网络,输出当前时刻网络状态的动作价值,以此计算当前时刻网络状态对应的最高价值的动作,与网络环境交互获取下一时刻网络状态、当前时刻的奖励值,由当前时刻网络状态、当前时刻网络状态对应的最高价值的动作、下一时刻网络状态、当前时刻的奖励值形成四元组,并作为样本存入经验回放池中;根据动态优先级回放和采样机制,迭代优化策略网络参数,并周期性将策略网络参数同步到目标网络,直至奖励值达到最大,获得当前网络状态下的最优路由策略并输出;
以结构化路径描述文件为输入,以优化后的路由策略为输出,对GAT‑DPR模型结构进行训练,获得训练后的GAT‑DPR模型;
步骤6、以待优化的战术通信网络的结构化路径描述文件为输入,应用训练后的GAT‑DPR模型,获得优化后的路由策略;将优化后的路由策略生成流表下发至数据平面的转发节点设备中,最终完成流量的转发。
2.根据权利要求1所述的基于图注意力机制和动态优先级回放的SDN路由方法,其特征在于,图注意力网络通过线性变换将输入的备选转发路径的状态信息编码为节点特征向量、通过自注意力机制计算节点与邻居节点的注意力权重,然后生成经邻居节点特征加权聚合后的各节点特征,最后将所有节点特征聚合,从而获得网络拓扑图的全局特征向量,作为策略网络的输入;
策略网络基于网络拓扑图的全局特征向量,通过策略网络全连接层输出当前时刻网络状态下的动作价值,以此计算当前时刻网络状态对应的最高价值的动作,与网络环境交互获取下一时刻网络状态、当前时刻的奖励值;由当前时刻网络状态、最高价值的动作、下一时刻网络状态、当前时刻的奖励值形成四元组,并作为样本存入经验回放池中;
直至存入的样本数量达到经验回放池的容量阈值时,随机抽取出预设批次大小的样本,以抽取的样本为策略网络和目标网络的输入,策略网络与目标网络结合计算各个样本的时序差分TD误差,引入衰减因子动态调整经验回放池中样本的优先级,基于优先级权重调整样本采样概率,基于均方误差损失更新策略网络参数;周期性将策略网络参数同步到目标网络直至模型结构收敛,即奖励值达到最大,输出最优路由策略。
3.实现权利要求1所述的基于图注意力机制和动态优先级回放的SDN路由方法的架构,其特征在于,包括应用层、控制层和数据层;应用层通过北向接口与控制层连接;控制层主要包括网络拓扑感知模块、网络状态检测模块、初始路径计算模块、路径优化模块及路径安装模块,并由网络拓扑感知模块、网络状态检测模块、初始路径计算模块、路径优化模块及路径安装模块分别执行SDN路由方法中的步骤2、步骤3、步骤4、步骤5及步骤6;数据层通过网络仿真工具构建虚拟网络拓扑,并通过南向接口与控制层相连,接收控制层下发的各条控制策略。