利索能及
我要发布
收藏
专利号: 2024115066749
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于无人机的通感算融合网络DNN拆分学习方法,其特征在于:无人机通感算融合网络包含多个无人机、配备边缘服务器的中心控制器和地面终端用户;

其中,每个无人机,配备计算模块和通信模块,用于与边缘服务器进行数据交互;

边缘服务器,具有计算能力和存储资源,用于负责集中处理复杂计算任务;

地面终端用户,用于生成计算任务,并通过无线链路将任务卸载到无人机和边缘服务器;

无人机辅助的通感算融合网络环境包含通信用户集合和计算服务器集合:其中,通信用户集合包含需要通信服务和受目标感知的用户,包含智能手机、移动平板、无人驾驶车辆终端设备;

计算服务器集合包含搭载了DNN处理功能的无人机和边缘服务器;每个无人机可与多个通信用户交互,每个通信用户只能与一架无人机连接;通信和感知数据可以由无人机处理或卸载到边缘服务器;

具体包含如下步骤:

步骤1,初始化与感知:无人机飞行在终端用户的上空,终端用户生成计算任务并请求服务,无人机利用感知功能选择感知目标、收集环境数据;感知数据收集完成,感知数据通过无线链路传输到中心控制器;随后,进入任务分配与调度阶段;

步骤2,任务分配与调度:根据优化策略算法分配任务,利用自适应拆分学习方法,确定DNN的拆分策略、每个无人机的计算任务、传输任务和轨迹优化方案;任务分配完成,进入DNN拆分与计算阶段;

步骤3,DNN拆分与计算:无人机执行DNN的早期层计算,将中间结果卸载到中心控制器并进一步执行DNN的后续层计算,完成任务;计算完成,进入结果返回阶段;

步骤4,结果返回:中心控制器通过无线链路和无人机将计算结果返回给终端用户;结果返回完成,整个操作周期结束;

在步骤2中,优化策略算法包含无人机轨迹优化、DNN拆分的自适应调整和计算资源的分配,以优化多用户任务的卸载和计算资源分配,用于保证任务处理的低时延和低能耗;

在步骤2中,自适应拆分学习方法将深度神经网络模型分割为多个部分,分别在不同的无人机和边缘服务器上执行;具体步骤如下:模型分割:根据任务的计算需求和网络状态,将DNN模型自适应地分割为若干子模型;

每个子模型可以在不同的计算节点即无人机或边缘服务器上独立执行;

任务卸载:根据当前网络状态和计算资源情况,利用Actor‑Critic学习算法,动态选择最优的通信、计算资源分配和子模型分配到合适的计算节点;

协同计算:各计算节点协同执行子模型,通过无线链路传输中间结果,实现DNN模型的正向传播和反向传播;

结果返回:计算完成后,将结果通过无线链路返回给地面终端用户;

为实现上述自适应拆分学习,采用基于Actor‑Critic学习算法训练,具体包括以下步骤:状态表示:将系统的计算资源、通信资源和任务需求表示为状态向量,包括无人机的计算能力、电池电量、网络带宽、任务大小;

Actor网络动作选择:在每个决策时刻,根据当前状态选择最优策略动作,包括模型分割点和资源分配方案;

奖励函数:定义奖励函数,综合考虑任务的计算时延和能量消耗,以优化系统的长期性能;

Critic网络策略更新:更新Actor网络,优化策略方案,提高系统性能;

在步骤2中,使用拆分学习进行DNN模型训练;无人机和边缘服务器合作训练DNN模型,模型分为N层,层集表示为N={1,2,...,N},训练轮次为T次,轮次集合表示为T={1,2,...,T};对模型计算时延、能耗和总成本进行建模;具体包含如下步骤;

步骤2.1,前向传播计算:

无人机端的计算:

其中, 为第t次迭代时,无人机端执行DNN网络第i层任务的前向传播计算时延,Li为第i层计算所需的浮点运算数量,C0为一个CPU周期内处理的浮点运算个数, 为无人MD机端的CPU计算频率;无人机端计算能耗设为E (t);

边缘服务器端计算:

其中, 为第t次迭代时,边缘服务器端执行DNN网络第i层任务的前向传播计算时延,Li为第i层计算所需的浮点运算数量, 为边缘服务器为无人机m分配的CPU计算频率;

步骤2.2,反向传播计算:

无人机端的计算:

其中, 为第t次迭代时,无人机端执行DNN网络第i层任务的反向传播计算时延,MBLi,B为第i层更新梯度计算所需的浮点运算数量;无人机端计算能耗设为E (t);

边缘服务器端计算:

其中, 为第t次迭代时,边缘服务器端执行DNN网络第i层任务的反向传播计算时延,Li,B表示第i层更新梯度计算所需的浮点运算数量;

步骤2.3,通信延迟及能耗:

上行传输延迟从MD到ES:

其中, 为第t次迭代时,第i层任务输出数据的传输延迟;Ii为第i层的输出数据量,以比特为单位,PU(t)为上行传输速率; 表示上行传输时无人机能耗;

下行传输延迟从ES到MD:

其中, 为第t次迭代时,第i层任务输出数据的传输延迟;Ii是第i层的输出数据量,RD(t)为下行传输速率; 表示下行传输时无人机能耗;

步骤2.4,成本计算:设xi(t)∈{0,1}为二进制DNN分裂指示指标,若DNN第i层计算在无人机端进行,xi(t)=1,否则为xi(t)=0;

计算成本为所有计算任务的执行时延和在无人机端的计算能耗组成:其中,w为时延与能耗之间的权重因子;

通信成本:通信成本包括在前向传播和反向传播过程中数据在无人机端和边缘服务器之间传输时产生的时延和能耗进行分割;

前向传播通信成本:

反向传播通信成本:

系统总成本:

ETCall=ETCcmp(t)+ETCcom(t)+ETCres(t)+ETCsc(t)其中,ETCres(t)代表DNN重分割成本,ETCsc(t)代表感知通信成本;

使用Actor‑Critic学习算法训练模型,调整资源分配,以最小化长期平均成本;优化算法实现如下:

1)获取足够的环境信息:包括无人机CPU最大计算频率、边缘服务器CPU最大计算频率、计算任务最大可容忍总延迟、无人机的能量限制和当前系统状态信息;

2)初始化经验回放存储D和平均奖励 使用随机权重初始化网络;每个训练轮次t,初始化状态s(t),Actor网络根据选择策略选择动作a(t);执行选择的动作a(t),获得奖励U,并观察新状态s(t+1),将(s(t),a(t),U,s(t+1))储存到D中,从经验回放储存D中均匀抽取一个小批量进行训练,更新目标状态‑动作值R;Critic网络执行梯度下降最小化损失函数L,更新Actor网络权重,并定期更新目标网络的网络权重以稳定训练过程;如果选择的是非探索性动作,更新平均奖励 输出动作a(t),直到达到最大训练轮次;

3)完成DNN分割和资源分配,开始计算,返回计算结果。

2.根据权利要求1所述的一种基于无人机的通感算融合网络DNN拆分学习方法,其特征在于:在步骤1中,环境数据采用笛卡尔坐标系,所有无人机飞行在同一的高度,地面终端用户随机分布;在每一个时隙内终端用户认为是静态的。