1.一种信息年龄最小化的无人机飞行轨迹的优化方法,其特征在于,所述方法包括以下步骤:
构建用户群组与无人机的无线通信系统模型,该模型包括:一个作为移动基站的无人机,N个数据接收位置,分别对应N个数据接收位置的N个地面用户群组,其中,无人机部署有M根接收天线,每个地面用户群组中用户的数量不大于M;
利用强化学习算法建立无人机自主飞行到达每个数据接收位置的第一模型;
建立包含了无人机与用户数据传输的通信信道以及有效信息年龄计算的第二模型;
基于第一模型和第二模型,利用强化学习算法确定无人机在最小化信息年龄前提下接收所有数据的飞行轨迹。
2.根据权利要求1所述的信息年龄最小化的无人机飞行轨迹的优化方法,其特征在于,所述强化学习算法包括Q‑Learning。
3.根据权利要求1所述的信息年龄最小化的无人机飞行轨迹的优化方法,其特征在于,所述第一模型包括:
无人机的状态包括:在不同时间单元的剩余能量和在不同时间单元所处的位置;
无人机在每个状态下能够执行的多种动作;
无人机每次执行动作时的行为奖励。
4.根据权利要求3所述的信息年龄最小化的无人机飞行轨迹的优化方法,其特征在于,所述多种动作包括:向北、向南、向东、向西和悬停。
5.根据权利要求3所述的信息年龄最小化的无人机飞行轨迹的优化方法,其特征在于,所述行为奖励包括:第一行为奖励、第二行为奖励、第三行为奖励和第四行为奖励中的至少一种,其中,
第一行为奖励为:无人机到达所述数据接收位置;
第二行为奖励为:无人机经历一次训练得到信息年龄计算值;
第三行为奖励为:当无人机走出工作区域,立即停止当前训练并返回;
第四行为奖励为:当无人机在一次训练中多次到达同一所述数据接收位置,立即停止当前训练并返回。
6.根据权利要求1所述的信息年龄最小化的无人机飞行轨迹的优化方法,其特征在于,所述建立第二模型包括:
设定所述N个地面用户群组中各个用户的坐标点;
根据所述坐标点,构建第n个群组第k个用户与无人机的通信信道矢量;
计算第n个群组第k个地面用户于时间长度为L的通信链路;
计算第n个群组第k个地面用户于时间长度L的通信链路的数据传输速率;
根据数据包大小Ψ以及传输速率,构建第n个群组中第k个用户的信息年龄计算公式;
计算所有数据的信息年龄,并将所有数据的信息年龄的平均值作为有效信息年龄。
7.根据权利要求6所述的信息年龄最小化的无人机飞行轨迹的优化方法,其特征在于,在第l时间单元,所述第n个群组第k个用户与无人机的通信信道矢量为其中, βkn为信号的大尺度衰落,gkn为信号的小尺度衰落;
所述第n个群组中第k个用户在传输第l个时间单元时无人机的信干噪比为其中,
2
其中,p为用户上行发送功率, 为第l个时间单元的接收波束,σ为噪声功率, 和分别为在第l个时间单元第n个地面用户群组中第k个用户和第j个用户与无人机的信道信息,Gn为除用户k和已服务的用户集合的剩余用户集合;
所述第n个群组中第k个用户与无人机间的传输第l个时间单元的传输速率为其中,B为所述无人机接收天线的宽带。
8.根据权利要求7所述的信息年龄最小化的无人机飞行轨迹的优化方法,其特征在于,所述βkn依据3GPP信道建模。
9.根据权利要求7所述的信息年龄最小化的无人机飞行轨迹的优化方法,其特征在于,所述第n个群组中第k个用户与无人机间的传输第l个时间单元的信息年龄为其中,ηkn为一个二进制数,用于标志无人机是否接收到整个数据包,Ψ表示一个信息包的大小;
所述有效信息年龄为: 其中,K为群组中用户总数,N为地面群组总数,L为给定的通信时间长度。
10.一种无人机有效信息年龄的确定方法,其特征在于,所述方法包括以下步骤:构建用户群组与无人机的无线通信系统模型,该模型包括:一个作为移动基站的无人机,N个数据接收位置,分别对应N个数据接收位置的N个地面用户群组,其中,无人机部署有M根接收天线,每个地面用户群组中用户的数量不大于M;
建立无人机与用户数据传输的通信信道以及有效信息年龄计算的第二模型;
对于用户与无人机之间的通信链路,利用第二模型确定无人机有效信息年龄。