利索能及
我要发布
收藏
专利号: 2024106873236
申请人: 广州航海学院
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-01
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种超密集网络的STAR‑RIS配置和管理方法,其特征在于,包括以下步骤:步骤一:构建超密集通信网络模型;所述超密集通信网络包括宏基站和各个通信设备,所述通信设备包括基站、用户终端以及无人机;所述无人机配置有STAR‑RIS模块,用于将所述宏基站发送的信号进行反射和透射;其中,所述基站为小基站;

步骤二:基于该超密集通信网络模型中各个通信设备的类型,构建超密集通信网络的速率模型和功率模型;

步骤三:基于所述超密集通信网络的速率与功率的第一比值,构建效益目标函数;

步骤四:将通信速率以及所述无人机个数作为状态空间、将各个坐标设备部署情况作为动作空间、将所述超密集通信网络的能量效率作为奖励,通过SAC算法进行迭代计算,求解效益目标函数为最大值的优化问题,以得到所述效益目标函数为最大值时,超密集通信网络的各个网络参数;所述网络参数包括所述超密集通信网络的功率、各个所述无人机对应的相移、各个所述无人机的坐标以及各个所述基站的坐标;

步骤一所述构建超密集通信网络模型,包括:

定义基站集合和无人机集合;

定义各个无人机的坐标、无人机的总数量、各个基站的坐标以及基站的总数量;

定义各个基站到对应的用户终端的信道增益和块衰落;所述块衰落包括路径衰落、选择性频率衰落和阴影衰落;

根据宏基站到各个用户终端的信道、宏基站到各个无人机的信道以及各个无人机到对应的用户终端的信道,分别得到宏基站到各个无人机的路径损耗以及各个无人机到对应的用户终端的路径损耗;

定义宏基站到用户的传输的信道增益;

分别定义各个基站对应的用户终端接收信号时的信噪比和各个无人机对应的用户终端接收信号时的信噪比;

步骤二所述基于该超密集通信网络模型中各个通信设备的类型,构建超密集通信网络的速率模型和功率模型,包括:根据基站对应的用户终端接收信号时的信噪比,定义基站对应的用户终端的速率;

根据无人机对应的用户终端接收信号时的信噪比,定义无人机对应的用户终端的速率;

根据各个基站对应的用户终端的速率和各个无人机对应的用户终端的速率之和,得到超密集通信网络的速率模型;

根据各个基站对应的用户终端的功率和各个无人机对应的用户终端的功率之和,得到超密集通信网络的功率模型;

步骤三所述基于所述超密集通信网络的速率与功率的第一比值,构建效益目标函数包括:基于所述超密集通信网络的速率模型和功率模型,获得所述超密集通信网络的速率与功率的第一比值;

根据基站与无人机分别对应的资源量,计算所述超密集通信网络的资源总量;

根据所述第一比值与所述资源总量之间的第二比值,构建所述效益目标函数。

2.根据权利要求1所述的方法,其特征在于,所述定义基站集合和无人机集合,包括:每个基站配备NB个天线,每个用户终端配备有单个天线,基站集合为{S1,S2,...,Sn,...,SN},无人机集合为{R1,R2,...,Ri,...,RI};用户终端分为与基站对应的用户终端以及与无人机对应的用户终端;

所述定义各个无人机的坐标、无人机的总数量、各个基站的坐标以及基站的总数量,包括:定义二进制变量αx,y[k,i],αx,y[k,i]=1表示在坐标(x,y)处配置了一个无人机;定义二进制变量βx,y[k,n],βx,y[k,n]=1表示在坐标(x,y)处配置了一个基站;无人机总数目为I,基站的总数目为N;假定总共有Imax个无人机和Nmax个基站可用于配置;每个无人机配置1个STAR‑RIS模块;

所述定义各个基站到对应的用户终端的信道增益和块衰落,包括:假定 第 n个 基站 ,记为 服务 的 用户 k为从基站到用户的信道被认为是直射路径,则基站n到用户终端k的信道增益可表示为 通信信道的块衰落由路径衰落、选择性频率衰落和阴影衰落组成,其中,路径衰落为hp,与 成正比,η为路径衰落指数,d为基站n到用户终端k的距离,d0为参考距离,选择性频率衰落hf服从σf的瑞利分布,阴影衰落hs为 的形式,ξ为服从(0,2

σs)正态分布的随机变量;

宏基站到各个无人机的路径损耗如下公式:

其中,第i个无人机记为Ri, 经过无人机Ri反射和透射的用户终端k为宏基站直射到该用户终端k的信道为hk,i,M,宏基站到第i个无人机的信道为 第i个无人机到用户终端k的信道为 Ri服务的用户 接收宏基站的直射信号以及宏基站通过无人机反射和透射的信号;di,M表示宏基站到第i个无人机的距离;η表示附加损耗;

各个无人机到对应的用户终端的路径损耗如下公式:其中,dk,i表示第i个无人机到用户终端k的距离;

宏基站通过无人机反射和透射到用户终端k的传输的信道向量为hk,i;

宏基站到用户 的总信道增益hk=hk,i,M+hk,i;分别定义各个基站对应的用户终端接收信号时的信噪比和各个无人机对应的用户终端接收信号的信噪比,包括:定义二进制连接变量αx,y[k,i]和βx,y[k,n],当值为1(数字)时表示用户终端k连接坐标为(x,y)处的第i个STAR‑RIS‑UAV或第n个基站,值为0时表示没有建立连接;基站Sn服务的用户 在收到基站Sn发送的有用信号时,用户 接收的信噪比为:其中 表示Sn分配给用户终端k的功率;

通过第i个STAR‑RIS反射或透射信号的用户Uk接收的信噪比为:其中, 表示宏基站分配给第i个STAR‑RIS‑UAV服务的用户终端k的功率。

3.根据权利要求1所述的方法,其特征在于,基站对应的用户终端k的速率如下式:其中,B表示带宽;

无人机对应的用户终端k的速率如下式:

超密集通信网络的速率模型如下公式:

超密集通信网络的功率模型如下公式:

4.根据权利要求1所述的方法,其特征在于,所述效益目标函数如下公式:

5.根据权利要求4所述的方法,其特征在于,步骤四所述效益目标函数为最大值的优化问题,如下公式:

6.根据权利要求5所述的方法,其特征在于,所述得到所述效益目标函数为最大值时,超密集通信网络的各个网络参数,包括:当所述效益目标函数为满足目标约束条件的最大值时,获取所述超密集通信网络中的各个网络参数;所述目标约束条件用于指示所述超密集通信网络的网络参数的取值范围;

所述目标约束条件具体包括以下至少一者:

所述超密集通信网络的功率不小于零且不超过最大功率阈值;

所述超密集通信网络的速率不小于最小速率阈值;

所述超密集通信网络的资源总量不超过最大资源量阈值。

7.根据权利要求6所述的方法,其特征在于,步骤四所述将通信速率以及所述无人机个数作为状态空间、将各个坐标设备部署情况作为动作空间、将所述超密集通信网络的能量效率作为奖励,通过SAC算法进行迭代计算,包括:选取各个用户作为智能体;

定义速率标识量 当智能体k的速率R>Rmin时, 否则定义数量标识量 当目标范围内的无人机个数N

定义无人机或者基站标识变量IS和坐标变量coordinate,当坐标处放置无人机或者基站时,IS=1;当坐标处不放置无人机或者基站时,IS=0;建立智能体动作空间集合:其中,coordinate∈{(‑1,‑1),(‑1,0),(‑1,1),(0,‑1),(0,0),(0,1),(1,‑1),(1,0),(1,1)};

基于超密集网络的效益,建立奖励函数,如下公式:按照以下步骤进行迭代计算:

S1:初始化状态值网络参数ψ、状态值目标网络 Q网络θ和策略网络φ、学习率λV、λQ、λπ、更新率τ;

S2:针对每个集合(For episode=1 to M)中的每个对象(For t=1 to T),执行步骤S21至步骤S25;

S21:通过策略采样得到动作at~πφ(at|st);

S22:执行动作at,得到环境反馈的rt;

S23:从环境中采样得到状态st+1~p(st+1|st,at);

S24:将st,at,rt,st+1组成元组(st,at,rt,st+1)并存入经验回放池 中;

S25:从经验回放池 中随机抽选数组(st,at,rt,st+1)元组;

S3:针对S2的每一步骤(For step=1 to stepmax),执行步骤S31至步骤S35;

S31:定义误差函数JV(ψ)、JQ(θi)、Jπ(φ);

S32:更新状态值函数Vψ(st):

S33:更新Q值函数Qθ(st,at): 其中i∈{1,2};

S34:更新策略函数πφ(at|st):

S35:更新状态值函数的目标网络: