1.基于D3QN的6G超大规模车联网网络资源分配方法,其特征在于,包括以下步骤:S1、根据6G超大规模车联网的应用场景确定通信模型;
S2:根据所述通信模型建立超图模型,所述超图模型中顶点为车载用户,超边为有干扰的车辆链路;并通过邻接矩阵表示超图中的车辆链路关系;
S3:以最大化整个车联网的吞吐量为目标定义网络资源分配问题并设定约束条件;
S4:基于竞争双重深度网络(D3QN)确定最优资源分配策略。
2.根据权利要求1所述的基于D3QN的6G超大规模车联网网络资源分配方法,其特征在于,步骤S1中所述6G超大规模车联网的应用场景包括N个车载用户和K条车辆链路,并采用D2D通信,网络中所有收发机使用单一天线,且第k条车辆链路的信道功率增益为:第k条车辆链路使用第m个信道进行通信的信噪比为:
第k条车辆链路使用第m个信道进行通信的容量为:
Ck[m]=W·log(1+γk[m])
其中: 表示大尺度慢衰落信道参数,αk是具有标准差的对数正态阴影衰落随机变量,A表示路径损耗常数,Lk表示车载用户到车载用户之间的距离,l表示衰落指数,gk表2
示小尺度快衰落信道参数,Pk表示第k条车辆链路发送端的发射功率;σ表示信道中的高斯白噪声的功率; 表示频谱分配指标,当第k'条车辆链路复用第k条车辆链路的信道时否则 Pk′表示第k'条车辆链路发送端的发射功率;hk′,m为第k'条车辆链路的信道功率增益,M为信道总数,W是信道带宽。
3.根据权利要求2所述的基于D3QN的6G超大规模车联网网络资源分配方法,其特征在于,步骤S2建立超图模型时用 表示,顶点集 表示车辆用户集合,超边集ε表示顶点所构成干扰边的集合,对于车辆链路用户对,干扰边的构建原则为:如果有用信号与累积干扰之比低于阈值δd,则累积干扰和VUE一起形成超边缘,即:在车辆链路中;
所述超图模型中的通信链路关系用邻接矩阵 来描述,其中行表示顶点,列表示超边,he,v=1表示第e个车载用户使用第v条车辆链路进行通信;否则,he,v=0;
令0≤Kk[m]≤K表示第m个信道中需要配置的车辆链路个数,则令τk[m]∈{0,1}表示第k个车辆链路是否配置在第m个信道处,则有:其中,K为车辆链路总条数,当τk[m]=0则表示资源分配无冲突。
4.根据权利要求3所述的基于D3QN的6G超大规模车联网网络资源分配方法,其特征在于,步骤S3中按照:s.t.τk[m]=0,
定义网络资源分配问题并设定约束条件,其中:
表示最大化整个车联网的吞吐量为目标;
约束条件τk[m]=0表示网络资源无冲突;约束条件 表示车载用户数据传输速率大于最小数据传输速率;
约束条件 表示任一车载用户选择的信道不能多于1个;
约束条件 表示任一信道容纳的用户不能多于K个;
条件约束 表示第k个车辆链路对是否选择信道m。
5.根据权利要求4所述的基于D3QN的6G超大规模车联网网络资源分配方法,其特征在于,步骤S4中基于竞争双重深度网络(D3QN)确定最优资源分配策略时,定义有状态空间S、动作空间 即时奖励R和动作价值函数Q,其中:状态空间S:当前全局状态St的全局状态由所有车辆链路的信道分配以及车辆用户的资源分配动作组成;且在网络环境中可以采用动作从当前全局状态St过渡到下一个状态St+1;
动作空间 用于表示智能体执行的动作集,即第k个车载用户在系统中观察当前状态做出相应通信链路资源分配的动作集合;
即时奖励R:用于表示车载用户在状态空间S下执行动作空间 获得的对应回报;
动作价值函数Q:用于表示车载用户在状态空间S下执行动作空间 的期望回报。
6.根据权利要求5所述的基于D3QN的6G超大规模车联网网络资源分配方法,其特征在于,所述动作价值函数Q表示为:其中∑a′A(s,a′)是对所有动作的优势函数求和,|A|是动作空间的大小,表示所有可能动作的总数,V(s)是只与状态s有关的状态价值函数,A(s,a)是优势函数,表示在状态s下,相比与于其他动作,选择动作a具有相对优势。
7.根据权利要求6所述的基于D3QN的6G超大规模车联网网络资源分配方法,其特征在于,D3QN的目标值的计算方式为:其中,yt表示当前时刻的目标值,rt+1表示下一时刻的奖励,γ表示折扣因子,wθ和wt分别是评估网络和目标网络的参数。
8.一种基于D3QN的6G超大规模车联网网络资源分配系统,其特征在于,采用权利要求
1‑7任一所述的基于D3QN的6G超大规模车联网网络资源分配方法进行资源分配。