买专利、卖专利、专利购买、专利交易、专利出售、高企申报-STAR-RIS辅助的车联网SR系统链路优化方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

STAR-RIS辅助的车联网SR系统链路优化方法

￥19200

专利号： 2023103747326

申请人：重庆邮电大学

专利类型：发明专利

专利状态：已下证

更新日期：2026-07-01

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种STAR‑RIS辅助的车联网SR系统链路优化方法，其特征在于，包括如下步骤：S1、基站将主链路信号通过NOMA的传输方式发送给无源智能全向表面和车辆对，所述车辆对为分别位于所述无源智能全向表面的透射面的透射车辆以及位于所述无源智能全向表面的反射面的反射车辆；

S2、IoT设备将搜集的物联网信息传递到所述无源智能全向表面上，所述无源智能全向表面将接收到的主链路信号作为载波来调制所述物联网信息，并将携带物联网信息的所述主链路信号通过次链路以NOMA的传输方式分别反射透射给所述车辆对；

S3、优化所述无源智能全向表面的反射系数、透射系数以及基站的NOMA功率分配系数，使得所述次链路的速率和达到最大；

所述透射车辆和反射车辆的接收信号为：

其中，yt为透射车辆的接收信号，yr为反射车辆的接收信号，代表基站BS到无源智能全向表面STAR‑RIS之间的信道，分别表示基站BS到透射车辆、以及基站BS到反射车辆之间的信道，分别表示无源智能全向表面STAR‑RIS到透射车辆以及无源智能全向表面STAR‑RIS到反射车辆之间的信道，PB为基站发送功率；wt,wr分别为基站分别通过NOMA进行透射和反射的功率分配系数，满足wt+wr＝1；xt,xr分别为基2

站发送给透射车辆和反射车辆的信号；nt,nr分别表示透射车辆和反射车辆处的功率为σ的零均值加性高斯白噪声；c表示传感器设备所需传输的信息符号，c＝{0,1}，vt、vr分别代表无源智能全向表面STAR‑RIS的透射系数和反射系数；

当所述透射车辆的信道增益和所述反射车辆的信道增益大小为时，通过SIC技术消去所述反射车辆的信号来解码所述透射车辆的信号，通过将所述透射车辆的信号视为干扰信号来解码所述反射车辆的信号，其中，所述透射车辆接收到的主链路信号的信噪比为：

所述反射车辆接收到的主链路信号的信噪比为：

其中，σ为噪声功率；

所述透射车辆的主链路的传输速率为：

所述反射车辆的主链路的传输速率为：

其中，为所求传输速率的期望值；

当所述透射车辆的信道增益和所述反射车辆的信道增益大小为时，通过SIC技术消去所述透射车辆的信号来解码所述反射车辆的信号，通过将所述反射车辆信号视为干扰信号来解码所述透射车辆信号，其中，所述反射车辆接收到的主链路信号的信噪比为：

所述透射车辆接收到的主链路信号的信噪比为：

其中，σ为噪声功率；

所述反射车辆的主链路的传输速率为：

所述透射车辆的主链路的传输速率为：

所述透射车辆接收到的物联网信息的信噪比为：

所述反射车辆接收到的物联网信息的信噪比为：

其中，K为物联网信息符号的长度与主链路信息符号的长度比值，即物联网信息符号长度为主链路信息符号长度的K倍；

所述透射车辆的次链路的传输速率为：

所述反射车辆的次链路的传输速率为：

所述无源智能全向表面将接收到的主链路信号作为载波来调制所述物联网信息，并将携带物联网信息的所述主链路信号通过次链路以NOMA的传输方式分别反射透射给所述车辆对之前，在保证主链路最低通信速率需求Rjmin的前提下，基于基站的NOMA功率分配系数、无源智能全向表面的反射系数、透射系数建立次链路传输速率最大化模型并求解，以最大化次链路传输速率的和速率；

所述次链路传输速率最大化模型包括具体为：

Rct,Rcr≥Rcmin

wt+wr＝1

其中表示无源智能全向表面STAR‑RIS

的透射系数矩阵和反射系数矩阵，j∈{t,r}，用来指定车辆处于透射侧还是反射侧；w∈{wt,wr}，为透射车辆和反射用户的NOMA功率分配系数，分别表示透射和反射过程中对入射信号施加的振幅和相移的调整系数， n表示第n个智能单元，N为智能单元的总数量；

约束条件依次为：

透射和反射的主链路的传输速率均不低于主链路最低通信速率需求Rjmin、透射和反射的次链路的传输速率均不低于次链路最低通信速率需求Rcmin、保证基站的NOMA功率分配为最大功率分配、保证无源智能全向表面STAR‑RIS满足能量守恒约束条件、无源智能全向表面STAR‑RIS的透射反射的相移范围为[0,2π)；

采用DDPG算法求解非凸优化问题P1，DDPG算法流程具体为：T1、初始化Actor网络和Critic网络参数，设置经验回放缓存区，定义Actor网络和Critic网络的学习率参数、奖励衰减系数、训练回合数以及每回合训练步数；

T2、在每个训练回合中，根据当前状态值，由Actor网络生成一个动作值；

T3、由T2得到的动作值通过与环境交互得到一个奖励值，以及生成下一个状态值；

T4、将经验存储到经验回放缓存区中，所述经验由当前状态值、动作值、奖励值、生成的下一个状态值组成；

T5、从经验回放缓存区中随机采样一批经验，用于训练Actor网络和Critic网络；

T6、计算当前状态的值函数Q值，并用Critic网络更新价值函数的参数；

T7、用Actor网络和当前状态值作为输入，计算生成的动作值的值函数Q值，并使用该值更新Actor网络参数；

T8、重复T2到T7，直到达到预定的训练步数或满足停止条件；

T9、使用训练好的Actor网络进行决策，获得最终的策略；

状态值包括：基站到透射车辆的信道增益基站到反射车辆的信道增益基站通过STAR‑RIS到透射车辆的信道增益基站通过STAR‑RIS到反射车辆的信道增益以及NOMA对透射车辆和反射车辆分配的功率PBwt、PBwr所组成，其中PBwt，PBwr直接受到动作的影响而改变；

动作值包括：无源智能全向表面STAR‑RIS系数矩阵v和基站的NOMA功率分配系数w；

奖励值包括：若本次训练所得到的主链路和次链路速率满足最低速率要求，那么将次链路的和速率[Rct+Rcr](v(t),w(t))作为瞬时奖励，若不满足最低速率约束条件，则将瞬时奖励给出‑0.3的惩罚项。