1.一种无线电通信设备控制方法,包括:
S1,获取无线电通信设备的设备数据,设备数据包含天线驻波比和频率误差;将获取的设备数据上传至云服务器;云服务器接收到设备数据后,将天线驻波比和频率误差分别与预设阈值进行比对;当天线驻波比或频率误差超出阈值范围时,判断设备处于非健康状态;
当设备处于非健康状态时,采用模糊推理算法,根据天线驻波比与阈值的偏离程度,以及频率误差与阈值的偏离程度,计算设备健康度量化指标;将量化指标映射至预设的校准优先级等级,确定设备校准的优先级;
S2,采集环境数据,环境数据包含温度、湿度和电磁干扰数据;将采集的环境数据上传至云服务器;云服务器根据设备数据、环境数据、设备校准的优先级,以及历史数据,通过机器学习算法,生成设备校准数据;校准数据包含校准触发阈值和数据权重参数;
S3,无线电通信设备将采集的环境数据与接收到的校准触发阈值进行比对;当采集的环境数据达到校正触发阈值时,根据数据权重参数,通过机器学习算法,生成当前环境的动态校准参数;
S4,根据生成的动态校准参数,采用Actor‑Critic强化学习框架对设备的工作参数进行校准,工作参数包含发射功率和接收灵敏度;将校准后的工作参数输出,对无线电通信设备的发射和接收进行控制。
2.根据权利要求1所述的无线电通信设备控制方法,其特征在于:
S1,确定设备校准的优先级,包括:
当设备处于非健康状态时,采用模糊推理算法,将天线驻波比数据、天线驻波比健康阈值、频率误差数据和频率误差健康阈值,作为模糊推理的输入变量;
通过构建隶属度函数,将输入变量映射到相应的模糊集合,计算天线驻波比数据相对天线驻波比健康阈值的偏离程度,以及频率误差相对频率健康阈值的偏离程度;
根据天线驻波比偏离程度和频率误差偏离程度,通过模糊推理规则进行模糊推理,得到表征设备健康状态的模糊值;模糊推理规则包含IF‑THEN形式的模糊规则,用于描述天线驻波比偏离程度和频率误差偏离程度与设备健康状态之间的模糊关系;
对模糊值进行去模糊化处理,得到设备健康度的量化指标;
将量化指标与预设的校准优先级等级阈值进行比对,根据比对结果将量化指标映射至相应的校准优先级等级,得到设备校准优先级;其中,校准优先级等级为预设的与设备健康度对应的多个等级,每个等级对应一个健康度量化指标的范围区间,健康度量化指标位于区间内则映射为相应的优先级等级。
3.根据权利要求2所述的无线电通信设备控制方法,其特征在于:
构建的隶属度函数f(x)的表达式如下:
其中,c表示函数的对称中心,表示平台区的中点;λ表示位置参数,控制平台区的宽度,平台区的范围为[c‑λ,c+λ],在此范围内隶属度恒为1;ηL表示左侧尺度参数,控制函数左侧非平台区的宽度;ηR表示右侧尺度参数,控制函数右侧非平台区的宽度;βL表示左侧形状参数,控制函数左侧非平台区的形状;βR表示右侧形状参数,控制函数右侧非平台区的形状。
4.根据权利要求1所述的无线电通信设备控制方法,其特征在于:
S2,生成设备校准数据,包括:
将采集的环境数据输入预训练的多层自编码网络,通过多层自编码网络对环境数据进行特征提取和降维处理,得到表征环境状态的量化指标;
无线电通信设备将得到的量化指标通过通信链路上传至云服务器;
云服务器接收到量化指标后,将量化指标、S1中的设备数据,以及云服务存储的历史数据作为输入,通过预先构建的双向长短期记忆网络,获取环境因素与设备性能间的非线性映射关系;
云服务基于获取的非线性映射关系,以设备性能指标为优化目标,结合贝叶斯优化算法搜索最优的校准参数组合,生成当前环境数据对应的设备校准数据;其中,设备性能指标包含信噪比、误码率、数据吞吐量或功率效率。
5.根据权利要求4所述的无线电通信设备控制方法,其特征在于:
生成当前环境数据对应的设备校准数据,包括:
将获取的非线性映射关系作为优化问题的目标函数,以信噪比、误码率、数据吞吐量或功率效率作为优化目标,将待优化的校准参数组合作为优化变量,构建参数优化模型;
基于构建的参数优化模型,通过高斯过程回归构建参数空间的概率分布代理模型;通过设置基于置信区间上置信边界算法的采集函数,来平衡参数的探索和利用;其中,置信区间上置信边界算法采用探索因子和利用因子的权重调整机制;
将参数优化模型,概率分布代理模型和采集函数作为输入,迭代搜索参数空间,以获取全局最优的校准参数组合;
将获取的全局最优的校准参数组合,作为当前环境状态下的设备校准数据,生成包含校准触发阈值和数据权重参数的校准数据。
6.根据权利要求5所述的无线电通信设备控制方法,其特征在于:
获取全局最优的校准参数组合,包括:
初始化置信区间上置信边界算法中的探索因子权重和利用因子权重,设置初始迭代次数;
根据当前迭代次数,通过预设的权重调整函数,调整探索因子权重和利用因子权重;
将调整后的探索因子权重、利用因子权重、候选参数组合的后验均值和后验标准差作为输入,通过置信区间上界计算公式,计算候选参数组合的置信区间上界;
将计算得到的置信区间上界作为输入,选择置信区间上界最大的候选参数组合作为下一个评估点;
将评估点输入到目标函数中进行评估,获得评估结果;并将评估结果作为输入,更新高斯过程回归模型;
将更新后的高斯过程回归模型、当前迭代次数作为输入,通过预设的迭代停止条件,判断是否满足迭代停止条件;如果是,则输出迭代搜索得到的全局最优校准参数组合,作为当前环境状态下的最优校准参数组合;反之,将当前迭代次数加1,返回调整探索因子权重和利用因子权重。
7.根据权利要求6所述的无线电通信设备控制方法,其特征在于:
置信区间上界计算公式:
其中,μ(x)为候选参数组合{x}的后验均值,σ(x)为候选参数组合x的后验标准差,at为探索因子权重,βt为利用因子权重,γt为额外的探索项,ε为一个小的正常数。
8.根据权利要求1所述的无线电通信设备控制方法,其特征在于:
S3,生成当前环境的动态校准参数,包括:
实时采集环境数据,将采集的环境数据与S2中接收到的校准触发阈值进行比对;
当采集的环境数据达到校准触发阈值时,将S3中接收到的数据权重参数作为输入,通过预训练的极限学习机网络,拟合数据权重参数与环境数据之间的非线性关系;
根据拟合得到的非线性关系,结合当前采集的环境数据,生成当前环境下的动态校准参数;其中,动态校准参数用于对设备的工作参数进行动态调整。
9.根据权利要求8所述的无线电通信设备控制方法,其特征在于:
S4,采用Actor‑Critic强化学习框架对设备的工作参数进行校准,包括:根据S3生成的动态校准参数,采用Actor‑Critic强化学习框架对发射功率和接收灵敏度进行校准;其中,Actor‑Critic强化学习框架包括策略网络和值函数网络,策略网络用于生成工作参数的调整策略,值函数网络用于评估调整策略的优劣;
将当前设备状态和动态校准参数作为观察值,输入至Actor网络的策略网络中;策略网络采用深度神经网络结构,通过网络训练获取状态到动作的映射关系,根据观察值生成工作参数的调整策略;其中,策略网络的输出为工作参数的调整量,采用高斯分布建模;
根据策略网络生成的工作参数调整量,对发射功率和接收灵敏度进行调整,得到调整后的设备性能指标;
将调整后的设备性能指标和目标性能指标作为观察值,输入至Critic网络的值函数网络中;值函数网络采用深度神经网络结构,通过网络训练获取学习状态到值函数的映射关系,根据观察值计算调整策略的价值;其中,值函数定义为性能指标间差值的累积折扣和,用于评估调整策略的长期效用;
值函数网络输出的策略价值作为Actor网络的奖励值;Actor网络采用策略梯度算法,根据奖励值对策略网络的参数进行更新;采用蒙特卡洛方法对梯度进行无偏采样估计;
通过Actor网络和Critic网络的交互训练,对工作参数进行迭代优化。
10.根据权利要求9所述的无线电通信设备控制方法,其特征在于:S4,采用Actor‑Critic强化学习框架对设备的工作参数进行校准,还包括:将迭代优化后的工作参数输出,对无线电通信设备的发射和接收进行控制;将优化后的工作参数和对应的性能指标上传云服务器;
云服务器基于接收的数据,对Actor‑Critic网络进行在线学习和优化。