利索能及
我要发布
收藏
专利号: 202510567416X
申请人: 铜陵学院
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一维声学漫反射超表面优化排布方法,其特征在于,包括:L1.初始化超表面单元及对应单元排列,计算其声压分布并获取散射声压分布的标准差;

L2.采用MCMC退火优化实现单元排列方案的全局搜索,获取超表面单元的最优排列方案作为Q‑Learning的初始状态;

L3.利用Q‑Learning强化学习进一步优化排列,使最优单元排列方案的超表面散射更均匀,获取优化后的超表面排列;

L4.计算优化后超表面的散射声压,并绘制优化后声场分布极坐标图;

所述L3步骤的具体操作流程包括:

L31.设定Q值表 ,其初始化设置为零,学习率 ,折扣因子 ,探索率 ,以及Q‑Learning训练轮数MaxIter_Q;

L32.选择当前状态S_t,在每个迭代回合中,对于当前状态S_t下的每个单元,智能体使用ε‑贪心策略选择动作:以概率ε随机将指定单元的反射角从当前值更改为另一个候选角度;

以概率1 ε选择Q表中对应状态下具有最高Q值的动作;

L33.选定动作后,对排列中的相应单元进行调整,生成新的状态S_t+1以及对应最优排列S_best。

2.如权利要求1所述的一维声学漫反射超表面优化排布方法,其特征在于,所述L1步骤操作的具体操作流程包括:L11.设定 个超表面单元,且每个单元从K个预定义反射角 中选择;

L12.随机初始化超表面单元排列S0,并计算其声压分布,设定目标函数 作为散射声压分布的标准差,有:其中, 为每个角度的归一化声压级, 是所有角度声压的均值, 为表示散射角离散采样点数量,代表散射均匀性误差,其值越小表示散射越均匀。

3.如权利要求2所述的一维声学漫反射超表面优化排布方法,其特征在于,所述L2步骤的具体操作流程包括:L21.设定优化超参数,初始温度 ,退火系数 ,最大迭代次数MaxIter_MCMC;

L22.采用Metropolis‑Hastings算法,从1到 随机选择一个单元,在K个角度中随机选取修改其反射角,生成新的排列S_new;

L23.每次迭代后,通过运算 降低温度,并记录最优解;

L24.在整个迭代过程中,持续更新最优排列S_best,直至 趋近于0或达到最大迭代次数MaxIter_MCMC。

4.如权利要求3所述的一维声学漫反射超表面优化排布方法,其特征在于,所述L22步骤中生成新的排列S_new的具体操作流程包括:a1.计算目标函数变化量 ,有计算公式为:

其中 和 分别为变更前后的超表面散射声压方差;

a2.依据Metropolis准则决定是否接受S_new:若 ,即新的结构排布S_new使散射更均匀,则直接接受;若 ,则通过概率决定是否接受S_new,其中 为退火参数。

5.如权利要求1所述的一维声学漫反射超表面优化排布方法,其特征在于,所述L33步骤中S_best的生成具体操作流程包括:b1.计算获取当前排列S_t+1的散射均匀性 ,之后计算奖励 ,有计算公式为:其中, 为最优超表面散射声压;

若 ,则 为正,即新状态均匀性提高,鼓励优化;

b2.更新Q值:更新最优解S_best,若 ,则 ,使用以下公式继续迭代,有:

其中, 为一组状态动作对, 为状态‑动作对 的当前Q值; 为当前动作的即时奖励;为折扣因子,且 ,用于控制未来奖励的重要性,μ为学习率,用于决定Q值更新幅度; 表示在下一个状态 中,对所有可能动作 所对应的 Q 值取最大值; 表示在下一个状态 下的所有可能动作中的任意一个; 为目标值, 是时序差分误差,表示当前估计与“目标”之间的偏差;

选择最优动作后获得的最大Q值作为更新后的Q值;

b3.重复执行Q值更新操作,直到达到预定轮数或Q表变化小于预设值时,训练结束,系统输出最终优化后的超表面排列S_best。

6.一种计算机可读存储介质,其特征在于,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至5中任一项所述方法的步骤。

7.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至5中任一项所述方法的步骤。