利索能及
我要发布
收藏
专利号: 202210552647X
申请人: 燕山大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于改进海鸥优化算法的柔性作业车间调度方法,其特征在于:应用Logistic混沌映射种群初始化方案、改进的局部搜索模型、在参数选择上融合强化学习算法来优化柔性作业车间调度问题,具体包括以下步骤:步骤1:采用整数编码方式对生产序列进行编码处理;

步骤2:初始化算法参数;

步骤3:采用改进的Logistic混沌映射初始化每只海鸥的位置,使初始种群具有一定的质量和多样性;

步骤4:计算所有初始化种群内每个海鸥的适应度,即所求模型的目标函数值,取目标函数值最小的海鸥位置作为本代最佳海鸥位置;根据海鸥种群位置,依照编码方式,每一个海鸥个体都会得到一组加工工序与机器的匹配结果,其中最大完工时间最小的个体即为初代海鸥最佳位置,其适应度值即为本代海鸥最小的最大完工时间;

步骤5:使用强化学习算法根据本代最优适应度值和本代最佳海鸥位置对决策变量的计算公式进行确定;

所述的强化学习算法具体为:

根据海鸥种群当前状态,Q‑learning算法按照Q表选择一个适合当前状态的动作a,即函数调整A值;观察本次动作执行的结果,即获得下一状态s’,同时得到一个奖励值r;最后对当前状态、动作、奖励、下一状态组成的状态传递矩阵[s,a,r,s’]进行学习,并更新Q表,强化学习的目标是获得最大的累计奖励,奖励值r被设置为负的最大完工时间;

融合Q‑learning的海鸥优化算法实施步骤如下:Step 1:初始化Q表或读取已有的Q表;

Step 2:将海鸥种群作为状态s输入Q‑learning算法;

Step 3:根据当前Q表和状态s,采用ε‑greedy策略在动作集中选择一个动作a;

Step 4:执行动作a,海鸥种群位置更新为s’,并获得奖励r;

Step 5:智能体根据状态传递矩阵[s,a,r,s’],并更新Q表;

Q(s,a)←Q(s,a)+α*[r+γ*maxa′Q(s′,a′)‑Q(s,a)]Step 6:更新海鸥种群位置,s←s′;

Step 7:判断状态s是否为终止状态或迭代次数达到最大值,若不是,则转到Step 3;

其中:

ε‑greedy策略——表示以ε的几率随机选择动作,(1‑ε)的几率选择Q表中奖励值最高的动作;

α——表示强化学习的学习率;

γ——表示对未来reward的衰减值;

步骤6:根据海鸥迁徙模型公式驱使种群内每个海鸥个体靠近最佳海鸥位置;

步骤7:采用轮盘赌方式选择海鸥攻击模型公式或改进的局部搜索模型更新种群内每个海鸥的新位置;

步骤8:记录根据适应度值更新第t次迭代后每个个体的位置和全局最优解;若第t次迭代后全局最优解xi的适应度值小于第t‑1次的适应度值,则更新xi的位置,否则保持上一代海鸥个体位置;

步骤9:判断迭代次数t是否达到最大迭代次数maxIteration,若是,则输出海鸥个体最优解既最优调度方案;否则,t=t+1,并转至步骤5,并返回本次迭代奖励值以评价本次决策的优劣性。

2.根据权利要求1所述的一种基于改进海鸥优化算法的柔性作业车间调度方法,其特征在于:步骤1中海鸥种群中的个体xi=(xi1,xi2,...,xin)的每一维xij都是0到1之间的实数,n是每个个体的最大维数,也是工序和机器可能的匹配数量;将海鸥个体得到n个实数按照最小排列准则记录对应顺序并将此顺序记为加工工序与机器匹配的生产顺序。

3.根据权利要求1所述的一种基于改进海鸥优化算法的柔性作业车间调度方法,其特征在于:步骤2中具体为包括种群大小numAgent、最大迭代次数maxIteration、上界ub、下界lb、采取改进局部搜索的比例P_Ipatical、维度dim;其中令numAgent=50,maxIteration=

1000,ub=1,lb=0,P_Ipatical=0.5,其中柔性作业车间最大完工时间最小为优化目标,算法达到最大迭代次数终止。

4.根据权利要求1所述的一种基于改进海鸥优化算法的柔性作业车间调度方法,其特征在于:所述的Logistic混沌映射初始化海鸥种群的方案为:随机产生一个每维均为0到1的d维向量作为第一个个体,之后用混沌映射表达式对第一个个体的每一维进行迭代得到剩余(M‑1)个个体,最后使用海鸥初始化公式将Logistic映射产生的变量值映射到海鸥个体上;

Logistic混沌映射表达式为:

Xn+1=Xn×μ×(1‑Xn)

其中μ为映射参数,μ∈[0,4],X为映射变量,X∈[0,1];

海鸥初始化公式为:

其中LB为海鸥搜索空间的下界,UB为海鸥搜索空间的上界,Xn为第n个混沌映射随机量。

5.根据权利要求1所述的一种基于改进海鸥优化算法的柔性作业车间调度方法,其特征在于:所述融合Q‑learning的海鸥优化算法其选择的动作集是针对全局探索和局部开发的平衡参数A的计算函数,在迭代第t次时:(1)采用线性下降策略

(2)采用sigmoid下降策略

(3)采用非线性微分变化策略

(4)三次函数变化策略

6.根据权利要求1所述的一种基于改进海鸥优化算法的柔性作业车间调度方法,其特征在于:所述的改进的局部搜索模型具体为:

其中 为第n只海鸥的位置, 保存了最好的解决方案,并进一步更新了其他搜索代理的的位置。