买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种多智能体系统的协同调度方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种多智能体系统的协同调度方法

￥21600

专利号： 2022107206071

申请人：广东工业大学

专利类型：发明专利

专利状态：已下证

更新日期：2025-10-27

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种多智能体系统的协同调度方法，其特征在于，包括以下步骤：S1：采用图形化建模将现实问题建模成多智能体系统的问题场景，并构建决策模型；

所述决策模型包括若干个决策组，每个决策组包括四个决策指标以及与各个决策指标对应的权重值，所述决策指标包括站点间的距离、空闲度、紧急度和吞吐量；

若空闲度V(o)大于0，表示目标站点o仍有空闲空间，且V(o)的数值越大表示目标站点o的空闲程度越高；若空闲度V(o)等于0，表示目标站点o刚好没有空闲空间；若空闲度V(o)小于0，表示目标站点o已经开始拥挤，且V(o)的数值越小表示站点的拥挤程度越高；通过以下公式计算目标站点o的空闲度：V(o)＝so–g

其中，so表示给定的目标站点o的空间大小，g表示正在前往及已经到达目标站点o的智能体个数；

若目标站点o存在依赖站点，即依赖站点上的智能体必须同时访问目标站点o，且目标站点o的依赖站点处于运行状态，则目标站点o的紧急度为0；否则通过以下公式计算目标站点o的紧急度：其中，A表示目标站点o的当前依赖站点上的智能体的集合，表示智能体aj的等待时间；

通过以下公式计算目标站点o的吞吐量：

其中，o表示目标站点，t表示智能体在目标站点o执行访问任务所需的时间，s表示单位时间内允许在目标站点o执行访问任务的智能体数量；

S2：对所述决策模型中各个决策指标的权重值进行优化，得到优化好的决策模型；

S3：将优化好的决策模型应用到所述问题场景中进行协同调度模拟，记录协同调度模拟的中间过程；

S4：将记录的模拟调度的中间过程生成调度甘特图作为所述多智能体系统的调度图。

2.根据权利要求1所述的一种多智能体系统的协同调度方法，其特征在于，每个决策组负责一类智能体的决策，决策组的个数取决于智能体的类别个数。

3.根据权利要求1所述的一种多智能体系统的协同调度方法，其特征在于，所述决策模型中每个决策组的评估公式如下：M(o)＝p1D(c,o)+p2V(o)+p3C(o)+p4T(o)其中，M(o)表示智能体对目标站点o的评估值，p1、p2、p3、p4分别表示距离、空闲度、紧急程度、吞吐量四个决策指标的权重值，取值范围为[‑1,1]；D(c,o)表示智能体从出发站点c到达目标站点o的最短距离，V(o)表示目标站点o的空闲度，C(o)表示目标站点o的紧急程度，T(o)表示目标站点o的吞吐量。

4.根据权利要求1所述的一种多智能体系统的协同调度方法，其特征在于，在问题场景中，智能体包括以下状态：第一智能体状态、第二智能体状态、第三智能体状态、第四智能体状态和第五智能体状态；

当智能体处于第一智能体状态时，表示智能体刚刚被创建；当智能体处于第二智能体状态时，表示智能体已经抵达站点的等待队列；当智能体处于第三智能体状态时，表示智能体已经在站点的工作空间中开始运行；当智能体处于第四智能体状态时，表示智能体尚未处于任何一个站点的等待队列；当智能体处于第五智能体状态时，表示智能体已经没有任何站点需要访问。

5.根据权利要求4所述的一种多智能体系统的协同调度方法，其特征在于，在问题场景中，站点包括以下状态：第一站点状态、第二站点状态、第三站点状态、第四站点状态和第五站点状态；

当站点处于第一站点状态时，表示站点刚刚被创建；当站点处于第二站点状态时，表示站点的等待队列中已经存在智能体正在等待；当站点处于第三站点状态时，表示该站点正在运行，若该站点与其他站点存在依赖关系，其依赖的站点此时也必然处于第二站点状态或者第三站点状态；当站点处于第四站点状态时，表示工作空间和等待队列均为空；当站点处于第五站点状态时，表示该站点已经完成其所需要完成的工作，不再允许任何智能体访问该站点。

6.根据权利要求1所述的一种多智能体系统的协同调度方法，其特征在于，采用差分演化算法优化各个决策指标的权重值，具体包括以下步骤：S2.1：随机初始化种群：在L维空间中随机产生取值范围为[lb,ub]的NP个个体作为第0代种群；种群中的每一个个体向量由决策模型中所有决策指标的权重值构成，且权重值的取值范围为[0,1]；lb表示决策指标权重值取值下界，ub表示决策指标权重值取值上界；

S2.2：评价操作：将每一个个体向量代入到多智能体系统中进行协同调度模拟，将所有智能体完成协作任务所需的时间作为每一个个体的适应度值；

S2.3：判断种群中个体的累计评价次数是否达到预设的最大次数；

若是，则将种群中最优个体作为决策模型中所有决策指标最终的权重值，执行步骤S2.5；

若否，则执行步骤S2.4；

S2.4：通过差分变异产生变异向量，将产生的变异向量与目标向量进行二项式交叉变成试验向量，最后从目标向量和试验向量中选择最优的向量作为下一代演化的目标向量，返回步骤S2.2；

变异向量v、试验向量u的产生如下式：

(i＝1,2,...,NP；j＝1,2,...,D)

其中，随机选择的序号r1,r2,r3以及目标向量的序号i互不相同，rand()表示产生[0,1]之间的随机数，F表示浮动因子，CR表示交叉概率，j表示试验向量中的第j维分量，vi,+1表示第t+1代种群中第i个变异向量，uji,t+1表示第t+1代种群中第i个试验向量中的第j维分量，xji,t+1表示第t+1代种群中第i个目标向量中的第j维分量，D表示种群中个体的维度；

S2.5：执行结束。

7.根据权利要求5所述的一种多智能体系统的协同调度方法，其特征在于，协同调度模拟的具体过程为：S3.1：初始化多智能体系统中的智能体和站点，初始时所有的智能体均为第一智能体状态；

S3.2：通过决策模型从对应的任务队列中对所有当前无访问任务的智能体选择并分配一个任务；

S3.3：判断是否所有给定的访问任务均已完成；

若是，则执行步骤S3.7；

若否，则执行步骤S3.4；

S3.4：所有智能体根据任务要求访问相应的站点；

S3.5：更新站点状态，包括以下两种情况：

a)更新所有站点状态，若当前站点处于第一站点状态或者第四站点状态时，判断该站点的等待队列是否为空，若不为空，则该站点进入第二站点状态；

b)若站点为第二站点状态时且该站点不存在任何依赖站点时，则该站点直接进入第三站点状态，否则判断其依赖站点是否处于第二站点状态或者第三站点状态，若是，则该站点进入第三站点状态；

S3.6：所有处于运行状态的站点分别运行一个单位时间，返回步骤S3.2；

S3.7：执行结束。