利索能及
我要发布
收藏
专利号: 2025103797729
申请人: 飞音软件(南京)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于人工智能的工程车智能调度方法,其特征在于,包括:构建调度目标函数,所述调度目标函数至少包含工程车运输成本、任务完成时间成本、路径拥堵成本及能源消耗成本;

基于历史任务数据及实时交通数据,建立多维度任务需求预测模型,输出未来时段内的任务分布预测值及交通状态预测值;

将所述任务分布预测值和所述交通状态预测值输入基于深度强化学习算法建立的工程车动态调度模型,所述工程车动态调度模型以所述调度目标函数为优化目标,以历史调度数据及实时反馈数据进行迭代优化;

基于优化后的动态调度模型生成实时调度指令,动态分配工程车任务路径及资源,并实时监控执行状态以调整调度策略。

2.根据权利要求1所述的基于人工智能的工程车智能调度方法,其特征在于,所述调度目标函数,包括:令f(x)表示调度目标函数,x表示工程车调度方案,则:

f(x)=α1·Ctrans(x)+α2·Ctime(x)+α3·Ccongestion(x)+α4·Cenergy(x)其中,α1,α2,α3,α4为可调节的权重系数,Ctrans(x)为运输成本,Ctime(x)为任务完成时间成本,Ccongestion(x)为路径拥堵成本,Cenergy(x)为能源消耗成本。

3.根据权利要求2所述的基于人工智能的工程车智能调度方法,其特征在于,具体包括:所述运输成本根据车辆数目、运输距离及单位运输里程费用进行度量,定义单车距离费用为β1,车辆数目为N,则在调度方案x下的运输总成本表示为:其中,di(x)表示第i台工程车执行任务的总行驶里程;

所述任务完成时间成本根据每个任务的执行时长、等待时长以及违约时长进行综合测算,定义延时罚金系数为β2,则在调度方案x下的任务完成时间成本表示为:其中,M为需要执行的任务总数,Tj(x)表示第j个任务的总时间消耗;

所述路径拥堵成本根据不同道路在不同时间段的拥堵程度进行加权计算,定义拥堵成本为β3,则在调度方案x下的路径拥堵成本表示为:其中,K为所有可使用的道路总数,ρk为道路k的拥堵系数,dk(x)为工程车在道路k上的行驶距离;

所述能源消耗成本综合考虑车辆燃油/电能消耗,定义单车能耗费用为β4,则在调度方案x下的能源消耗成本表示为:其中,Ei(x)表示第i台工程车在调度方案x下的总能耗。

4.根据权利要求1所述的基于人工智能的工程车智能调度方法,其特征在于,所述多维度任务需求预测模型,包括:所述历史任务数据至少包含任务的时间标记、地理位置、任务类型及车辆使用情况;

所述实时交通数据至少包含道路流量、拥堵指数、交通事故及限行信息;

对所述历史任务数据和所述实时交通数据进行缺失值填补、异常值剔除及数据格式统一处理;

将所述历史任务数据按时间序列重排,提取日、周、月不同周期的时序特征;

采用基于LSTM的时序模型,对未来短期及中长期的任务需求趋势进行联合预测,其中,通过计算所述时序模型在验证集上的均方根误差作为评价指标,若所述评价指标高于第一阈值,则自动执行模型参数调优,否则进入下一步骤;

根据地理位置,对所述历史任务数据进行网格化处理,得到若干空间子区域,对每个子区域,结合任务发生频次、车辆行驶距离特征,构建空间分布预测模型,其中,在每个子区域内,对比预测值与实际历史数据的偏差,若所述偏差超过第二阈值,则重新训练空间分布预测模型,否则保持现有模型;

基于实时采集的道路流量和拥堵指数,采用回归模型对不同路段的未来拥堵情况进行动态预测,叠加交通事故、限行信息,修正各路段在不同时间窗口下的拥堵概率,其中,若某些路段在预测中长期处于高拥堵状态,则标记为风险路段并提高拥堵成本权重,否则按常规拥堵系数处理;

根据工程车任务类别,利用分类模型对各类任务需求进行独立预测,对上述步骤得到的判断结果进行多维度融合,输出未来时段内的任务分布预测值和交通状态预测值;

若融合后的整体预测误差大于第三阈值,则重新进行迭代训练,反之则输出预测结果。

5.根据权利要求1或4所述的基于人工智能的工程车智能调度方法,其特征在于,所述工程车动态调度模型,包括:选取深度Q网络作为深度强化学习算法;

将所述任务分布预测值和所述交通状态预测值,作为深度强化学习算法的环境状态向量;

定义所述深度强化学习算法中可执行的动作空间,所述动作空间包括对车辆的调度分配、路径选择;

基于所述调度目标函数进行奖励的拆分,其中,若调度决策降低了运输成本、时间成本、拥堵成本及车辆能源消耗,则给予正向奖励,若所述调度决策造成延误、拥堵及能源过度消耗,则给予负向奖励;

在每个调度决策周期结束后,累积奖励用于更新模型参数。

6.根据权利要求5所述的基于人工智能的工程车智能调度方法,其特征在于,所述工程车动态调度模型以所述调度目标函数为优化目标,以历史调度数据及实时反馈数据进行迭代优化,包括:通过历史调度数据进行初步训练,得到初始策略网络,其中,当训练过程中发现连续若干次迭代后,模型在验证环境中的平均奖励不满足第四阈值,则执行学习率调整,否则继续训练直至收敛;

将初步训练完成的工程车动态调度模型部署于调度系统中,通过输入所述环境状态向量获得调度决策;

将所述调度决策下的目标函数值与历史平均值进行比较,若整体成本显著下降,则进入下一步骤,否则继续模型迭代;

其中,所述目标函数值包括运输成本、时间成本、拥堵成本以及能源消耗;

实时获取工程车的运行状态以及任务执行完成情况,将实时调度反馈数据写入数据缓冲池进行数据更新;

通过所述实时调度反馈数据对初步训练后的所述工程车动态调度模型进行在线微调;

若新一轮训练所得的平均累积奖励较前一轮上升幅度小于第五阈值,且持续若干次迭代皆如此,则自动调整网络结构参数,若平均累积奖励保持增长,则继续迭代训练;

重复该过程,直至达到成本目标的最优水平。

7.根据权利要求6所述的基于人工智能的工程车智能调度方法,其特征在于,基于优化后的动态调度模型生成实时调度指令,动态分配工程车任务路径及资源,包括:从优化后的所述动态调度模型中获取当前最优调度决策;

对每个待执行任务,结合车辆的当前状态生成调度指令,所述调度指令包含任务起止位置、途经路线、预计执行时长及所需资源配置;其中,对每项任务的起止时间、所需里程及车辆剩余载重进行快速校验,若资源不足或时间冲突,则调用替补车辆或对任务进行拆分,反之则校验通过;

基于交通状态预测值,初步选取拥堵风险低且行驶距离较短的路径;其中,若检测到所述路径沿线出现限行、严重交通事故或严重拥堵,则自动触发重新规划策略,挑选次优路径,否则按原路径执行;

考虑车辆类型的功能特性以及燃料种类,根据任务属性进行最优匹配,当单一车辆功能无法满足需求时,对任务进行分拆并采用多车协同调度,其中,若协同调度的额外成本高于预计收益,则回退到单车调度方案,反之则执行多车协同方案。

8.根据权利要求7所述的基于人工智能的工程车智能调度方法,其特征在于,实时监控执行状态以调整调度策略,包括:通过卫星定位方式实时采集车辆地理坐标,并记录车辆在执行任务过程中的运行轨迹;

监控所述车辆在装载、行驶、卸载不同阶段的时间消耗与完成进度,并统计任务完成百分比;

采集车辆负载信息、燃油/电池余量信息,若检测到车辆能耗偏高/电池余量不足,则触发资源补给操作;

与调度指令中预估的执行时间、能耗水平和路径情况进行对比;

若实测执行时间超过预设延时阈值,则触发紧急调度策略;

若车辆实际能耗超过预设能耗阈值,则将该记录作为负向样本反馈至动态调度模型;

若执行结果与模型预测结果基本吻合,则作为正向样本以巩固模型策略。

9.根据权利要求8所述的基于人工智能的工程车智能调度方法,其特征在于,所述调度策略的调整包括以下步骤,用于根据所述执行状态的监测结果对工程车调度进行动态修正:当车辆执行过程中遇到突发拥堵、事故或车辆异常时,由动态调度模型根据新的环境状态向量重新计算最优路径;其中,若重新规划后对总成本的减少量大于重新规划所带来的切换成本,则执行新的调度方案,否则维持现有策略;

若监测到多批次任务出现延误或资源分配严重失衡,则重新计算所有可用车辆与各任务的匹配关系、行驶路径及执行顺序,并部署新的全局调度指令。