利索能及
我要发布
收藏
专利号: 2025103171024
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-01-08
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种森林火情检测和覆灭方法,其特征在于,包括如下步骤:S1、火情数据采集及火情识别:通过卫星遥感、远程视频监控、巡航无人机实时采集火情数据,传输至指挥中心,生成红外热成像图,进行火情判断和火灾等级划分;

S2、火点定位:指挥中心基于红外热成像图标记潜在火点,根据温度值对潜在火点进行排序,从GIS数据库中获取火点地理坐标,并根据火点在持续热成像图的移动、变化情况实时更新,标记和定位新出现的火点;

S3、火场蔓延趋势计算:基于Rothermel模型进行火灾蔓延模拟,计算火场蔓延趋势并更新火势蔓延边界;

S4、构建无人机调度模型,并进行模型训练:构建基于马尔可夫决策过程的无人机调度模型,通过MAPPO多智能体强化学习算法对无人机调度模型进行预训练;

基于马尔可夫决策过程的无人机调度模型问题描述为:指挥中心通过火点定位实时获得的潜在火点序列 ,假设 时刻 集有M个火点 ,位置记为 ;无人机集群有 个无人机,分别搭载数量为 的灭火弹,通过指挥中心决策每个无人机的投掷顺序,以最短时间为优化目标,协同完成对所有潜在火点的排查和覆灭;

S5、无人机集群火情覆灭:灭火无人机分别搭载灭火弹,指挥中心通过训练好的无人机调度模型,进行优化调度,决策每个无人机的投掷顺序,以最短时间为优化目标,协同完成对所有潜在火点的排查和覆灭;

构建共享奖励函数 ,在规避碰撞情况下最大限度推进下一个 :;

其中, 为每个模拟时间步长t处奖励函数:

其中, 分别表示避障奖励、任务奖励、所有任务完成奖励、距离奖励、返航奖励, 是权重系数,用于调整各部分奖励的重要程度;

避障奖励 ,根据采取的动作是否导致无人机与障碍物碰撞,给予不同的奖励:;

其中, 为无人机质心与障碍物间的距离, 为无人机最大轴距;

任务奖励 ,与任务优先级关联,根据是否完成正确的投掷给与不同的奖励:;

其中, 为在第 步完成的 集合, 为对应 的优先级, 对应 是否覆灭的标志位;

所有任务完成奖励 ,仅当所有任务完成,潜在火点集合 为空,且在以后一段时间不再更新时,奖励一次:;

距离奖励 ,与各架无人机到未完成节点的最近距离相关,通过调节 系数调整奖励函数的曲率,目标点只要被任何一架无人机覆灭,所有无人机都会收到一个奖励:;

对于每个未完成的 ,与 距离最近的无人机间的距离 为:;

其中,为投掷高度,( )、( )分别表示对应 和无人机的全局坐标位置;

返航奖励 :

当所有任务点完成后,无人机成功就近飞往起落仓给予正奖励,否则给予负奖励;

S6、复燃防范:在扑灭明火后,通过巡航无人机继续巡逻火场,识别复燃点或烟点。

2.根据权利要求1所述的森林火情检测和覆灭方法,其特征在于,步骤S1中,所述卫星遥感用于确定火场边界和估算火灾面积;所述远程视频监控用于实时获取森林现场图像和视频;所述巡航无人机有多个,构成无人机集群,搭载激光雷达、红外热成像仪及温度、烟雾、气体传感器,通过激光雷达探测地表,对采集到的点云数据进行解算和正摄影相拼接,提取高层精度DEM并生成地形图。

3.根据权利要求2所述的森林火情检测和覆灭方法,其特征在于,步骤S1中,所述指挥中心实时接收卫星遥感、远程视频监控、巡航无人机传回的火情图像和传感器数据,进行火情判断和火灾等级划分,方法如下:S1.1、对图像数据使用YOLOv5方法通过单次前向传播网络进行实时火情检测,通过数据增强、预训练权重和混合精度训练平衡速度和精度,确定图像中含有火焰或烟雾的置信度;

S1.2、生成监测区域红外热成像图,通过设置温度阈值将图像划分为若干温度区域,确定高温区域;通过计算高温区域面积占整个图像面积的比值,得到当前火情状况;通过比较监测区域一段时间间隔内的高温区域面积变化情况,初步判断火势处于扩大或衰减状态;

S1.3、持续采集无人机温度、烟雾、气体传感器数据,传输至指挥中心,指挥中心将一段时间内的温度数据进行预处理并取均值作为区域温度,当区域温度超过温度报警阈值时激活火灾报警指令;

S1.4、指挥中心通过机器学习模型将不同传感器数据与视觉识别结果进行融合,综合判断是否发生火情;并根据历史数据得出的监测区域在当前季节的火灾风险,结合气温、湿度、风力、降水量因子,设定权重后得到火情得分,根据火情得分划分当前火灾等级。

4.根据权利要求2所述的森林火情检测和覆灭方法,其特征在于,步骤S3中,所述火场蔓延趋势计算,包括如下子步骤:S3.1、采集监测区域地理信息及环境数据,作为Rothermel模型的输入:从GIS数据库中获取火点地理坐标对应的地形地貌数据,包括:坡度、坡向信息;从气象数据中获取火点附近风速、风向数据及燃料湿度信息;通过卫星遥感或无人机扫描监测区域,获取燃料特性参数,通过分析影像的光谱特征与燃料载量之间的关系估算燃料载量;

所述燃料特性参数,包括:烘干可燃物含量、烘干颗粒密度、表面积与体积比、可燃物、可燃物含水率、可燃物熄灭含水量;

S3.2、基于Rothermel模型进行火灾蔓延模拟,火灾蔓延公式为:;

式中,R为林火蔓延速度; 为火焰区反应强度;为林火蔓延率; 为风速修正系数;

为坡度修正系数;为有效热系数; 为可燃物的密度; 为点燃单位质量的可燃物所需的热量;

S3.3、计算初始无风、无坡度条件下的火灾蔓延速度:基于热传导定律及输入的燃料特性参数,在假设无风、无坡度条件下,利用火灾蔓延公式对计算火灾在初始无风、无坡度且燃料湿度为参考值时的基础火灾蔓延速度R1;

S3.4、计算在风速和坡度合力作用下的实际蔓延速度及与逆风蔓延速度:基于实时风速、风向数据以及着火点位置对应的坡度、坡向信息,考虑风对火焰的拉伸、助燃作用,以及坡度造成的燃料堆积、热辐射变化因素,对蔓延速度进行修正,得到修正后的火灾蔓延速度,修正公式为:;

其中,U表示风速,采用距离地面预设高度处的平均风速;S表示坡度,采用坡度角的正切值表示;M表示燃料湿度,采用百分比表示; 为经验系数,根据实验数据或历史火灾数据进行标定;

根据修正公式分别计算火灾在风速和坡度合力作用下的实际蔓延速度R2,以及与火头方向相反的逆风蔓延速度R3;

S3.5、更新火势蔓延边界:

以火灾蔓延速度R1、R2、R3为基础,结合时间步长 ,基于运动学原理,根据火灾蔓延位置 、速度矢量 ,预测下一次火灾特征点蔓延点坐标 :;

将蔓延坐标点用曲线连接,得出火势蔓延的新边界,求取新区域面积,实时更新火灾蔓延趋势并可视化,形成火场发展态势图;

S3.6、更新火灾蔓延速度与趋势:

基于实时更新的红外热成像图、传感器数据以及气象数据,重复步骤S3.1至S3.5,通过Rothermel模型进行调整,更新计算火灾蔓延速度与趋势。

5.根据权利要求4所述的森林火情检测和覆灭方法,其特征在于,步骤S4中,构建基于马尔可夫决策过程的无人机调度模型,方法如下:构建基于马尔可夫决策过程的无人机调度模型,表示为一个七元组:;

其中,是状态空间; 是智能体数量; 是 个智能体的联合动作空间;是智能体局部观测空间, 是智能体 在时间步长为 时全局状态 下的局部观察;

是状态转移概率,表示所有给定智能体在状态 采取联合动作 时,从状态转移到 的概率;是采取联合动作 后的单步奖励;是折扣因子;

随机策略 是从观测空间到动作空间的映射,表示为:;

其中, 表示智能体 的随机策略。

6.根据权利要求5所述的森林火情检测和覆灭方法,其特征在于,所述无人机调度模型中,每个智能体都被分配一个独立的状态空间,第 个智能体的状态观测 定义为四轴翼无人机的位置、线速度、旋转矩阵及弹药数,表示为:;

其中, 、 、 、 分别表示智能体在t时的位置、线速度、旋转矩阵及弹药数;

第个智能体的环境观测 使用水平欧式距离近似表示:;

其中, 表示第 个智能体的相对位置; 表示火点 的相对位置; 表示起落仓的相对位置;

智能体状态环境观测 表示为:

其中, 是为火场上 时刻第k个 是否覆灭的标志位, 为 时刻第k个 的优先级;

t时刻检测区域内环境的状态由所有智能体状态环境观测组成,表示为:;

个智能体的联合动作空间 ,表示为离散动作空间 ,每个智能体动作空间设置相同,表示为 , 分别

表示向左、向右、向前、向后、向上、向下、投掷、返航。

7.根据权利要求5所述的森林火情检测和覆灭方法,其特征在于,步骤S4中,所述MAPPO多智能体强化学习算法,采用集中式训练‑分散式执行框架,训练两个独立的神经网络:actor网络和中心critic网络;

所述actor网络,表示为带有参数 的策略网络 ,每个智能体有独立的actor网络,根据各自的局部信息独立决策;actor网络的输入特征为归一化后的环境信息,输出为离散动作的概率分布;

所述中心critic网络,表示为带有参数 的状态值函数 ,所有智能体共享一个中心critic网络,通过访问所有智能体的全局状态信息评估每个智能体的价值;中心critic网络输入为归一化后的集中式全局状态信息,输出为状态值估计;

所述actor网络和中心critic网络分别通过多层感知机处理观测信息,隐藏层神经元个数为256,使用ReLU激活函数,并使用Adam优化器最大化策略梯度和最小化价值函数损失进行网络更新。

8.根据权利要求7所述的森林火情检测和覆灭方法,其特征在于,步骤S4中,基于MAPPO算法对无人机调度模型进行预训练,包括如下子步骤:S4.1、智能体在环境中根据当前策略选择动作并执行,环境根据智能体动作反馈新的状态和奖励,智能体将信息存储在经验回放缓冲区中并记录轨迹;

S4.2、根据收集到的轨迹,使用GAE方法估计优势函数 ,估计方法为:计算TD误差,通过 反映当前状态值函数 估计的误差:;

其中,表示折扣因子;表示终止标志; 为该智能体采取相应动作后的返回奖励,经过PopArt正则化后为 ;

计算GAE优势估计,通过引入衰减因子 结合不同步数的TD误差:;

其中,表示时间步的偏移量;

S4.3、对每个actor网络进行训练,计算目标函数:;

其中,参数 表示actor网络参数,为策略熵超参数, 是策略熵, 表示经裁剪的期望累积折扣奖励;

S4.4、使用梯度上升最大化 ,计算策略损失梯度 ,再使用随机梯度上升方法更新actor网络参数 :

其中, 为学习率; 为更新前的actor网络参数;

S4.5、对中心critic网络进行训练,使用梯度下降最小化价值函数损失:;

其中, 表示在给定当前状态下对未来期望回报的估计, 函数表示将x限制在[a,b]范围内, 分别表示新旧参数下的状态值函数,用于计算期望累积折扣奖励,表示裁剪系数; 表示在策略 下的期望算子;

S4.6、重复步骤S4.1至步骤S4.5,直至策略收敛到最优解或达到最大训练轮次。

9.一种森林火情检测和覆灭系统,用于实施权利要求1至8任一所述的方法,其特征在于,包括:火情识别模块、火点定位和火场蔓延趋势计算模块、火情覆灭模块、复燃防范模块;

所述火情识别模块,通过卫星遥感、远程视频监控、巡航无人机实时采集火情数据,传输至指挥中心,生成红外热成像图,进行火情判断和火灾等级划分;

所述火点定位和火场蔓延趋势计算模块,基于红外热成像图标记为潜在火点,根据温度值对潜在火点进行排序,结合多源地理信息数据精准确定火点的地理坐标,根据火点在持续外热成像图的移动、变化情况实时更新,标记和定位新出现的火点;并基于Rothermel模型进行火灾蔓延模拟,计算火场蔓延趋势并更新火势蔓延边界;

所述火情覆灭模块,构建基于马尔可夫决策过程的无人机调度模型,并通过MAPPO多智能体强化学习算法对无人机调度模型进行预训练;通过巡航无人机搭载灭火弹,通过指挥中心基于训练好的无人机调度模型,进行优化调度,决策每个无人机的投掷顺序,以最短时间为优化目标,协同完成对所有潜在火点的排查和覆灭;

所述复燃防范模块,在扑灭明火后,通过巡航无人机继续巡逻火场,识别复燃点或烟点。