利索能及
我要发布
收藏
专利号: 2022112580036
申请人: 中国矿业大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种改进YOLO‑PAI的实时接打电话行为检测方法,其特征在于:包括以下步骤:步骤S1、通过监控平台获取的人员接打电话视频,建立并标注Phonehand_Imgs数据集,并划分训练集、验证集和测试集;

步骤S2、使用目标检测模块和注意力机制模块搭建卷积神经网络,网络最终输出为人的手部、手机和检测框位置信息;

步骤S3、利用搭建的卷积神经网络对数据集图像进行训练,对于步骤S1中的数据集图像进行特征提取,图像通过SRblock_body结构,在对图像进行卷积的过程中不断融合浅层的图像特征;

步骤S4、在卷积的过程中,使用SE通道注意力机制和CBAM空间注意力机制,为不同的特征分配不同的权重,使网络能够更有效地提取关键特征;

步骤S5、增加第四个尺度的特征映射分支,扩大检测范围,丰富用于预测多尺度的特征图。

步骤S6、将接打电话检测模型转换为可以嵌入式部署的模型。

步骤S7、将步骤S6中转换后的模型部署到监控终端设备中,将终端设备摄像头拍摄的视频流输入接打电话检测模型,并输出检测结果。

2.如权利要求1所述的基于边缘对称填充和大感受野的路面病害检测方法,其特征在于:步骤S1包括:步骤S11、Phonehand_Imgs数据集由视频监控设备采集,提取数据集中人员手部和手机两种标注信息;

步骤S12、将Phonehand_Imgs数据集按照8:2的比例划分训练集和验证集;

步骤S13、在训练阶段加载数据集时,使用Mosaic数据增强方法提高数据鲁棒性、利用Label Smoothing平滑、CIOU、学习率余弦退火衰减提高实验效果,以及水平和垂直翻转、随机旋转、随机裁剪、变形和缩放数据增强方式增加数据量较少的类型的样本量,提高模型的泛化能力。

3.如权利要求1所述的基于边缘对称填充和大感受野的路面病害检测方法,其特征在于:步骤S2中所述卷积神经网络包括目标检测模块和注意力机制模块,其中,目标检测模块用于检测人的手部信息及手机位置信息,注意力机制模块用于为不同的特征分配不同的权重,使网络能够更有效地提取关键特征。

4.如权利要求1所述的基于边缘对称填充和大感受野的路面病害检测方法,其特征在于:步骤2所述YOLO‑PAI神经网络搭建的具体步骤为:步骤S21、输入图像在保证纵横比的前提下被缩放到416×416像素,并输入到网络中提取特征映射;利用剪枝算法将原先的五个部分1、2、8、8、4(1‑2‑8‑8‑4)残块改进成1‑2‑8‑4‑

4结构,并将初始通道数设定为16;

步骤S22、引入SE模块,提出SRblock_body模块代替原先的CSPBlock模块,在SRblock_body模块中,将基于Inception结构体替换原来的3×3卷积核;

输入经过一层3×3卷积层,降低特征图宽度和高度。再进行分路操作,一路操作进行一层1×1的卷积视为残差边,通道不降维,减少原先进入残差块的特征层数量;

另一路操作输入到n个Residual结构中,先进行一层1×1的卷积层,通道降维从原来的

32降到16,随后使用3x1+1x3卷积来代替3x3卷积,空间分解卷积可以讲参数量减少一半,从而减少参数量;

然后引入SE通道注意力机制模块,为不同的特征分配不同的权重,使网络能够更有效地提取关键特征;

然后把两路分支提取的特征图拼接在一起,每经过一个RES‑SEBlock通道数增加一倍,这种新的残差结构建立了一个大的残差边;

步骤S23、将CSPDarknet53中的浅层Mish激活函数替换为Hard‑swish函数,而更深层网络的后三层中的激活函数仍然使用Mish激活函数;利用SPP模块融合不同尺度大小的特征图,并利用自顶向下的FPN特征金字塔与自底向上的PAN特征金字塔提升网络的特征提取能力;

步骤S24、使用k‑means聚类算法获得9个锚点小型目标,增加第四个尺度的特征映射分支,扩大检测范围,丰富用于预测多尺度的特征图。

5.如权利要求1所述的基于边缘对称填充和大感受野的路面病害检测方法,其特征在于:步骤S6中的模型部署方法为将模型转换为TensorRT模型。