利索能及
我要发布
收藏
专利号: 2023105414214
申请人: 浙江理工大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-07-01
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种非限制场景下的实时车牌检测识别系统,其特征在于,主要包括:基于YOLOv5车牌检测网络与PDLPR车牌识别网络;

基于YOLOv5车牌检测网络接受输入的整车图片,定位图片中的车牌位置,然后输出仅包含车牌信息的车牌图片;PDLPR车牌识别网络以车牌图片为输入,把车牌图片经过特征提取、编码器编码和并行解码器解码操作后得到车牌字符序列;

PDLPR车牌识别网络包括3个模块:

依次连接的改进的全局特征提取器IGFE、编码器Encoder、并行解码器Parallel Decoder;

改进的全局特征提取器IGFE包括1个FocusStructure模块、2个ConvDownSampling模块和4个RESBLOCK模块;

FocusStructure模块用于:

在输入的图片中每隔一个像素取一个值,一张图片就被均等分成四张特征图,然后将这4张特征图沿通道方向进行连接操作,则一张原本只有3通道的图片变成了一张12通道且宽高均为原来一半的特征图,最后将得到的特征图再经过卷积操作,完成二倍下采样操作。

2.根据权利要求1所述的一种非限制场景下的实时车牌检测识别系统,其特征在于,PDLPR车牌识别网络进行识别的具体内容如下:先将输入的车牌图片进行预处理,再把预处理完的图片输入到改进的全局特征提取器IGFE进行特征提取,预处理完的图片被转化为512*6*18的特征向量;在Encoder部分,位置编码器先把从IGFE部分得到的特征图进行位置编码,将得到的精确的位置编码与图像特征向量相加,再使用多头注意力机制把嵌入了位置编码的图像特征图进行编码;在并行解码器部分,训练时将真实车牌序列右移一位,然后加上对应的位置编码,再使用多头注意力机制Multi‑head attention把编码器输入的特征向量进行解码,预测每个字符的下一个位置的字符。

3.根据权利要求1所述的一种非限制场景下的实时车牌检测识别系统,其特征在于,编码器包括残差连接的3个单元,每个单元包含4个子模块:CNN BLOCK1,Multi‑Head Attention,CNN BLOCK2和Add&Norm。

4.根据权利要求1所述的一种非限制场景下的实时车牌检测识别系统,其特征在于,并行解码器包括3个完全相同的解码单元,每个单元包含4个子模块:Multi‑Head Attention,Masked Multi‑Head Attention,Feed‑Forward Network和Add&Norm。