利索能及
我要发布
收藏
专利号: 202210574950X
申请人: 西安理工大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-04-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.基于轻量化骨干网络的目标检测方法,其特征在于,具体按照以下步骤实施:步骤1、准备预训练数据集Tiny‑Imagenet和VOC格式的训练数据集;

步骤2、搭建特征提取网络LBNet;

所述步骤2具体按照以下步骤实施:

步骤2.1、设计内部连接子块;

步骤2.2、设计残差连接块,通过跳跃连接的方式将每个内部连接子块的输入和输出进行相加,便就形成了残差连接块;

步骤2.3、设计局部密集连接块,将每个内部连接子块的输出层特征都与其前面所有内部连接子块的输出特征在对应通道维度上进行拼接,便就形成了局部密集连接块;

步骤2.4、设计LBNet的第一个网络层C1,C1是一个由步长为1,大小为3x3,通道数为32的卷积核、Batch Normalization层和激活函数ReLu组成的卷积层结构;

步骤2.5、设计LBNet中以残差连接块和密集连接块为主体的网络层结构C2,C3,C4,C5,C6;

步骤2.6、设计LBNet中的降采样层d;

步骤3、搭建由LBNet的多层输出特征构成的特征金字塔结构,并且在通过步骤1得到的Tiny‑Imagenet数据集中进行预训练,得到预训练权重;

所述步骤3具体按照以下步骤实施:

步骤3.1、设计横向连接结构,并通过横向连接结构将LBNet中网络层C2~C6的输出特征作为特征金字塔的输入;

步骤3.2、搭建由LBNet的多层输出特征构成的自上而下的特征金字塔结构;首先使用

1x1x64大小的卷积核分别对特征层F6,F5降维得到新的特征层P6,P5,这样就得到了第一个特征输出层P6,然后使用双线性插值的方法将P6上采样到与P5相同的尺寸大小;最后,将P6和P5在其对应的维度上进行相加,就获得了更新后的第二个特征输出层P5;基于上述的相同策略,使用P5更新P4,使用P4更新P3,使用P3更新P2;

步骤3.3、将预训练数据集TI中的图片送入由LBNet构成的特征金字塔结构中,并依据步骤1.1.2中的标签文件设置类别数,进行预训练,得到预训练权重;

步骤4、设计anchors生成容器算法CFA,生成区域推荐网络所需的anchors尺寸;

所述步骤4具体按照以下步骤实施:

步骤4.1、输入带有边界包围框的训练集图像即样本;

步骤4.2、从所有输入的图像中挑选k个边界包围框作为聚类中心;

步骤4.3、依次计算并比较所有边界包围框与每个聚类中心之间的距离D,并划分边界框所在的类;

步骤4.4、更新每个簇中的聚类中心,重复步骤4.2到步骤4.4,直到每个簇中没有样本发生改变时,选出最终的anchors尺寸;

步骤5、完成模型的训练和预测。

2.根据权利要求1所述的基于轻量化骨干网络的目标检测方法,其特征在于,所述步骤

1具体按照以下步骤实施:

步骤1.1、准备预训练数据集Tiny‑Imagenet,并生成预训练所需的标签文件;

所述步骤1.1具体按照以下步骤实施:

步骤1.1.1、从Imagenet数据集中抽取一部分来制作本所需的预训练数据集Tiny‑Imagenet,即预训练数据集TI;

步骤1.1.2、生成标签文件,根据每个类别对应的实际物体名称构建json类型的标签文件;从TI中按照8:2的比例去划分训练集和验证集,然后对TI中包含的每个类别中进行采样,分别得到标签文件train.csv和val.csv;

步骤1.2、准备VOC格式的训练数据集;

步骤1.2具体按照以下步骤实施:

步骤1.2.1、将广泛用于目标检测的Pascal VOC2007和2012数据集进行合并来制作我们所需的VOC格式的训练数据集M;

步骤1.2.2、生成标签文件,对训练集和验证集中的图像进行类别和区域标注,生成xml文件,并将其统一放在Annotations文件夹中,根据xml文件生成后续训练所需的train.txt,val.txt和trainval.txt标签文件,并统一放在Main文件夹中。

3.根据权利要求1所述的基于轻量化骨干网络的目标检测方法,其特征在于,所述步骤

2.1具体按照以下步骤实施:

步骤2.1.1、每个连接子块的结构都一样,均由一个大小为1x1的卷积核一个大小为3x3的卷积核构成;具体的前向传播过程是Conv(1x1)‑BN‑ReLu‑ Conv(3x3)‑BN‑ReLu;

步骤2.1.2、保证内部连接子块的输入和输出尺寸一致,将内部连接子块中1x1卷积核的通道数设置为3x3卷积核通道数的1/2。

4.根据权利要求3所述的基于轻量化骨干网络的目标检测方法,其特征在于,所述步骤

2.5具体按照以下步骤实施:

步骤2.5.1、将C2与C5设置为由局部密集连接块构成的层结构;C2是一个由3个内部连接子块构成的局部密集连接块,C5是一个由4个内部连接子块构成的密集连接块;

步骤2.5.2、将C3,C4,C6设置为由残差连接块构成的层结构;C3,C4,C6分别为由4个,6个和6个内部连接子块构成的残差连接块。

5.据权利要求4所述的基于轻量化骨干网络的目标检测方法,其特征在于,所述步骤

2.6具体按照以下步骤实施:

步骤2.6.1、在LBNet中C1~C6的相邻两个网络层之间,均采用一个大小为3x3,步长为2的降采样层d来完成下采样操作;

步骤2.6.2、对于网络层C2~C6来说,将步长为2,大小为3x3的卷积核移到了残差连接块之外的主干路径上,也就是在每个独立的连接块之前就完成图像的下采样。

6.根据权利要求5所述的基于轻量化骨干网络的目标检测方法,其特征在于,所述步骤

3.1具体按照以下步骤实施:

步骤3.1.1、设置LBNet输出特征层;选择从第1个局部密集连接块C2开始进行特征的输出,并将C2的输出记为F2,为了得到更加丰富的多尺度特征信息,将接下来的3个残差连接块C3、C4、C6的特征信息和1个局部密集连接块C5的特征信息进行输出,因此,这5个特征层依次记为:F={F2,F3,F4,F5,F6};

步骤3.1.2、统一设置输出层的通道数并对输出层进行降维;通过一个大小为1x1卷积核来完成上述C2~C6中特征层通道的降维,由于C2的通道数为64,所以此处的通道数统一设置为64。

7.根据权利要求1所述的基于轻量化骨干网络的目标检测方法,其特征在于,所述步骤

4.2具体按照以下步骤实施:

步骤4.2.1、随机选择一个边界包围框作为初始聚类中心X1;

步骤4.2.2、计算数据集中所有样本与X1之间的IOU,IOU最小的样本成为第二个聚类中心X2;依此类推,直到得到k个聚类中心,记为G={X1, X2,…,Xk}。

8.根据权利要求7所述的基于轻量化骨干网络的目标检测方法,其特征在于,所述步骤

4.4具体按照以下步骤实施:

步骤4.4.1、将同一个类别中的所有Bbox按照面积从小到大的顺序进行排序;

步骤4.4.2、将中值所代表的样本作为新的聚类中心;

步骤4.4.3、获得最终的anchors尺寸;由于FPN向RPN输出了多尺度特征,为5个预测特征层分别提供了由CFA生成的3种anchors尺寸,并将其传输给后续的网络;具体的尺寸分别为第一层:[13,20],[28,31],[29,66],第二层:[60,40],[55,103],[97,67],第三层:[75,

175],[121,120],[272,120],第四层:[126,249],[185,174], [212,292],第五层:[382,

205],[321,368],[473,336];

步骤5具体按照以下步骤实施:完成模型的训练和预测;将通过步骤2得到的预训练权重载入,将通过步骤4得到的anchor尺寸送入RPN网络中得到后续检测网络所需的区域建议框,然后在通过步骤1的得到的VOC格式的训练数据集上进行训练;最后完成模型的预测。