利索能及
我要发布
收藏
专利号: 2018113750818
申请人: 南京信息工程大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于K-means聚类和区域推荐网络的行人检测方法,其特征在于,该方法包括以下步骤:(1)构建特征提取网络,所述特征提取网络为去除inception v1模块中所有最大池化层后的网络;

(2)将K-Means聚类算法加入所述特征提取网络的最后一个DepthConcat层中,所述最后一个DepthConcat层记为C9,得到检测候选区域;

(3)将所述检测候选区域作为RPN网络的输入,得到带有矩形区域的包围框,采用ROI池化层采集所述包围框,并计算所述包围框的特征映射,对包围框进行分类和回归;

(4)利用大量训练样本训练所述步骤(1)(2)和(3)搭建的模型,得到目标网络结构和目标网络参数以及最终的行人检测网络框架;

(5)采用测试样本对训练好的模型进行实时检测。

2.根据权利要求1所述的基于K-means聚类和区域推荐网络的行人检测方法,其特征在于,所述步骤(2)中,将K-Means聚类算法加入所述特征提取网络的C9中,包括以下步骤:(21)将C9输出的M特征集划分为Q*W个单元,每个单元给定A个不同高度和宽度比的候选区域;

(22)在Q*W*A个候选区域中选取N个候选区域,每个候选区域代表一个类,以候选区域的中心位置作为聚类中心点;

(23)采用欧氏距离度量一个候选区域的中心位置到各个类的距离,把这个候选区域归划给最近的类,移动候选区域到对应的类,移动后重新计算这个变化后的类的聚类中心,同时计算目标函数的值;

(24)判断聚类中心和目标函数的值是否发生变化,若不变,则输出聚类结果;否则,将下一个候选区域按照新的聚类中心重新进行上述操作,再次进行判断聚类中心是否移动或者目标函数的值是否发生变化;

(25)以此迭代操作直至达到条件或者N个候选区域都已完成聚类,得到与实际目标区相似的所述检测候选区域。

3.根据权利要求2所述的基于K-Means聚类和区域推荐网络的行人检测方法,其特征在于,所述步骤(25)中,所述目标函数表示为:min∑N ∑M(1-IoU(Box[N],Truth[M]))

其中,N为候选区域的总数,M为C9输出的特征集的个数,Box[N]候选区域的高度与宽度,Truth[M]实际目标区的高度和宽度,IoU为候选区域与实际目标区的交叠率。

4.根据权利要求1所述的基于K-Means聚类和区域推荐网络的行人检测方法,其特征在于,所述步骤(3)中,包围框的分类通过包围框分类网络实现,所述包围框分类网络为全连接层和softmax分类层后的子网络,其输出是每个锚是行人或背景的概率分布。

5.根据权利要求4所述的基于K-Means聚类和区域推荐网络的行人检测方法,其特征在于,所述步骤(3)中,包围框的回归通过包围框回归网络实现,所述包围框回归网络是与所述包围框分类网络并列的子网络,其计算每个包围框的位置偏移量,用于回归更加精确的目标检测框,同时只对包含目标的锚计算误差。

6.一种根据权利要求1~5任一项所述的基于K-Means聚类和区域推荐网络的行人检测方法实现的系统,其特征在于,包括:特征提取网络构建模块,用于构建特征提取网络,所述特征提取网络为去除inception v1模块中所有最大池化层后的网络;

候选区域生成模块,用于将K-Means聚类算法加入所述特征提取网络的最后一个DepthConcat中,所述最后一个DepthConcat记为C9,得到检测候选区域;

包围框分类回归模块,用于将所述检测候选区域作为RPN网络的输入,得到带有矩形区域的包围框,采用ROI池化层采集所述包围框,并计算所述包围框的特征映射,对包围框进行分类和回归;

训练模块,用于利用大量训练样本训练所述特征提取网络构建模块、候选区域生成模块以及包围框分类回归模块搭建的模型,得到目标网络结构和目标网络参数以及最终的行人检测网络框架;

测试模块,采用测试样本对训练好的模型进行实时检测。

7.根据权利要求6所述的基于K-Means聚类和区域推荐网络的行人检测系统,其特征在于,所述候选区域生成模块,包括:特征集划分单元,用于将C9输出的M特征集划分为Q*W个单元,每个单元给定A个不同高度和宽度比的候选区域;

候选区域选取单元,用于在Q*W*A个候选区域中选取N个候选区域,每个候选区域代表一个类,以候选区域的中心位置作为聚类中心点;

候选区域归类单元,用于采用欧氏距离度量一个候选区域的中心位置到各个类的距离,把这个候选区域归划给最近的类,移动候选区域到对应的类,移动后重新计算这个变化后的类的聚类中心,同时计算目标函数的值;

结果判断单元,用于判断聚类中心和目标函数的值是否发生变化,若不变,则输出聚类结果;否则,将下一个候选区域按照新的聚类中心重新进行上述操作,再次进行判断聚类中心是否移动或者目标函数的值是否发生变化;

检测候选区域生成模块,用于不断迭代操作,直至达到条件或者N个候选区域都已完成聚类,得到与实际目标区相似的所述检测候选区域。

8.根据权利要求6所述的基于K-Means聚类和区域推荐网络的行人检测系统,其特征在于,所述检测候选区域生成模块中,目标函数表示为:min∑N ∑M(1-IoU(Box[N],Truth[M]))

其中,N为候选区域的总数,M为C9输出的特征集的个数,Box[N]候选区域的高度与宽度,Truth[M]实际目标区的高度和宽度,IoU为候选区域与实际目标区的交叠率。

9.根据权利要求6所述的基于K-Means聚类和区域推荐网络的行人检测系统,其特征在于,所述包围框分类回归模块,包括:包围框分类单元,用于通过包围框分类网络实现包围框的分类,所述包围框分类网络为全连接层和softmax分类层后的子网络,其输出是每个锚是行人或背景的概率分布。

10.根据权利要求9所述的基于K-Means聚类和区域推荐网络的行人检测方法,其特征在于,所述包围框分类回归模块,还包括:包围框回归单元,用于通过包围框回归网络实现包围框的回归,所述包围框回归网络是与所述包围框分类网络并列的子网络,其计算每个包围框的位置偏移量,用于回归更加精确的目标检测框,同时只对包含目标的锚计算误差。