利索能及
我要发布
收藏
专利号: 2023113955503
申请人: 南通大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-11-13
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种半监督目标检测方法,其特征在于,包括以下步骤:将图像数据集分为有标签数据和无标签数据,对所述有标签数据和所述无标签数据进行数据增强;其中,所述无标签数据的数据量大于所述有标签数据;

基于两阶段目标检测算法Faster R‑CNN,获取教师模型和学生模型;

基于所述教师模型,通过阈值法对所述无标签数据进行筛选并计算分类损失,获取多尺度正则化损失和可靠分类伪标签;其中,具体包括:基于将所述无标签数据中的第一图像输入所述教师模型的区域候选网络RPN和区域预测头RoIHead,获取第一预测结果;其中,所述第一预测结果包括目标候选框的边框坐标和类别得分;

对所述区域候选网络RPN以及所述区域预测头RoIHead的输出结果进行约束,获取多尺度正则化损失;

响应于所述目标候选框的最高类别得分大于第一阈值,获取所述可靠分类伪标签;

将所述无标签数据中的第一图像进行最大池化下采样,获取第一采样图像;

将所述第一图像和所述第一采样图像输入所述教师模型的主干网络中并提取特征,并使用区域候选网络RPN生成第一候选框并获取第一损失函数;其中,基于公式(1),获取所述第一损失函数;所述公式(1)为:   (1);

其中, 代表第一损失函数, 表示图像在区域候选网络RPN上输出的第i个概率图,m为概率图的个数; 为所述第一图像的概率图; 为所述第一采样图像的概率图;

将所述第一图像和所述第一采样图像输入所述教师模型的主干网络中并提取特征,并使用区域预测头RoIHead生成分类概率和边框回归参数,获取第二损失函数;其中,基于公式(2),获取所述第二损失函数;所述公式(2)为: (2);

其中, 为第二损失函数,cls和reg为第一图像img的候选框区域分类概率和候选框边框回归参数,clsd和regd为第一采样图像imgd的候选框区域分类概率和候选框边框i i回归参数,cls 和reg 分别表示一幅图像第i个候选框的分类概率和边框回归参数,N为一幅图像的候选框总数;

基于所述第一损失函数和所述第二损失函数,获取所述多尺度正则化损失;其中,基于公式(3),获取所述多尺度正则化损失;所述公式(3)为:(3);

基于所述教师模型,通过再预测法对所述无标签数据进行筛选并计算边框回归损失,获取无监督定位损失;其中,获取无监督定位损失的方法,包括:将所述无标签数据中的第一图像再次输入所述教师模型的区域候选网络RPN和区域预测头RoIHead,获取第二预测结果;其中,所述第二预测结果包括第二目标候选框的边框坐标和类别得分;

响应于所述第二预测结果中的类别得分大于第二阈值,获取第一标签;

基于所述第一标签和第一预测结果,获取所述第一标签中的边框与所述第一预测结果中的边框的交并比;

响应于所述交并比大于第三阈值,获取可靠定位伪标签;

基于所述可靠定位伪标签和所述可靠分类伪标签,获取无监督定位损失;其中,基于公式(4),获取所述无监督定位损失;所述公式(4)为:(4);

其中, 为无监督定位损失, 为无标签数据的分类损失和 为无标签数据的定位损失;

基于所述学生模型和所述有标签数据,获取有监督损失;

基于所述多尺度正则化损失、所述无监督定位损失以及所述有监督损失,获取最终模型损失函数;

所述学生模型基于所述最终模型损失函数采用梯度下降更新第一参数;所述教师模型基于所述第一参数通过EMA方法更新第二参数。

2.根据权利要求1所述的方法,其特征在于,所述对所述有标签数据和所述无标签数据进行数据增强的方法,包括:对所述无标签数据和所述有标签数据使用多尺度缩放进行数据增强,随机将图像宽高等比例缩放。

3.根据权利要求2所述的方法,其特征在于,所述等比例缩放的范围为‑50% 150%。

~