1.一种基于一致惩罚场损失函数的深度度量学习方法,该方法应用于改善计算机视觉中的图像分类匹配任务精度,其特征在于,包括以下步骤:S10、数据获取与预处理:获取数据集,并将数据集划分为训练集、测试集和验证集,并对训练集图片进行统一尺寸,数据增强处理;
S20、利用一致惩罚场损失函数训练优化深度学习模型:将训练集输入至深度学习模型中,获得图像的嵌入特征,随后利用一致惩罚场损失函数得到网络模型的损失值,所述一致惩罚场损失函数的实现则是通过执行步骤S21‑步骤S23;
S21、为相同类别的样本提供吸引场,目的是拉近同一类样本间的距离,吸引场的强度与proxy和样本特征之间的余弦距离成正比,相似度越小,吸引力就会越大,吸引场的表达式如下:其中 是第i个样本特征与其proxy之间的角度,N是批次数, 是第i个样本吸引力的权重;
S22、为不同类别的样本提供惩罚场,目的是推远不同类别样本间的距离,惩罚场的强度与proxy和样本特征之间的余弦距离成反比,相似性越大,推力越大,惩罚场的表达式如下:其中θij是第i个样本和第j个proxy的特征之间的角度, 则是第i个样本与第j个proxy之间的惩罚力权重,而τ则是用以消除无信息负面要素的阈值;
S23、对吸引场和惩罚场进行平衡,在深度度量学习中,由于不同类别的样本会比同类别的样本多很多,所以平衡吸引场和惩罚场是很有必要的,通过如下的表达式平衡吸引场与惩罚场,并得到最终的一致惩罚场损失函数值:其中λ为吸引场与惩罚场之间的权重超参数,Tp则是基于同类别间余弦相似度的深度度量学习的评价值,并在式中分子分母上加上常数来增加损失值的稳定性;
S30,计算机视觉任务中应用深度学习模型进行推理决策:将测试集中的图像输入进训练好的模型中,计算每个图像嵌入特征与其余所有图像嵌入特征的余弦相似度,并设置统一的阈值,若图像间的余弦相似度大于阈值,则将两个图像视为同一类,从而得到计算机视觉任务中的图像分类及匹配结果。