1.一种基于类别统计驱动的伪标签自蒸馏语义分割方法,其特征在于,包括以下步骤:步骤1、选择Cityscapes数据集中的N幅图像作为训练图像,1000
步骤2、采用有监督训练,以交叉熵为损失函数对图像语义分割模型进行训练,训练后得到教师模型,利用教师模型对训练样本集DT进行预测,统计教师模型的预测结果得到所有类别的统计概率分布,转入步骤3;
步骤3、利用每个类别的概率分布对训练样本集DT中的原始标签分别进行软化,得到对应的软化标签,利用软化标签与对应的教师模型预测结果加权平均得到学生模型的训练标签,转入步骤4;
步骤4、利用学生模型的训练标签对学生模型进行监督训练,学生模型损失函数采用余弦相似度函数,转入步骤5;
步骤5、选择Cityscapes数据集中的其他M幅图像作为测试图像,100
步骤6、将测试样本集DS中的图像输入学生模型,输出语义分割图。
2.根据权利要求1所述的一种基于类别统计驱动的伪标签自蒸馏语义分割方法,其特征在于,步骤2中利用教师模型对训练样本集DT进行预测,统计教师模型的预测结果得到所有类别的统计概率分布,具体如下:将训练样本集DT逐一输入教师模型,得到单幅图像的预测结果 根据对应的原始标签确定预测正确的像素点,计算单一训练样本图像中同一类别的预测正确像素的概率分布均值 类别i∈{1,2,3,…,Nc},采用指数移动平均的方法计算出训练样本集中某一类别的概率分布 教师模型预测一次,Pi更新一次,直至迭代完训练样本集中所有的训练样本图像,迭代公式如下:式中β为比例因子,设置为1‑1/N, 为上一次迭代的结果,初始值为第i类的独热码,最终训练样本集中所有类别的统计概率分布
3.根据权利要求1所述的一种基于类别统计驱动的伪标签自蒸馏语义分割方法,其特征在于,步骤3中,利用每个类别的概率分布对训练样本集DT中的原始标签分别进行软化,得到对应的软化标签,利用软化标签与对应的教师模型预测结果加权平均得到学生模型的训练标签,具体如下:H×W
训练样本集DT中的原始标签L,L∈R ,根据原始标签L得知每幅训练样本图像中第h行w列像素的类别为Lh,w,Lh,w∈{1,2,3,…,Nc},h∈{1,2,3,…,H},w∈{1,2,3,…,W},软化标soft签L 的第h行w列像素的概率分布将从对应类别的统计概率分布P中获取,soft式中, 表示软化标签L 的第h行w列像素的概率分布, 表示统计概率分布P中类别Lh,w的概率分布;
s pre soft
学生模型的训练标签L由教师模型的预测结果T 和软化标签L 加权平均获得,计算公式如下:s soft pre
L=α*L +(1‑α)*T
式中,α为平衡因子,取值范围为0.5到1之间。
4.根据权利要求1所述的一种基于类别统计驱动的伪标签自蒸馏语义分割方法,其特征在于,步骤4中,利用学生模型的训练标签对学生模型进行监督训练,具体如下:pre pre
将训练样本集DT输入学生模型中,得到输出结果S ,在学生模型输出结果S 与学生模s型的训练标签L 之间构建损失函数,通过反向传播训练学生模型的网络参数,损失函数loss计算公式如下:s
式中Cosine_Similarity(·,·)为余弦相似度函数, 表示学生模型的训练标签L的第h行w列像素的标签, 表示学生模型相应图像的第h行w列像素的输出结果。