欢迎来到利索能及~ 联系电话:18621327849
利索能及
我要发布
收藏
专利号: 2021111975378
申请人: 江南大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-10-29
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于卷积神经网络的服装属性识别方法,其特征在于,步骤如下:步骤1:候选区的选取,以选择性搜索算法提取候选区域,通过各个提取区域间的颜色、纹理、尺寸和吻合度之间的相似性对区域进行合并;

1)使用基于图的图像分割算法分割得到原始分割区域集合,用R={r1,r2,...rn}表示;

2)计算相邻区域之间的相似度包括颜色相似度、纹理相似度、尺寸相似度以及吻合度,并存储在集合S中;

3)合并集合R中相似度最高的两个相邻区域rp和rq形成新的区域rt,并在集合S中删除rp和rq相邻区域之间的相似度;

4)计算rt和相邻区域之间的相似度,并将相似度的值存入集合S中,将rt储存在集合R中;

5)迭代重复步骤3、4,直到集合S为空;

6)按照尺寸大小筛选出可能的候选框;

步骤2:对提取的矩形区域进行预处理;

具体处理为:模型图像的输入尺寸为224*224*3,用双线性插值方法对矩形框进行防缩,放缩系数τ由矩形框中比较长的一边决定;在经过放缩系数为τ的等比放缩后,在短边方向上两边会留有长度为a的空白;用全0填充短边方向上的空白;

步骤3:候选区的特征提取和分类;

将尺寸归一化的经选择性搜索算法提取候选框在稀疏神经网络CNN中进行传播,将最后池化层的2048维特征向量提取出来,然后用训练好的L‑Softmax预测其属于每个分类可能性及分数,对于每个类别,图片中的预选区域都会对其有一个分数;

步骤4:采用非极大值抑制来对提取的区域进行筛选评价;

步骤5:采用边界回归的方法校正识别区域,提取通过稀疏神经网络的池化层特征值,进行平移变换和尺度防缩;最终模型的输出是对目标边框的预测值。

2.如权利要求1所述的一种基于卷积神经网络的服装属性识别方法,其特征在于,所述的步骤1中,使用的颜色分量包括:(1)RGB空间的R、G、B;(2)加权灰度值I;(3)Lab颜色空间L、a、b;(4)HSV颜色空间H、S和V。

3.如权利要求1或2所述的一种基于卷积神经网络的服装属性识别方法,其特征在于,所述的选择性搜索算法中阈值设置为50,聚类尺度参数为18。

4.如权利要求1或2所述的一种基于卷积神经网络的服装属性识别方法,其特征在于,所述的步骤5中,边界回归包含两个变换、平移变换和尺度放缩。

5.如权利要求1或2所述的一种基于卷积神经网络的服装属性识别方法,其特征在于,所述的非极大值抑制,步骤如下:首先设6个预选框,根据经过分类器后的分类概率排序,从小到大分别属于某一类的概率排序为A、B、C、D、E、F;

1)从最大概率的选区F开始,分别判断A~E与F的重叠度IOU是否大于某一个预先设定的阈值;

2)假设B、D和F的IOU大于设定的阈值,那么排除B和D,标记概率最大的矩形框F并保留下来;

3)从余下来的选区A、C、E中,选择概率最大的区域E,然后计算E与A、C的IOU,如果重叠度大于设定的阈值就排除,并且标记E是保留下来的第二个区域;

4)重复上述过程,直到筛选出所有保留下来的候选区。

6.如权利要求3所述的一种基于卷积神经网络的服装属性识别方法,其特征在于,所述的非极大值抑制,步骤如下:首先设6个预选框,根据经过分类器后的分类概率排序,从小到大分别属于某一类的概率排序为A、B、C、D、E、F;

1)从最大概率的选区F开始,分别判断A~E与F的重叠度IOU是否大于某一个预先设定的阈值;

2)假设B、D和F的IOU大于设定的阈值,那么排除B和D,标记概率最大的矩形框F并保留下来;

3)从余下来的选区A、C、E中,选择概率最大的区域E,然后计算E与A、C的IOU,如果重叠度大于设定的阈值就排除,并且标记E是保留下来的第二个区域;

4)重复上述过程,直到筛选出所有保留下来的候选区。