1.一种基于物品相似分析的方法,其特征在于,包括以下步骤:S1、商品相似度计算;
S2、设置互斥规则库;
S3、动态GPU资源分配。
2.根据权利要求1所述的一种基于物品相似分析的方法,其特征在于,包括以下步骤:根据S1中的操作步骤,商品相似度计算的方法为:
S11、相似度计算是使用resnet50进行训练,训练数据是选用的是实际中的商品共1000种类,每个种类共有400张图片,每一张图像是320×320分辨率大小;
S12、采用图像增强方法,并沿着中心、左上、左下、右上、右下以256*256的大小进行裁剪,并对裁剪之后的进行水平翻转、以60度、30度进行旋转,加入随机噪声、颜色扰动和随机加入噪声,之后从增强的数据中随机抽取1000类别的1000张图像,训练分类识别初始模型。
3.根据权利要求1所述的一种基于物品相似分析的方法,其特征在于,包括以下步骤:根据S2中的操作步骤,规则库指的是比较相似的商品是不允许放在同一个柜子中,规则库分为相似互斥和经验库。
4.根据权利要求1所述的一种基于物品相似分析的方法,其特征在于,包括以下步骤:根据S3中的操作步骤,算法处理订单视频的耗时与商品复杂度和视频的长短密切相关,其中商品复杂度可定义为柜内整体识别复杂度(相似度):柜内整体识别复杂度是计算柜内商品的相互之间的相似度,并对其求和取平均,假设柜内商品数量为M,计算如下:其中i≠j,n=(M‑1)*M/2;
其中v代表特征向量,i≠j,i和j表示不同的特征向量,n为无人货柜内商品之间计算相似度的次数,计算公式为n=(M‑1)*M/2,fθ为点积计算公式;
算法处理时间的预测是根据历史数据中获取到柜内的平均复杂度θm、视频的时长tv和实际算法处理时间tp的数据3000条,记平均复杂度θm、视频的时长tv为变量X={x1,x2},实际处理时间tp为Y={tp},对历史数据进行非线性拟合,预测Y,预测采用常用的非线性回归,选用二次方进行回归预测,预测模型为:Tp(x1,x2)为预测模型二次方的通用公式,其中x1,x2分别为输入的平均复杂度θm、视频的时长tv的两个变量,其中a,b,c,d,f,e为二次项的系数;
非线性回归通常转化为线性回归,再按照线性回归求解,线性回归通常采用给定的函数值与模型预测值之差的平方和最小为损失函数,并使用最小二乘法和梯度下降法来计算最终的拟合参数,模型求解采用的是机器学习sklearn库进行求解;
输入视频长度tv和柜内商品的复杂度θm到函数Tp(x1,x2),即可计算出所需时间:tp=Tp(θm,tv)
设当前队列中待识别订单的数量为N,当前在用的GPU实例的数量为k,计算当前待识别订单的预测时间的总和为:待识别订单的数量为N,i指当前待识别订单中的某一单,T是计算当前待识别订单的预测时间的总和;
一个订单最大的等待时间t不超过40s,计算待识别订单所需要的GPU实例数m:T是计算当前待识别订单的预测时间的总和,t为最大等待时间40s,m就是需要的GPU实例的个数;
根据待识别订单所需要的GPU实例数m和实际在线的GPU实例的数量为k,来计算是否要新增或减少GPU实例数,公式如下:计算出来需要新增或减少的GPU实例。
5.根据权利要求2所述的一种基于物品相似分析的方法,其特征在于,包括以下步骤:根据S12中的操作步骤,训练参数为:
优化器选择SGD,损失函数采用的交叉熵损失,初始化学习率为0.1,递减衰减系数为
0.1,训练之后保存训练模型;
修改模型去掉softmax层,并添加PCA降维将维度为1000的特征向量,降维为512个维度;
既最终的特征向量,如下:
v=fv(x)=fpca(fcnn(x))
其中x代表输入的图像像素,fcnn代表经过resnet50卷积层输出的1*1000维的特征向量v′,经过fpca降维处理后变为1*512维的特征向量v;
相似度计算方法采用两个特征向量点乘:
θ=fθ(v1,v2)
其中v1,v2为两个特征向量,fθ为将两个特征向量点乘,输出的结果θ,即为两个特征向量的相似度。
6.根据权利要求3所述的一种基于物品相似分析的方法,其特征在于,相似互斥就是根据商品相似度计算来判断,当商品库新增商品的时候,会对该商品进行特征提取,并与库存商品进行商品相似度计算,当相似度大于0.85的时候就标记该库存商品为相似互斥商品;
经验库是根据售后的记录来统计分析哪些商品容易识别错误,会纳入到经验规则库当中,经验规则库主要是考虑到实际在场景中,两个商品的商标特征不明显,但是颜色相同,或者是原本不相似的两个商品因为遮挡导致的剩余的部分商品的特征相似的情况,主要是记录下售后中每一个商品容易被识别错的商品的种类和次数当超过了一定的阈值N(设定为50)时,会自动加入到经验规则库中。