1.一种适用于电影推荐的不平衡标记分布学习方法,其特征在于:包括以下步骤:
S1、构建包括特征编码器、全标记编码器、标记重构解码器以及第一和第二解码器的不平衡性标记分布学习网络;第一和第二解码器分别输出的结果进行融合,得到预测标记分布,预测标记分布为网络的最终输出;
S2、计算网络的总优化损失;总优化损失包括优势和非优势标记分支损失以及用于平衡优势和非优势标记分支损失的优势和非优势标记分支动态权重;
S3、基于训练集和总优化损失对网络进行训练,得到网络模型;
其中,第t个 epoch 训练过程中优势和非优势标记分支的可学习参数更新方式,包括如下步骤:
分别依据第t‑1个epoch的优势和非优势标记分支损失计算第t个epoch中优势和非优势标记分支的梯度;使用优化器基于所述梯度分别对优势和非优势标记分支的可学习参数进行自适应更新;
S4、基于待预测的电影评分标记分布不均衡的数据集获取特征向量和标记分布,输入网络模型中前向传播一次,得到预测标记分布及真实标记分布。
2.根据权利要求1所述的适用于电影推荐的不平衡标记分布学习方法,其特征在于:训练集是基于 Movie 数据集获取的;Movie 数据集中,每部电影的评分标记分布均为文本数据,每部电影的评分标记分布是根据所有用户在各评分等级上的投票比例统计而得到的。
3.根据权利要求1所述的适用于电影推荐的不平衡标记分布学习方法,其特征在于:将预测优势标记分布与预测非优势标记分布进行融合,包括以下步骤:将预测优势标记分布与预测非优势标记分布进行相加求和,而后通过Softmax函数进行归一化处理,得到预测标记分布。
4.根据权利要求1所述的适用于电影推荐的不平衡标记分布学习方法,其特征在于:优势标记分支动态权重和非优势标记分支动态权重是通过优势分支指数移动平均平滑损失和非优势分支指数移动平均平滑损失动态生成的。
5.根据权利要求4所述的适用于电影推荐的不平衡标记分布学习方法,其特征在于:不平衡标记分布学习网络训练过程中,获取第t 个epoch中的优势和非优势标记分支动态权重的方式,包括以下步骤:步骤A、计算第t 个epoch中优势分支指数移动平均平滑损失和非优势分支指数移动平均平滑损失;
步骤B、计算第t 个epoch中的平均平滑损失比值,第t 个epoch中的平均平滑损失比值是通过计算第t 个epoch中的优势分支指数移动平均平滑损失以及第t 个epoch中的非优势分支指数移动平均平滑损失与固定参数ε之和的比值得到的;
步骤C、基于第t 个epoch中的平均平滑损失比值获取第t 个epoch中的优势标记分支动态权重与非优势标记分支动态权重。
6.根据权利要求1所述的适用于电影推荐的不平衡标记分布学习方法,其特征在于:步骤C,具体包括如下步骤:步骤C‑1、利用 Sigmoid 函数基于第t 个epoch中的平均平滑损失比值获取第t 个epoch中的非优势标记分支动态权重;
步骤C‑2、根据第t 个epoch中的非优势标记分支动态权重计算第t 个epoch中的优势标记分支动态权重;其中,第t 个epoch中的非优势标记分支动态权重与第t 个epoch中的优势标记分支动态权重之和等于1。
7.根据权利要求5所述的适用于电影推荐的不平衡标记分布学习方法,其特征在于:优势分支指数移动平均平滑损失的初始值与优势标记分支损失的初始值相等;非优势分支指数移动平均平滑损失的初始值与非优势标记分支损失的初始值相等。
8.根据权利要求1所述的适用于电影推荐的不平衡标记分布学习方法,其特征在于:分别依据第t‑1个epoch的优势标记分支损失和非优势标记分支损失计算第t个epoch中优势标记分支的梯度和非优势标记分支的梯度;而后,使用SGD优化器基于第t个epoch中的优势标记分支的梯度以及非优势标记分支的梯度分别对优势标记分支和非优势标记分支的可学习参数进行自适应更新;具体包括如下步骤:a)、基于第t‑1个 epoch 训练过程中的优势损失自适应动量系数、优势标记分支的梯度以及优势动量缓冲变量,更新第t个 epoch 中的优势动量缓冲变量;
b)、基于第t‑1个epoch训练过程中的非优势损失自适应动量系数、非优势标记分支的梯度以及非优势动量缓冲变量,更新第t个 epoch 中的非优势动量缓冲变量;
c)、基于第t‑1个 epoch 中的优势和非优势分支参数、第t个epoch 中的优势和非优势动量缓冲变量以及第t‑1个epoch中的优势标记分支动态权重和非优势标记分支动态权重,利用SGD优化器分别更新第t个epoch中的优势和非优势分支参数。
9.根据权利要求1所述的适用于电影推荐的不平衡标记分布学习方法,其特征在于:步骤S3,具体包括如下步骤:将训练集中的特征向量输入特征编码器,并将训练集中的标记分布输入全标记编码器,前向传播,计算不平衡性标记分布学习网络的总优化损失,并在总优化损失的引导下进行反向传播,反向传播过程中,分别依据第t‑1个epoch的优势标记分支损失和非优势标记分支损失计算第t个epoch中优势标记分支的梯度和非优势标记分支的梯度;而后,使用SGD优化器基于第t个epoch中优势标记分支的梯度以及非优势标记分支的梯度分别对优势标记分支和非优势标记分支的可学习参数进行更新,即可完成不平衡性标记分布学习网络下一个epoch中的可学习参数更新;迭代300个epoch后完成一个训练段的训练,得到一个不平衡性标记分布学习网络模型,其中,对不平衡性标记分布学习网络进行训练的过程中,共进行10个训练段的训练,从而得到10个不平衡性标记分布学习网络模型。