欢迎来到利索能及~ 联系电话:18621327849
利索能及
我要发布
收藏
专利号: 2019109472640
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-10-29
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种融合异构信息网络和深度学习的电影推荐方法,其特征在于:包括以下步骤:S1:获取用户‑电影交互数据,包括用户属性、用户‑电影的交互数据和电影的属性数据;

S2:提取关系对,包括用户‑电影交互关系对、电影属性关系对、用户属性关系对;

S3:构建异构信息网络;根据用户‑电影交互数据构建异构信息网络 其中V表示所有具有实际意义的节点的集合,E表示节点之间的关系的集合,表示实体节点类型映射函数 V→A,θ表示节点间的关系映射函数θ:E→R;任意一个节点v都对应一个节点类型A即 任意一条网络中的边都对应一种关系类型r,即θ(e)∈R;

S4:设计元路径,并根据元路径分别以用户和电影为中心提取网络中的结构关系;在步骤S4中,根据建立的异构信息网络和每个节点之间的逻辑关系,构建S条元路径(M1,M2,M3,...,Ms‑1,Ms)用于用户‑电影关系特征提取,因而第i条路径 表示从实体对象类型A1到实体对象类型Am的结构关系,Ri表示相邻节点之间的关系;根据生成的元路径集M与公式(1),对于 为 生成h条长度为l的路径,v为起始节点,生成的路径集合用集合D表示,每条路径中每一个节点通过公式(1)确定,公式如下:其中 表示节点类型为t(t∈R)的邻接节点且类型为t+1的节点个数;

根据上述,每条路径确定的具体步骤如下:

(1)初始化需要生成的路径的长度l,元路径m∈M,异构信息网络g;

(2)根据节点集V,选定一个初始节点,并作为当前节点;

(3)根据g,确定与当前节点相邻的节点集;

(4)根据当前节点的类型,与该节点相邻的节点集,元路径中的节点类型和下一个需要确定的节点类型,由公式(1)确定下一个节点,将此节点加入路径,并作为当前节点;

(5)根据当前的路径长度确定是否要迭代执行步骤(3)(4);

S5:采用HIN2Vec方法提取网络中的节点特征;为了提取节点的特征表示信息,采用已有方法HIN2Vec,具体如下,首先给V中的每个节点v随机生成一个k维特征向量用于描述v构成特征集 并从每条路径d∈D中提取四元关系组 作为训练特征的数据,其中x1,x2是路径d上任意两相邻节点,r(r∈R)表示两节点之间的关系,Is(x1,x2,r)表示x1,x2是否存在关系r,若存在则值为1,不存在则为0,如公式(2)所示:提取好四元组关系后,节点特征更新方法如下:

S51:建立目标损失函数:

F(x1,x2,r)=Is(x1,x2,r)logp(r|x1,x2)+(1‑Is(x1,x2,r))log[1‑p(r|x1,x2)]S52:采用随机梯度下降方法最大化目标函数F,并利用数据 迭代更新节点特征w∈W,公式如下:其中W′x1作为节点x1的权重矩阵, 是代表x1的初始特征表示;

S6:构建用户‑电影交互特征矩阵,并根据电影数据集,给特征矩阵标签化;得到节点集的特征表示后,取出所有代表用户U和电影I的节点集,将用户与电影的交互特征 表示如下:其中 代表矩阵乘法, 代表用户的不同元路径的权重, 代表电影的不同元路径的权重;在取得用户与电影的交互特征之后,根据数据集提取用户与电影的访问关系,提取方式如下:S7:构建卷积神经网络模型,根据S6生成的标签化的特征矩阵,训练卷积神经网络模型;

S8:运用训练好的模型进行偏好预测,运用TOP‑K排序,生成用户感兴趣的电影序列。

2.根据权利要求1所述的融合异构信息网络和深度学习的电影推荐方法,其特征在于:在步骤S1中,获取的数据包括用户ID数据、用户的性别数据、用户对电影的访问情况数据、电影ID数据、电影的分类数据。

3.根据权利要求1所述的融合异构信息网络和深度学习的电影推荐方法,其特征在于:在步骤S2中,提取的关系对包括{用户:电影,用户:性别,电影:分类}。

4.根据权利要求1所述的融合异构信息网络和深度学习的电影推荐方法,其特征在于:在步骤S7中,构建卷积神经网络,具体步骤如下:

S71:卷积层: 其中bat是每次处理的

数据量,ω_11为卷积核, 代表卷积操作, 为偏置,f(.)代表激活函数,采用线性整流函数(Rectified Linear Unit,ReLU);

S72:卷积层: ω_12为卷积核, 为偏置,f(.)代表激活函数,采用Relu;

S73:池化层:采用最大池化df_1=max(h_11);

S74:卷积层: ω_21为卷积核,b_21∈R为偏置,f(.)代表激活函数,采用Relu;

S75:卷积层: ω_22为卷积核,b_22∈R为偏置,f(.)代表激活函数,采用Relu;

S76:池化层:采用最大池化df_2=max(h_22);

S77:全连接层:将df_2转化为一维向量F;

S78:输出:f_output=softmax(F);

S79:损失函数:交叉熵损失函数:

其中N为样本数,visit(visit∈Visit)代表原始的用户‑电影访问关系,f_output为预测的访问关系。

5.根据权利要求1所述的融合异构信息网络和深度学习的电影推荐方法,其特征在于:在步骤S8中,运用构建好的卷积神经网络模型,将 与Visitu,i构成二元组作为训练集T送入卷积神经网络中进行训练,利用训练好的模型去预测用户与新的电影的关系,预测结果代表了用户对电影的喜爱程度,将用户最感兴趣的电影推荐给用户。