欢迎来到利索能及~ 联系电话:18621327849
利索能及
我要发布
收藏
专利号: 2018101604967
申请人: 江苏大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-10-09
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于随机游走和条件随机场的社会标签推荐方法,其特征在于,包括以下步骤:步骤1,构造基于资源的多标签随机游走模型:标签数据中的实例通常由用户、资源、标签构成,抽取出关于资源和标签的数据,根据该数据构造基于资源的随机游走模型;

步骤2,设计以标签共现率、用户相似度为边特征函数和标签预测概率为点特征函数的条件随机场;

步骤3,估计条件随机场的参数:依据步骤2估计条件随机场的参数,获得条件随机场的各个参数值;

步骤4,基于条件随机场的社会标签推荐:依据步骤2获得的特征函数,步骤3获得的参数值,建立条件随机场,获得指定用户与资源的可能推荐标签;

所述步骤1中,构造基于资源的多标签随机游走模型包括以下步骤:步骤1.1,标签数据中的实例通常由(u,i,t)三元组构成,u代表用户,i代表资源,t代表u为i添加的标签,抽取出资源特征和标签D={(xi,yi)|1≤i≤m},其中(u,i,t)中的i对应D={(xi,yi)|1≤i≤m}中的xi,t对应yi,xi=[xi1,xi2,...,xid]代表资源i本身具有的d维特征向量,yi∈Y,Y={λ1,λ2,...,λq}代表为资源可能添加的q个标签,在获得资源标签数据集的基础上,将该资源标签数据集映射为资源随机游走图;

步骤1.2,基于步骤1.1,针对一个预测资源和资源随机游走图,构造资源的随机游走图系列;

步骤1.3,基于条件概率模型,获得预测资源的推荐标签概率向量。

2.根据权利要求1所述的一种基于随机游走和条件随机场的社会标签推荐方法,其特征在于,所述步骤1.1还包括如下过程:将资源标签数据集中的每个数据映射为一个点,如果两个资源数据具有相同的标签,则将这两个数据对应的点相连,依据该原则生成多标签随机游走图G=(V,E),为了更准确地描述两个资源数据之间的关系,对于任意资源节点,在所有的邻居节点中,如果一个节点与该资源相关性越小,游走到这个节点的概率越低,基于该思想计算转移矩阵P。

3.根据权利要求1所述的一种基于随机游走和条件随机场的社会标签推荐方法,其特征在于,步骤1.2的具体步骤为:步骤1.2.1,对d维输入空间的资源标签训练集和预测资源x,定义由训练集和预测资源x生成的多标签随机游走图系列;

步骤1.2.2,随机游走模型的初始化,随机游走模型的公式为S=(1-α)·PT·S0+α·d,并初始化邻接矩阵P、初始概率分布向量S0、跳转发生概率α、发生跳转时跳转到图中每个节点的概率分布向量d四个参数。

4.根据权利要求3所述的一种基于随机游走和条件随机场的社会标签推荐方法,其特征在于,步骤1.3的具体步骤为:步骤1.3.1,对于随机游走图系列中的任一子图,应用随机游走模型得到预测资源x与标签子图的节点相连时,以x为起点游走到每个节点的稳定概率分布;

步骤1.3.2,求S向量中m个元素的平均值为预测资源游走到某标签的平均条件概率;

步骤1.3.3,计算预测资源x具有某标签的平均概率;

步骤1.3.4,根据条件概率模型,计算预测资源x被标记为某标签的概率;

步骤1.3.5,获得预测资源的预测标签概率向量,该概率向量刻画了预测资源标记为不同标签的可能性大小。

5.根据权利要求4所述的一种基于随机游走和条件随机场的社会标签推荐方法,其特征在于,所述步骤2中,构造基于标签共现率、用户相似度和标签预测概率的条件随机场的特征函数,具体步骤为:步骤2.1,构造边特征函数:条件随机场的边特征函数又称状态转移函数,条件随机场在利用标签共现率、用户相似度刻画边特征函数;

步骤2.2,构造节点特征函数:依据步骤1.3.5预测标签概率向量中各标签的概率值设计条件随机场的点特征函数;

步骤2.3,在预测资源x的情况下,计算x可能被标记的标签y。

6.根据权利要求1所述的一种基于随机游走和条件随机场的社会标签推荐方法,其特征在于,所述步骤3中估计资源的条件随机场的参数采用极大似然估计,估计资源的条件随

1 2 3

机场的参数θ=(θ,θ,θ),采用极大似然估计,将参数θ的似然函数写成其中m为训练样本中资源的数量,为边特征函数,ψ(λi,x)为点特征函数,Z(x)为规范化因子,对似然函数进行求导,使得导数为零。

7.根据权利要求5所述的一种基于随机游走和条件随机场的社会标签推荐方法,其特征在于,所述步骤4的具体步骤为:步骤4.1,在获得参数估计的基础上,求条件概率最大的输出序列,输出概率向量具体步骤为:步骤4.1.1,初始化标签的概率;

步骤4.1.2,递推,从前向后推出每一步路径概率最大值,同时记录概率最大值的路径;

步骤4.1.3,从后往前返回每步的最优值,并求得标签排序向量;

步骤4.2,选择前k个标签作为资源的预测标签。