1.一种基于时序知识图谱的人机对话兴趣感知方法,其特征在于,包括:获取用户输入内容和机器人对话库数据;根据用户输入内容和对话库数据得到至少两个候选回复;将用户输入内容和候选回复输入到基于时序知识图谱的人机对话兴趣感知模型中,得到用户对所有候选回复感兴趣的概率,选择概率最高的候选回复作为机器人的回复内容;
采用基于时序知识图谱的人机对话兴趣感知模型对用户输入内容和候选回复进行处理的过程包括:S1:采用时序知识图谱中的实体链接对用户输入内容进行实体提取与消歧,得到用户的兴趣种子实体集;
S2:将兴趣种子实体集中的兴趣种子实体沿时序知识图谱的关系路径进行偏好传播,得到时序知识图谱的实体;兴趣种子实体进行偏好传播的过程包括:S21:设置采样大小T,并将第一层兴趣种子实体作为时序知识图谱的第一层实体;
S22:获取当前层兴趣种子实体的邻居实体集,若邻居实体集中的邻居实体数量小于邻居实体数量阈值,则在邻居实体集中重复选取T个邻居实体作为采样域,若邻居实体集中的邻居实体数量大于邻居实体数量阈值,则分别计算邻居实体集中所有邻居实体与兴趣种子实体的紧密度;
S23:将邻居实体集中所有邻居实体与兴趣种子实体的紧密度按从大到小的顺序排序,选择前T个紧密度对应的邻居实体作为兴趣种子实体的采样域;
S24:对所有的采样域取并集,得到此时序知识图谱的下一层实体,将下一层实体作为新的兴趣种子实体,返回步骤S22,直到得到完整的时序知识图谱实体;
S3:对时序知识图谱的实体进行数值化处理,得到实体的采样域向量表示;对时序知识图谱的实体进行数值化处理包括:根据候选回复计算用户的关系友好度;根据遗忘曲线理论计算用户的时间新鲜度;根据关系友好度和时间新鲜度构建权值函数;根据权值函数对时序知识图谱的实体进行数值化;
S4:根据实体的采样域向量表示对实体向量表示进行更新,得到更新后的实体向量表示;实体的采样域向量表示为:其中,ei表示采样域中的第i个邻居实体的向量表示,S(e)表示实体的采样域实体集,g(ei)表示权值函数;
对实体向量表示进行更新的公式为:
agg
e =σ(W·(e+VS(e))+b)
agg
其中,e 表示更新后的实体向量表示,σ表示非线性函数,W表示转换权值,e表示更新前的实体向量表示,VS(e)表示实体的采样域向量表示,b表示偏置量;
S5:对更新后的实体向量表示进行聚合,得到用户的兴趣偏好表示;用户的兴趣偏好表示为:其中, 表示更新后的最内层第i个兴趣种子实体向量表示,S表示最内层的兴趣种子实体总数;
S6:根据用户的兴趣偏好表示和候选回复向量表示,采用预测函数得到用户对所有候选回复感兴趣的概率。
2.根据权利要求1所述的一种基于时序知识图谱的人机对话兴趣感知方法,其特征在于,计算关系友好度的公式为:其中,v表示候选回复向量表示, 表示四元组中实体间关系的向量表示。
3.根据权利要求1所述的一种基于时序知识图谱的人机对话兴趣感知方法,其特征在于,计算时间新鲜度的公式为:其中,w表示权重阈值,t表示当前时间,ts表示四元组中关系建立的时间。
4.根据权利要求1所述的一种基于时序知识图谱的人机对话兴趣感知方法,其特征在于,权值函数为:其中,α表示权重系数, 表示关系友好度的归一化表示, 表示时间新鲜度的归一化表示。
5.根据权利要求1所述的一种基于时序知识图谱的人机对话兴趣感知方法,其特征在于,预测函数为:T
yuv=f(uv)
其中,yuv表示兴趣度得分,u表示用户的兴趣偏好,v表示候选回复,f表示sigmoid函数。