利索能及
我要发布
收藏
专利号: 202310103329X
申请人: 合肥工业大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于特征相似度和用户需求度的绿色知识推荐方法,其特征在于,包括如下步骤:步骤一、获取用户u的当前搜索文本e以及历史搜索文本集合其中,en1,u表示用户u的第n1条历史搜索文本,1≤n1≤N1;N1表示用户u的历史搜索文本的数量;

步骤二、构建大标题和小标题词典,在语义分解的基础上对当前搜索文本e和历史搜索文本集合Eu进行语义分解;

步骤2.1、构建绿色知识库的大标题词典 其中, 表示所述绿色知识库的第n2条大标题;N2表示大标题词典X的数量;

构建绿色知识库的小标题词典 其中,yn3表示所述绿色知识库的第n3条小标题,N3表示小标题词典Y的数量;

构建用户集的日常用语词典 其中,cn4表示日常用语词典中的第n条词语,N表示日常用语词典C的数量;

步骤2.2、根据词典X、Y、C,对e和en1,u分别进行分解,得到分解后的当前搜索文本e的文本集合向量 和第n1条历史搜索文本en1,u的文本集合向量表示当前搜索文本e中的第ie个单词, 表示第n1条历史搜索文本en1,u中的第i个单词,Ie表示当前搜索文本e的单词数, 表示第n1条历史搜索文本en1,u的单词数;

令 表示 所属于的词典标签;若 属于大标题词典X,则令 若 属于小标题词典Y,则令 若 属于日常用语词典C,则令 否则,令令 表示 所属于的词典标签;若 属于大标题词典X,则令 若 属于小标题词典Y,则令 若 属于日常用语词典C,则令 否则,令步骤2.3、利用式(1)得到第i个单词 的权重式(1)中,δ1表示第一权重值,δ2表示第二权重值,且0<δ2<δ1<1;

步骤2.4,按照步骤2.3的过程得到第ie个单词 的权重步骤2.5、利用式(2)计算第ie个单词 与第i个单词 的相似度步骤2.6、按照步骤2.5的过程得到第n1条文本集合向量 与文本集合we中所有单词的相似度,并从中选择相似度最高的t个单词作为文本集合we的第n1条候选词集;从而得到文本集合we与历史搜索文本集合中其他分解后的文本集合向量所选出的候选词集;并由所有候选词集构成文本集合we的有效文本集合 其中, 表示第ie个单词 的第p个候选词,P表示候选词总数;

步骤三、根据权重从we和 中挑选出分别属于词典X,Y的单词;

步骤3.1、对we中属于词典X的单词进行挑选:当 时,则将 在词典X所对应的单词,记为 从而得到we中所有属于词典X的单词所构成的第一单词集合;

步骤3.2、对 中属于词典X的单词进进行挑选:当 时,则将 在词典X所对应的单词,记为 从而得到 中所有属于词典X的单词所构成的第二单词集合;其中, 表示 的权重;

步骤3.3、将第一单词集合和第二单词集合合并为大主题词集合其中, 表示第n5个大主题词,1≤n5≤N5;N5表示大主题词的数量;

步骤3.4、对we中属于Y的单词进行挑选, 时,则将we中属于词典Y的单词,为步骤3.5、对 中属于Y的文本进行挑选,当 时,则将wvalid中属于词典Y的单词,为步骤3.6、对we和wvalid经过计算后,整合所得到的单词用于构建小主题词集合其中, 表示V中第n6个小主题词,1≤n6≤N6;N6表示小主题词的数量;

步骤四、根据用户满意度找到对应知识:

步骤4.1、获取待识别的知识a,并在X词典和主题词集合V下进行的语义分解后,计算知识a中的单词频率,记为 其中, 表示第n2条大标题在知识a中的频率, 表示第n6个小主题词 在知识a中的频率,步骤4.2、对主题词集合V的每个词进行赋值,从而利用式(3)构建主题词集合V中词的权重函数步骤4.3、利用式(4)构建用户需求度函数式(4)中,k表示用户的满意程度,k∈(0,100%)步骤4.4、获取用户对大标题词典X中所需求的某条大标题xuser,并计算用户所需求的大标题xuser与知识a的接近程度 其中, 表示大标题xuser在知识a中的频率;

步骤4.5、获取用户对小主题词集合V中每个小主题词的需求,并计算用户对所有小主题词的接近程度步骤4.6、计算用户需求与知识a的接近程度 从而得到用户需求与所有知识的接近程度,并从中选取接近程度较小的若干个知识推送给用户。

2.一种电子设备,包括存储器以及处理器,其特征在于,所述存储器用于存储支持处理器执行权利要求1所述绿色知识推荐方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。

3.一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行权利要求1所述绿色知识推荐方法的步骤。