利索能及
我要发布
收藏
专利号: 2019108843624
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于语义识别的关键词确定方法,其特征在于,包括以下步骤:获取用户输入的检索语句,对所述检索语句进行分词,并提取分词后各个词语的特征向量;

将所述特征向量输入至训练完成的多类感知器中,得到对应的字标注结果,并根据所述字标注结果得到对应的检索词;

将所述检索词输入至预设指标库中进行查询,得到对应的候选指标项;

根据所述候选指标项确定所述检索词在预设指标库中的逆向文件频率;

将所述逆向文件频率、所述检索词和所述候选指标项输入至预设相似度算法中,确定所述候选指标项与对应的所述检索词的相似度数值,并根据所述相似度数值确定关键词。

2.如权利要求1所述的基于语义识别的关键词确定方法,其特征在于,所述多类感知器包括多个训练语句,所述提取分词后各个词语的特征向量的步骤之后,还包括:将所述训练语句输入至预设特征模块中,以提取出所述训练语句的训练特征向量;

将所述训练语句的训练特征向量作为所述多类感知器的训练样本,以得到训练完成的多类感知器。

3.如权利要求1所述的基于语义识别的关键词确定方法,其特征在于,所述将所述特征向量输入至训练完成的多类感知器中,得到对应的字标注结果的步骤包括:将所述特征向量输入至训练完成的多类感知器中,得到每个特征向量对应的标注位置;

在每个特征向量对应的标注位置上,使用预设构词位置信息对各个特征向量进行标注,得到对应的字标注结果。

4.如权利要求3所述的基于语义识别的关键词确定方法,其特征在于,所述根据所述字标注结果得到对应的检索词的步骤包括:根据所述构词位置信息对所述检索语句进行分词,得到对应的检索词集合;

将所述检索词集合输入至预设词性标注算法中,确定检索词集合中各个词语的词性,并将词性为预设检索词性的词语确定为检索词。

5.如权利要求1所述的基于语义识别的关键词确定方法,其特征在于,所述指标库中存储有多个指标项和对应的核心词,所述将所述检索词输入至预设指标库中进行查询,得到对应的候选指标项的步骤包括:将所述检索词输入至预设指标库中,确定所述指标库中与所述检索词对应的核心词;

将所述指标库中与所述核心词对应的指标项作为所述候选指标项。

6.如权利要求1所述的基于语义识别的关键词确定方法,其特征在于,所述根据所述候选指标项确定所述检索词在预设指标库中的逆向文件频率的步骤包括:确定所述候选指标项的数目以及预设指标库中所有指标项的数目;

将所述候选指标项的数目除以所有指标项的数目,并将得到的商取对数,以得到与检索词对应的逆向文件频率。

7.如权利要求1所述的基于语义识别的关键词确定方法,其特征在于,所述将所述逆向文件频率、所述检索词和所述候选指标项输入至预设相似度算法中,得到对应的相似度数值的步骤包括:确定候选指标项中所包含的检索词的数目,并将所述数目作为检索词个数;

根据所述检索词个数以及所述逆向文件频率计算得到候选指标项的相似度数值。

8.如权利要求7所述的基于语义识别的关键词确定方法,其特征在于,所述根据所述相似度数值确定关键词的步骤包括:确定各个候选指标项的相似度数值,并将相似度数值最高的候选指标项确定为关键词。

9.一种装置,其特征在于,所述装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于语义识别的关键词确定程序,所述基于语义识别的关键词确定程序配置为实现如权利要求1至8中任一项所述的基于语义识别的关键词确定方法的步骤。

10.一种存储介质,其特征在于,所述存储介质上存储有基于语义识别的关键词确定程序,所述基于语义识别的关键词确定程序被处理器执行时实现如权利要求1至8任一项所述的基于语义识别的关键词确定方法的步骤。