利索能及
我要发布
收藏
专利号: 2025102519656
申请人: 龙图腾网科技(合肥)股份有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-08-30
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种专利文件检索方法,其特征在于,包括:

获取用户输入的专利检索信息;

根据所述专利检索信息以及专利文件数据库中各个专利文件对应的预设的专利文件导引信息的匹配关系,从所述专利文件数据库中检索出目标专利文件;

所述专利文件导引信息是通过以下步骤得到:

对专利文本进行分词处理,得到词组集合;

根据词组集合中各个词组之间的邻接关系,对所述词组集合进行划分,得到第一权重词组集合以及第二权重词组集合;

基于所述第一权重词组集合中各词组对应的第一信息,以及所述第二权重词组集合中各词组对应的第二信息,分别对所述第一权重词组集合和第二权重词组集合进行筛选,得到第一目标词组和第二目标词组;

根据第一目标词组和第二目标词组确定专利文件导引信息;

所述根据词组集合中各个词组之间的邻接关系,对所述词组集合进行划分,得到第一权重词组集合以及第二权重词组集合,包括:根据词组集合中各个词组的邻接关系,确定词组集合中各个词组对应的邻接权重;

根据所述词组集合中各个词组的邻接权重以及预设的第一权重阈值、第二权重阈值,将邻接权重高于所述第一权重阈值的词组划分为第一权重词组集合,将邻接权重低于所述第二权重阈值的词组划分为第二权重词组集合;

所述根据词组集合中各个词组的邻接关系,确定词组集合中各个词组对应的邻接权重,包括:根据词组集合中各个词组之间的邻接关系以及预设的共现窗口长度,构建词组图模型;

获取所述词组图模型中各个词组节点的初始权重;

根据所述词组图模型中各个词组节点的初始权重以及各个词组节点之间的连接关系,确定所述词组图模型中各个词组节点的连接权重;

根据词组图模型中各个词组节点的连接权重,确定词组集合中各个词组对应的邻接权重。

2.如权利要求1所述的专利文件检索方法,其特征在于,所述基于所述第一权重词组集合中各词组对应的第一信息,以及所述第二权重词组集合中各词组对应的第二信息,分别对所述第一权重词组集合和第二权重词组集合进行筛选,得到第一目标词组和第二目标词组之前,包括:根据所述第一权重词组集合中各个词组的邻接关系,确定所述第一权重词组集合中各个词组的邻接权重;

根据所述第一权重词组集合中各个词组的邻接权重以及预设的第一调整系数,确定所述第一权重词组集合中各个词组的第一信息;

获取所述第二权重词组集合中各个词组在对应专利文本中的位置信息;

根据所述第二权重词组集合中各个词组在专利文本中的位置信息以及预设的第二调整系数,确定所述第二权重词组集合中各个词组的第二信息。

3.如权利要求2所述的专利文件检索方法,其特征在于,在所述根据所述第一权重词组集合中各个词组的邻接权重以及预设的第一调整系数,确定所述第一权重词组集合中各个词组的第一信息之前,包括:基于专利文件附图中各个部件的位置与对应的附图中心点的距离查询预设的权重数据库,得到专利文件附图中各个部件对应的权重系数;

针对所述专利文件附图中的每一个部件,若所述部件在对应专利文件附图中存在多个对应的位置,则对所述位置对应的预设权重系数进行均值化处理;

根据所述专利文件附图中各个部件对应的权重系数,确定第一权重词组集合中各个词组的第一调整系数。

4.如权利要求2所述的专利文件检索方法,其特征在于,所述根据所述第二权重词组集合中各个词组在专利文本中的位置以及预设的第二调整系数,确定所述第二权重词组集合中各个词组的第二信息,包括:根据所述第二权重词组集合中各个词组的词频以及预设的第二调整系数,确定所述第二权重词组集合中各个词组的加权词频;

根据专利文本的段落总数量以及所述第二权重词组集合中各个词组分别在所述专利文本中对应的段落数量,确定所述第二权重词组集合中各个词组的逆向段落频率;

根据所述第二权重词组集合中各个词组的加权词频以及对应的逆向段落频率,确定所述第二权重词组集合中各个词组的第二信息。

5.如权利要求2所述的专利文件检索方法,其特征在于,在所述根据所述第二权重词组集合中各个词组在专利文本中的位置以及预设的第二调整系数,确定所述第二权重词组集合中各个词组的第二信息之前,包括:基于所述第二权重词组集合中各个词组的词性查询预设的系数数据库,得到所述第二权重词组中各个词组对应的第二调整系数;

针对所述第二权重词组集合中的每一词组,若所述词组具有多个对应的词性,则将各所述词性对应的预设候选系数中的最大的候选系数设定为所述词组的第二调整系数。

6.一种专利文件检索装置,其特征在于,包括:

输入信息获取模块,用于获取用户输入的专利检索信息;

专利文件检索模块,用于根据所述专利检索信息以及专利文件数据库中各个专利文件对应的预设的专利文件导引信息的匹配关系,从所述专利文件数据库中检索出目标专利文件;以及,专利文件导引信息生成模块,用于对专利文本进行分词处理,得到词组集合;根据词组集合中各个词组之间的邻接关系,对所述词组集合进行划分,得到第一权重词组集合以及第二权重词组集合;基于所述第一权重词组集合中各词组对应的第一信息,以及所述第二权重词组集合中各词组对应的第二信息,分别对所述第一权重词组集合和第二权重词组集合进行筛选,得到第一目标词组和第二目标词组;根据第一目标词组和第二目标词组确定专利文件导引信息;

所述根据词组集合中各个词组之间的邻接关系,对所述词组集合进行划分,得到第一权重词组集合以及第二权重词组集合,包括:根据词组集合中各个词组的邻接关系,确定词组集合中各个词组对应的邻接权重;

根据所述词组集合中各个词组的邻接权重以及预设的第一权重阈值、第二权重阈值,将邻接权重高于所述第一权重阈值的词组划分为第一权重词组集合,将邻接权重低于所述第二权重阈值的词组划分为第二权重词组集合;

所述根据词组集合中各个词组的邻接关系,确定词组集合中各个词组对应的邻接权重,包括:根据词组集合中各个词组之间的邻接关系以及预设的共现窗口长度,构建词组图模型;

获取所述词组图模型中各个词组节点的初始权重;

根据所述词组图模型中各个词组节点的初始权重以及各个词组节点之间的连接关系,确定所述词组图模型中各个词组节点的连接权重;

根据词组图模型中各个词组节点的连接权重,确定词组集合中各个词组对应的邻接权重。

7.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述方法的步骤。

8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述方法的步骤。