利索能及
我要发布
收藏
专利号: 2023115887820
申请人: 上海复通软件技术有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-07
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种汽配知识库数据存储与查询方法,其特征在于,包括:读取用户输入的知识资料数据;

对所述知识资料数据进行语义解析并分段形成知识段落数据,将所述知识段落数据进行提取摘要数据与关键词数据;

将所述摘要数据与所述关键词数据加入至所述知识段落数据内并向量化存储至汽配向量数据库内;

读取用户输入的知识需求数据;

将所述知识需求数据进行提取知识主题数据;

通过知识主题数据确定知识主题向量数据,通过所述知识主题向量数据在所述汽配向量数据库内检索确定向量距离最近的最近解向量数据;

将所述最近解向量数据对应的所述知识段落数据输出给用户;

通过所述知识主题向量数据在所述汽配向量数据库内检索确定向量距离最近的最近解向量数据,还包括:预设区域数量数据;

将所述汽配向量数据库中的向量点均分成若干质心区域,所述质心区域的数量与所述区域数量数据对应,所述质心区域内的向量点均为相邻设置,位于所述质心区域内的所有向量点的中心设为质心向量数据;

先通过所述知识主题向量数据与所述质心向量数据确定向量距离最小的质心向量数据;

再通过所述知识主题向量数据与向量距离最小的所述质心向量数据所对应的所述质心区域内的向量点确定向量距离最小的向量点作为所述最近解向量数据;

再通过所述知识主题向量数据与向量距离最小的所述质心向量数据所对应的所述质心区域内的向量点确定向量距离最小的向量点后作为所述最近解向量数据时,还包括:通过此向量距离最小的向量点与所述知识主题向量数据确定反馈距离数据;

通过所述知识主题向量数据与所述反馈距离数据确定反馈范围数据;

检索所述反馈范围数据的范围内存在的向量点数量;

若所述反馈范围数据的范围内仅存在一个向量点,则将此向量点作为所述最近解向量数据;若所述反馈范围数据的范围内存在至少两个向量点,则计算所述反馈范围数据的范围内所有向量点与所述知识主题向量数据之间的向量距离,并将此时计算出的向量距离最小的向量点作为最近解向量数据。

2.根据权利要求1所述的一种汽配知识库数据存储与查询方法,其特征在于,将所述最近解向量数据对应的所述知识段落数据输出给用户之前,还包括:预设筛选数量数据,基于AIGC对所述知识需求数据生成预测回答数据,通过所述预测回答数据向量化确定预测回答向量数据;

计算所述最近解向量数据与相应所述预测回答向量数据之间的向量距离;

通过向量距离从小到大与所述筛选数量数据确定所述最近解向量数据的数量,将剩余的所述最近解向量数据对应的所述知识段落数据输出给用户。

3.根据权利要求1所述的一种汽配知识库数据存储与查询方法,其特征在于,先通过所述知识主题向量数据与所述质心向量数据确定向量距离最小的质心区域时,还包括:预设质心检索阈值数据、质心数量阈值数据、范围缩小阈值数据;

通过所述质心检索阈值数据与所述知识主题向量数据确定质心检索范围数据;

将所述质心检索范围数据的范围内的所述质心向量数据的数量与所述质心数量阈值数据进行对比;

若所述质心检索范围数据的范围内的所述质心向量数据的数量小于所述质心数量阈值数据,则通过所述质心检索范围数据的范围内的所述质心向量数据与所述知识主题向量数据确定向量距离最小的质心向量数据;

若所述质心检索范围数据的范围内的所述质心向量数据的数量大于所述质心数量阈值数据,则通过所述范围缩小阈值数据与所述质心检索阈值数据确定新的质心检索阈值数据,并返回将所述质心检索范围数据的范围内的所述质心向量数据的数量与所述质心数量阈值数据进行对比的步骤。

4.根据权利要求1所述的一种汽配知识库数据存储与查询方法,其特征在于,先通过所述知识主题向量数据与所述质心向量数据确定向量距离最小的质心区域后,还包括:通过此向量距离确定偏差范围数据,通过所述知识主题向量数据与所述偏差范围数据确定检索范围数据;

通过所述检索范围数据的范围内的向量点与所述知识主题向量数据确定向量距离最小的向量点最为所述最近解向量数据。

5.一种汽配知识库数据存储与查询系统,用于实现权利要求1所述的一种汽配知识库数据存储与查询方法,其特征在于,包括:数据库(1),用于对数据进行存储;

处理器(2),用于对数据进行处理;

操作平台(3),用于供用户输入数据至所述处理器(2),所述处理器(2)处理后存入至所述数据库(1)中,或所述处理器(2)处理后调用所述数据库(1)中的数据输出给用户。

6.一种计算机可读存储介质,其特征在于:存储有能够被处理器加载并执行如权利要求1至4任一种汽配知识库数据存储与查询方法的计算机程序。