利索能及
我要发布
收藏
专利号: 2024101108163
申请人: 湖南农业大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种数据处理方法,其特征在于,包括:获取历史数据信息;

提取历史数据信息中的历史关键词,并根据历史关键词构建圆形知识图谱;

获取当前数据信息;

提取当前数据信息中的关键词信息;

基于圆形知识图谱,根据当前数据信息中的关键词信息,确定当前数据的类型,并根据对应类型对当前数据进行分类及存储;

其中,所述构建圆形知识图谱的步骤,还包括:基于数据类型规则,将历史关键词进行分类,得到对应历史关键词的类型;

将同一类型的历史关键词发送至预设扇形知识图谱以进行存储;

将所有扇形知识图谱进行合并,得到一个圆形知识图谱;

其中,所述确定当前数据的类型的步骤,具体包括:根据当前数据信息中的关键词信息,点亮圆形知识图谱中对应关键词,得到点亮关键词;

提取点亮关键词的数量值以及对应点亮关键词的位置距离值;

预设第一数量影响权重系数和位置距离影响权重系数,将点亮关键词的数量值乘以对应第一数量影响权重系数,得到第一数值;

将点亮关键词的位置距离值乘以对应位置距离影响权重系数,得到第二数值;

将第一数值和第二数值进行累加,得到点亮关键词类型指数;

将预设扇形知识图谱中所有点亮关键词类型指数进行累加,得到对应扇形知识图谱的类型指数;

判断所述扇形知识图谱的类型指数是否大于预设类型指数阈值,若是,将对应扇形知识图谱对应的类型设为当前数据的类型;

其中,所述得到点亮关键词的步骤,具体包括:获取关键词在当前数据中的位置信息以及数量值;

将关键词在当前数据中的位置进行数值化,得到对应关键词的位置数值;

预设第二数量影响权重系数和位置数值影响权重系数,将关键词的数量值乘以预设第二数量影响权重系数,得到第三数值;

将关键词的位置数值乘以对应位置数值影响权重系数,得到第四数值;

将第三数值和第四数值进行累加,得到对应关键词的初始亮度值;

获取关键词和其他关键词的第一关联度;

基于预设关联度阈值,提取大于预设关联度阈值的第一关联度,设为第二关联度;

提取第二关联度对应的其他关键词的初始亮度值;

预设其他关键词的影响权重系数,将第二关联度乘以对应的其他关键词的初始亮度值乘以对应的其他关键词的影响权重系数,得到其他关键词对本关键词的亮度影响值;

将所有其他关键词对本关键词的亮度影响值进行累加,得到关键词的亮度调整值;

将关键词的亮度调整值和初始亮度值进行累加,得到对应关键词的最终亮度值;

当关键词的最终亮度值大于预设亮度阈值时,将对应关键词进行点亮,得到点亮关键词;

其中,所述点亮关键词的位置距离值计算的步骤,具体包括:获取点亮关键词的最终亮度值;

根据点亮关键词的最终亮度值落入的预设亮度值范围,确定对应点亮关键词的点亮等级;

根据对应点亮关键词的点亮等级对该点亮关键词的亮度进行点亮;

基于预设点亮等级影响权重系数,将预设点亮等级影响权重系数除以应点亮关键词的点亮等级,得到对应点亮关键词的位置距离值;

所述点亮关键词的位置距离值为点亮关键词到圆形知识图谱的圆心的距离值。

2.根据权利要求1所述的数据处理方法,其特征在于,所述获取关键词和其他关键词的第一关联度的步骤,具体包括:将历史数据划分为多个独立数据,若独立数据中包含关键词a的数量为na,独立数据中包含关键词b的数量为nb,独立数据中包含关键词a和关键词b的数量为nab,则对应关键词a和关键词b的第一关联度 其中当nab=0时,对应关键词a和关键词b的第一关联度为0。

3.一种数据处理系统,其特征在于,包括存储器和处理器,所述存储器中存储有数据处理方法程序,所述数据处理方法程序被所述处理器执行时实现如权利要求1或2所述的数据处理方法。

4.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有一种数据处理方法程序,所述数据处理方法程序被处理器执行时,实现如权利要求1或2所述的数据处理方法。