利索能及
我要发布
收藏
专利号: 2017102675448
申请人: 东软集团股份有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-03-03
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种数据处理方法,其特征在于,所述方法包括:

当利用第一查询模式进行查询时,获取所述第一查询模式在预设时间段内的解析频率,所述解析频率为所述第一查询模式在所述预设时间段内执行解析操作的频繁程度,所述解析操作包括动态解析或预处理抽取;

当所述解析频率大于或等于预设的解析频率阈值时,确定所述第一查询模式是否对原始数据已执行过预处理抽取;

当已执行过预处理抽取时,提取所述第一查询模式已抽取过的目标数据;

当未执行过预处理抽取时,根据所述第一查询模式对所述原始数据进行预处理抽取以提取所述目标数据;

当所述解析频率小于所述解析频率阈值时,根据所述第一查询模式对所述原始数据进行动态解析以提取所述目标数据;

在利用所述第一查询模式进行查询之前,所述方法还包括:记录所述第一查询模式在所述预设时间段内每次执行所述解析操作的历史时间点,得到包括至少一个所述历史时间点的历史时间点序列;

获取当前时间点与所述历史时间点序列中的每个所述历史时间点的差值;

根据所述当前时间点与所述历史时间点序列中的每个所述历史时间点的差值确定每个所述历史时间点对应的权重;

根据每个所述历史时间点对应的权重,计算所述解析频率。

2.根据权利要求1所述的方法,其特征在于,所述根据所述当前时间点与所述历史时间点序列中的每个所述历史时间点的差值确定每个所述历史时间点对应的权重,包括:将所述当前时间点与每个所述历史时间点的差值的倒数确定为每个所述历史时间点对应的权重;

所述根据每个所述历史时间点对应的权重,计算所述解析频率,包括:根据每个所述历史时间点对应的权重,利用解析频率计算公式计算所述解析频率;其中,所述解析频率计算公式包括:其中,f(s,tk)表示所述解析频率,tk表示所述当前时间点,ti表示所述时间序列中的历史时间点,k-1表示所述历史时间点序列中的所述历史时间点的数量,i≤k-1,i和k均为正整数。

3.根据权利要求1或2所述的方法,其特征在于,所述当已执行过预处理抽取时,提取所述第一查询模式已抽取过的目标数据,包括:当已执行过预处理抽取时,获取所述第一查询模式对应的数据索引;

利用所述数据索引在已存储的数据中查找所述目标数据;

在查找到所述目标数据后,提取所述目标数据。

4.根据权利要求1或2所述的方法,其特征在于,所述当未执行过预处理抽取时,根据所述第一查询模式对所述原始数据进行预处理抽取以提取所述目标数据,包括:当未执行过预处理抽取时,根据所述第一查询模式所定义的属性对所述原始数据执行预处理抽取,得到所述目标数据;

将所述目标数据进行存储,并为所述目标数据创建数据索引。

5.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:在所述根据所述第一查询模式对所述原始数据进行预处理抽取以获取所述目标数据,或者所述根据所述第一查询模式对所述原始数据进行动态解析以抽取所述目标数据之后,更新所述解析频率。

6.一种数据处理装置,其特征在于,所述装置包括:

频率获取模块,用于当利用第一查询模式进行查询时,获取所述第一查询模式在预设时间段内的解析频率,所述解析频率为所述第一查询模式在所述预设时间段内执行解析操作的频繁程度,所述解析操作包括动态解析或预处理抽取;

确定模块,用于当所述解析频率大于或等于预设的解析频率阈值时,确定所述第一查询模式是否对原始数据已执行过预处理抽取;

提取模块,用于当已执行过预处理抽取时,提取所述第一查询模式已抽取过的目标数据;当未执行过预处理抽取时,根据所述第一查询模式对所述原始数据进行预处理抽取以提取所述目标数据;

动态解析模块,用于当所述解析频率小于所述解析频率阈值时,根据所述第一查询模式对所述原始数据进行动态解析以提取所述目标数据;

所述装置还包括:

记录模块,用于在利用所述第一查询模式进行查询之前,记录所述第一查询模式在所述预设时间段内每次执行所述解析操作的历史时间点,得到包括至少一个所述历史时间点的历史时间点序列;

差值获取模块,用于获取当前时间点与所述历史时间点序列中的每个所述历史时间点的差值;

权重确定模块,用于根据所述当前时间点与所述历史时间点序列中的每个所述历史时间点的差值确定每个所述历史时间点对应的权重;

计算模块,用于根据每个所述历史时间点对应的权重,计算所述解析频率。

7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-5中任一项所述方法的步骤。

8.一种电子设备,其特征在于,包括:

权利要求7中所述的计算机可读存储介质;以及

一个或多个处理器,用于执行所述计算机可读存储介质中的计算机程序。