利索能及
我要发布
收藏
专利号: 2025102728577
申请人: 北京前往科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-27
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种用于档案数据的优化存储方法,其特征在于,所述方法包括:获取档案存储系统的各系统节点中各个档案页面的访问曲线,所述访问曲线用于表征所述系统节点中用户对所述档案页面的访问量的时序曲线;

根据各所述系统节点中各所述访问曲线,确定各所述系统节点的访问特征时段,所述访问特征时段用于表征符合所述系统节点中用户对档案的访问习惯的时间段;

根据各所述系统节点的访问特征时段,对所述系统节点进行分组,得到多个系统节点组;

针对各所述系统节点组,根据所述系统节点组中各所述系统节点的节点存储性能,确定各所述系统节点的备份可靠度;

根据各所述系统节点的备份可靠度以及所述系统节点所属的所述系统节点组中的系统节点数量,创建各所述系统节点的备份存储空间;

通过各所述系统节点的备份存储空间,对各所述档案页面进行备份存储;

所述针对各所述系统节点组,根据所述系统节点组中各所述系统节点的节点存储性能,确定各所述系统节点的备份可靠度,包括:针对各所述系统节点组,分别执行以下步骤:

利用目标系统节点组中各所述系统节点之间的同组可能性,确定所述目标系统节点组的信息复杂度,所述目标系统节点组为任意一个所述系统节点组;

利用所述目标系统节点组的信息复杂度以及所述目标系统节点组中各所述系统节点的节点存储性能,确定所述目标系统节点组中各所述系统节点的所述备份可靠度;

信息复杂度的计算公式包括: ;其中, 用于表征第a个系统节点组的信息复杂度, 用于表征第a个系统节点组中各系统节点之间的同组可能性的最大值, 用于表征第a个系统节点组中各系统节点之间的同组可能性的均值, 用于表征第a个系统节点组中包含的系统节点数量,用于表征档案存储系统中系统节点的总数量;

备份可靠度的计算公式包括: ;其中, 用于表征第a个系统节点组中第c个系统节点的备份可靠度, 用于表征第a个系统节点组中各个系统节点的存储设备的最大吞吐量的均值, 用于表征第a个系统节点组中第c个系统节点的存储设备的最大吞吐量, 用于表征第a个系统节点组中存储设备的总数量。

2.根据权利要求1所述的用于档案数据的优化存储方法,其特征在于,所述根据各所述系统节点中各所述访问曲线,确定各所述系统节点的访问特征时段,包括:针对各所述系统节点中各所述访问曲线,分别执行以下步骤:

将目标访问曲线从极值点进行划分,得到多个第一曲线段,所述目标访问曲线为任意一个所述访问曲线;

根据所述目标访问曲线在各所述第一曲线段的访问量,确定各所述第一曲线段对应的候选时间段的重要度;

将所述重要度大于预设重要度阈值的各所述候选时间段,确定为所述访问特征时段。

3.根据权利要求2所述的用于档案数据的优化存储方法,其特征在于,所述根据所述目标访问曲线在各所述第一曲线段的访问量,确定各所述第一曲线段对应的候选时间段的重要度,包括:针对各所述第一曲线段,分别执行以下步骤:

在所述目标访问曲线中,获取所述第一曲线段的访问量最小值以及所述第一曲线段对应的候选时间段的候选时长;

根据各参考访问曲线,确定与所述第一曲线段对应的参考访问量均值以及参考时长均值,所述参考访问曲线为所述系统节点中除所述目标访问曲线之外的各所述访问曲线,所述参考访问量均值用于表征各所述参考访问曲线中与所述第一曲线段对应的第二曲线段的访问量均值,所述参考时长均值用于表征各所述第二曲线段的时长均值;

利用所述访问量最小值、候选时长、所述参考访问量均值以及所述参考时长均值,确定所述第一曲线段对应的候选时间段的重要度。

4.根据权利要求1所述的用于档案数据的优化存储方法,其特征在于,所述根据各所述系统节点的访问特征时段,对所述系统节点进行分组,得到多个系统节点组,包括:根据第一系统节点的访问特征时段的重要度以及第二系统节点的访问特征时段的重要度,确定所述第一系统节点与所述第二系统节点的第一相似性,所述第一系统节点与所述第二系统节点为不相同的任意两个所述系统节点;

根据所述第一相似性,确定所述第一系统节点与所述第二系统节点的同组可能性;

在所述同组可能性大于预设可能性阈值的情况下,确定所述第一系统节点与所述第二系统节点属于同一个所述系统节点组。

5.根据权利要求4所述的用于档案数据的优化存储方法,其特征在于,所述访问特征时段的数量为多个;

所述根据第一系统节点的访问特征时段的重要度以及第二系统节点的访问特征时段的重要度,确定所述第一系统节点与所述第二系统节点的第一相似性,包括:获取所述第一系统节点的各所述访问特征时段的重要度中的重要度最小值;

将所述第一系统节点的第z个访问特征时段的重要度与所述第二系统节点的第z个访问特征时段的重要度作差后取绝对值,得到所述第一系统节点与所述第二系统节点的重要度差值绝对值,所述z为正整数;

利用所述重要度差值绝对值以及所述重要度最小值,确定所述第一系统节点与所述第二系统节点在所述第z个访问特征时段的所述第一相似性。

6.根据权利要求4所述的用于档案数据的优化存储方法,其特征在于,所述访问特征时段的数量为多个;

所述根据第一系统节点的访问特征时段的重要度以及第二系统节点的访问特征时段的重要度,确定所述第一系统节点与所述第二系统节点的第一相似性之后,所述方法还包括:根据所述第一系统节点与所述第二系统节点在各所述访问特征时段的所述第一相似性,确定所述第一系统节点与所述第二系统节点的第二相似性;

所述根据所述第一相似性,确定所述第一系统节点与所述第二系统节点的同组可能性,包括:根据所述第二相似性,确定所述第一系统节点与所述第二系统节点的同组可能性。

7.根据权利要求6所述的用于档案数据的优化存储方法,其特征在于,所述根据所述第二相似性,确定所述第一系统节点与所述第二系统节点的同组可能性,包括:获取所述第一系统节点与所述第二系统节点之间的响应时长,以及获取所述第一系统节点与除所述第二系统节点之外的第三系统节点的目标相似性,所述目标相似性用于表征所述第一系统节点与各所述第三系统节点的第二相似性中的最大值;

利用所述第一系统节点与所述第二系统节点的所述第二相似性、所述响应时长以及所述目标相似性,确定所述第一系统节点与所述第二系统节点的所述同组可能性。

8.根据权利要求1所述的用于档案数据的优化存储方法,其特征在于,所述根据各所述系统节点的备份可靠度以及所述系统节点所属的所述系统节点组中的系统节点数量,创建各所述系统节点的备份存储空间,包括:针对各所述系统节点,分别执行以下步骤:

利用所述系统节点的备份可靠度以及所述系统节点所属的所述系统节点组中的系统节点数量,确定所述系统节点的备份评价参数;

将所述备份评价参数向上取整数,得到所述系统节点的备份存储设备数;

根据所述系统节点的备份存储设备数,创建所述系统节点的备份存储空间。

9.一种用于档案数据的优化存储系统,其特征在于,所述系统包括:曲线图获取模块,用于获取档案存储系统的各系统节点中各个档案页面的访问曲线,所述访问曲线用于表征所述系统节点中用户对所述档案页面的访问量的时序曲线;

时段确定模块,用于根据各所述系统节点中各所述访问曲线,确定各所述系统节点的访问特征时段,所述访问特征时段用于表征符合所述系统节点中用户对档案的访问习惯的时间段;

节点分组模块,用于根据各所述系统节点的访问特征时段,对所述系统节点进行分组,得到多个系统节点组;

可靠度确定模块,用于针对各所述系统节点组,根据所述系统节点组中各所述系统节点的节点存储性能,确定各所述系统节点的备份可靠度;所述针对各所述系统节点组,根据所述系统节点组中各所述系统节点的节点存储性能,确定各所述系统节点的备份可靠度,包括:针对各所述系统节点组,分别执行以下步骤:

利用目标系统节点组中各所述系统节点之间的同组可能性,确定所述目标系统节点组的信息复杂度,所述目标系统节点组为任意一个所述系统节点组;

信息复杂度的计算公式包括: ;其中, 用于表征第a个系统节点组的信息复杂度, 用于表征第a个系统节点组中各系统节点之间的同组可能性的最大值, 用于表征第a个系统节点组中各系统节点之间的同组可能性的均值, 用于表征第a个系统节点组中包含的系统节点数量,用于表征档案存储系统中系统节点的总数量;

利用所述目标系统节点组的信息复杂度以及所述目标系统节点组中各所述系统节点的节点存储性能,确定所述目标系统节点组中各所述系统节点的所述备份可靠度;

备份可靠度的计算公式包括: ;其中, 用于表征第a个系统节点组中第c个系统节点的备份可靠度, 用于表征第a个系统节点组中各个系统节点的存储设备的最大吞吐量的均值, 用于表征第a个系统节点组中第c个系统节点的存储设备的最大吞吐量, 用于表征第a个系统节点组中存储设备的总数量;

空间创建模块,用于根据各所述系统节点的备份可靠度以及所述系统节点所属的所述系统节点组中的系统节点数量,创建各所述系统节点的备份存储空间;

档案存储模块,用于通过各所述系统节点的备份存储空间,对各所述档案页面进行备份存储。