利索能及
我要发布
收藏
专利号: 2018112896422
申请人: 东软集团股份有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-03-03
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种数据同步的资源分配方法,其特征在于,所述方法包括:

针对于增量数据同步任务对应的n个数据表,在第i个迭代周期内以第一数据表资源配比执行每个所述数据表对应的数据同步任务;其中,所述第一数据表资源配比是在第i-1个迭代周期内获取到的数据表资源配比,所述第i个迭代周期包括m个执行周期,所述执行周期为对数据源中的增量数据进行轮询的时间间隔,m、n为大于1的整数,i为大于或等于1的整数,且i的起始值为1;

在所述第i个迭代周期中的第m个执行周期执行完成后,通过第一训练数据对资源配比模型进行训练,所述第一训练数据包括:历史执行周期内采集到的每个所述数据表对应的多组指标参数,所述历史执行周期包含所述第m个执行周期和所述第m个执行周期之前的所有执行周期;

在完成对所述资源配比模型的训练后,将在所述第i个迭代周期中的第m个执行周期采集到的所述n个数据表对应的n组指标参数作为所述资源配比模型的输入,以获取所述资源配比模型输出的目标数据表资源配比;

在第i+1个迭代周期内以所述目标数据表资源配比执行每个所述数据表对应的数据同步任务。

2.根据权利要求1所述的方法,其特征在于,在所述在第i+1个迭代周期内以所述目标数据表资源配比执行每个所述数据表对应的数据同步任务之前,所述方法还包括:通过预设的差异度算法确定在所述第i个迭代周期内获取到的所述目标数据表资源配比与在第i-1个迭代周期内获取到的所述第一数据表资源配比之间的差异度;

当所述目标数据表资源配比与所述第一数据表资源配比之间的差异度小于预设差异度时,将第i+1个迭代周期设定为包括w个执行周期,其中,w为根据所述差异度与所述预设差异度的差值确定的执行周期个数,且w>m;或者,当所述目标数据表资源配比与所述第一数据表资源配比之间的差异度大于预设差异度时,将所述第i+1个迭代周期设定为包括m个执行周期。

3.根据权利要求1所述的方法,其特征在于,在所述在第i+1个迭代周期内以所述目标数据表资源配比执行每个所述数据表对应的数据同步任务之后,所述方法还包括:令i=i+1,重复执行从所述针对于增量数据同步任务对应的n个数据表,在第i个迭代周期内以第一数据表资源配比执行每个所述数据表对应的数据同步任务至所述在第i+1个迭代周期内以所述目标数据表资源配比执行每个所述数据表对应的数据同步任务的步骤,直至所述增量数据同步任务结束。

4.根据权利要求1所述的方法,其特征在于,所述第一数据表资源配比是在第i-1个迭代周期内获取到的数据表资源配比,包括:当i=1时,所述第一数据表资源配比为在所述增量数据同步任务的任务初始化阶段预先设置的数据表资源配比;当i>1时,所述第一数据表资源配比为所述在第i-1个周期内获取到的数据表资源配比。

5.根据权利要求1所述的方法,其特征在于,所述在所述第i个迭代周期中的第m个执行周期执行完成后,通过第一训练数据对资源配比模型进行训练,包括:在所述第i个迭代周期中的第m个执行周期执行完成后,获取所述历史执行周期内的y个执行周期采集到的所述n个数据表对应的y*n组所述指标参数,作为所述第一训练数据,其中,当i=1时,y=m,当i>1时,y>m;

通过所述第一训练数据对所述资源配比模型进行训练。

6.根据权利要求1所述的方法,其特征在于,所述数据表包括发送端数据表和接收端数据表,所述指标参数用于指示每个所述数据表对应的数据同步任务在所述历史执行周期中的执行状态,所述指标参数包括:所述执行周期的周期时长,每个所述数据表对应的数据同步任务的执行时长、数据量和数据大小,以及数据从发送端数据库导入至所述发送端数据表的导入速率和数据从所述接收端数据表导出至接收端数据库的导出速率。

7.一种数据同步的资源分配装置,其特征在于,所述装置包括:

第一任务执行模块,用于针对于增量数据同步任务对应的n个数据表,在第i个迭代周期内以第一数据表资源配比执行每个所述数据表对应的数据同步任务;其中,所述第一数据表资源配比是在第i-1个迭代周期内获取到的数据表资源配比,所述第i个迭代周期包括m个执行周期,所述执行周期为对数据源中的增量数据进行轮询的时间间隔,m、n为大于1的整数,i为大于或等于1的整数,且i的起始值为1;

模型训练模块,用于在所述第i个迭代周期中的第m个执行周期执行完成后,通过第一训练数据对资源配比模型进行训练,所述第一训练数据包括:历史执行周期内采集到的每个所述数据表对应的多组指标参数,所述历史执行周期包含所述第m个执行周期和所述第m个执行周期之前的所有执行周期;

配比获取模块,用于在完成对所述资源配比模型的训练后,将在所述第i个迭代周期中的第m个执行周期采集到的所述n个数据表对应的n组指标参数作为所述资源配比模型的输入,以获取所述资源配比模型输出的目标数据表资源配比;

第二任务执行模块,用于在第i+1个迭代周期内以所述目标数据表资源配比执行每个所述数据表对应的数据同步任务。

8.根据权利要求7所述的装置,其特征在于,所述装置还包括:

差异度确定模块,用于通过预设的差异度算法确定在所述第i个迭代周期内获取到的所述目标数据表资源配比与在第i-1个迭代周期内获取到的所述第一数据表资源配比之间的差异度;

周期设定模块,用于当所述目标数据表资源配比与所述第一数据表资源配比之间的差异度小于预设差异度时,将第i+1个迭代周期设定为包括w个执行周期,其中,w为根据所述差异度与所述预设差异度的差值确定的执行周期个数,且w>m;或者,当所述目标数据表资源配比与所述第一数据表资源配比之间的差异度大于预设差异度时,将所述第i+1个迭代周期设定为包括m个执行周期。

9.根据权利要求7所述的装置,其特征在于,所述装置还包括:

循环执行模块,用于令i=i+1,重复执行从所述针对于增量数据同步任务对应的n个数据表,在第i个迭代周期内以第一数据表资源配比执行每个所述数据表对应的数据同步任务至所述在第i+1个迭代周期内以所述目标数据表资源配比执行每个所述数据表对应的数据同步任务的步骤,直至所述增量数据同步任务结束。

10.根据权利要求7所述的装置,其特征在于,当i=1时,所述第一数据表资源配比为在所述增量数据同步任务的任务初始化阶段预先设置的数据表资源配比;当i>1时,所述第一数据表资源配比为所述在第i-1个周期内获取到的数据表资源配比。

11.根据权利要求7所述的装置,其特征在于,所述模型训练模块,包括:

数据采集子模块,用于在所述第i个迭代周期中的第m个执行周期执行完成后,获取所述历史执行周期内的y个执行周期采集到的所述n个数据表对应的y*n组所述指标参数,作为所述第一训练数据,其中,当i=1时,y=m,当i>1时,y>m;

模型训练子模块,用于通过所述第一训练数据对所述资源配比模型进行训练。

12.根据权利要求7所述的装置,其特征在于,所述数据表包括发送端数据表和接收端数据表,所述指标参数用于指示每个所述数据表对应的数据同步任务在所述历史执行周期中的执行状态,所述指标参数包括:所述执行周期的周期时长,每个所述数据表对应的数据同步任务的执行时长、数据量和数据大小,以及数据从发送端数据库导入至所述发送端数据表的导入速率和数据从所述接收端数据表导出至接收端数据库的导出速率。

13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-6中任一项所述方法的步骤。

14.一种电子设备,其特征在于,包括:

存储器,其上存储有计算机程序;

处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-6中任一项所述方法的步骤。