1.一种数据预测方法,其特征在于,包括下述步骤:
接收数据预测请求,根据所述数据预测请求确定模型信息和第一用户信息,并从数据处理服务器内的全量数据表中获取预测数据表,其中所述全量数据表由至少两个初始数据表关联形成;
根据所述模型信息从模型服务器中获取预生成的数据挖掘模型,并根据所述第一用户信息在所述模型服务器中配置对应的预测资源;
基于所述预测资源和所述数据挖掘模型生成数据预测模型文件,将其发送至至少一个数据存储服务器,以在所述数据存储服务器上运行所述数据挖掘模型,根据所述预测数据表从所述数据存储服务器获取对应的预测入模特征的特征值输入所述数据挖掘模型,得到待预测的目标变量的数据值,完成数据预测;
其中,所述数据挖掘模型的生成过程包括:
接收建模请求,根据所述建模请求确定模型算法信息和第二用户信息,并从所述全量数据表中获取建模所需的训练数据表;根据所述第二用户信息在所述模型服务器中配置对应的建模资源,并根据所述模型算法信息从所述模型服务器中确定待训练的模型框架,以及基于所述训练数据表提取建模入模特征和建模目标变量;基于所述建模资源,通过所述待训练的模型框架、所述建模入模特征和所述建模目标变量进行模型训练,生成所述数据挖掘模型。
2.根据权利要求1所述的数据预测方法,其特征在于,所述根据所述第二用户信息在所述模型服务器中配置对应的建模资源包括:根据预设的时间间隔获取所述模型服务器对应的数据库中与所述第二用户信息对应的待执行建模任务的信息,生成建模资源配置请求;
根据所述建模资源配置请求查询所述模型服务器的闲置资源是否满足模型训练的需求,若满足则对获取的所述待执行建模任务分配相应的建模资源,否则拒绝当前所述建模资源配置请求。
3.根据权利要求2所述的数据预测方法,其特征在于,在所述接收建模请求之后,所述方法还包括:
对所述建模请求包含的信息进行鉴权和签名校验,若通过则生成具有唯一标识的建模任务,并判断所述模型服务器对应的数据库中是否存在同一用户提交的建模任务,若存在则终止生成的所述建模任务,否则将生成的所述建模任务存入所述模型服务器对应的数据库中,并发送生成的所述建模任务的唯一标识至用户。
4.根据权利要求2所述的数据预测方法,其特征在于,在进行模型训练时,所述方法还包括:接收定时查询建模任务状态的请求,根据所述查询建模任务状态的请求访问所述模型服务器查询模型训练状态,并将查询到的模型训练状态实时更新至所述模型服务器对应的数据库中。
5.根据权利要求1至4任一项所述的数据预测方法,其特征在于,所述根据第一用户信息在所述模型服务器中配置对应的预测资源包括:根据预设的时间间隔获取所述模型服务器对应的数据库中与所述第一用户信息对应的待执行数据预测任务的信息,生成预测资源配置请求;
根据所述预测资源配置请求查询所述模型服务器的闲置资源是否满足数据预测的需求,若满足则对获取的所述待执行数据预测任务分配相应的预测资源,否则拒绝所述预测资源配置请求。
6.根据权利要求5所述的数据预测方法,其特征在于,在所述接收数据预测请求之后,所述方法还包括:对所述数据预测请求包含的信息进行鉴权和签名校验,若通过则生成具有唯一标识的数据预测任务,并判断所述模型服务器对应的数据库中是否存在同一用户的数据预测任务,若存在则终止生成的所述数据预测任务,否则将生成的所述数据预测任务存入所述模型服务器对应的数据库中,并发送生成的所述数据预测任务的唯一标识至用户。
7.根据权利要求1至4任一项所述的数据预测方法,其特征在于,所述全量数据表的获取过程包括:
从多个数据源获取数据进行分析,按照不同数据源或者不同主题生成多个所述初始数据表,并对多个所述初始数据表进行关联整合,生成所述全量数据表,并输出支撑数据分析的字段内容和待预测内容;
其中,所述字段内容用作所述建模入模特征或所述预测入模特征,所述待预测内容用作所述建模目标变量或所述待预测的目标变量,基于所述全量数据表选取用作所述建模入模特征的字段内容创建得到新的数据表可生成所述训练数据表,基于所述全量数据表选取用作所述预测入模特征的字段内容创建得到新的数据表可生成所述预测数据表。
8.一种数据预测装置,其特征在于,包括:数据预测信息获取模块、预测配置模块、数据预测模块和模型生成模块;
所述数据预测信息获取模块用于接收数据预测请求,根据所述数据预测请求确定模型信息和第一用户信息,并从数据处理服务器内的全量数据表中获取预测数据表,其中所述全量数据表由至少两个初始数据表关联形成;
所述预测配置模块用于根据所述模型信息从模型服务器中获取通过所述模型生成模块预生成的数据挖掘模型,并根据所述第一用户信息在所述模型服务器中配置对应的预测资源;
所述数据预测模块用于基于所述预测资源和所述数据挖掘模型生成数据预测模型文件,将其发送至至少一个数据存储服务器,以在所述数据存储服务器上运行所述数据挖掘模型,根据所述预测数据表从所述数据存储服务器获取对应的预测入模特征的特征值输入所述数据挖掘模型,得到待预测的目标变量的数据值,完成数据预测;
其中,所述模型生成模块具体用于接收建模请求,根据所述建模请求确定模型算法信息和第二用户信息,并从所述全量数据表中获取建模所需的训练数据表,根据所述第二用户信息在所述模型服务器中配置对应的建模资源,并根据所述模型算法信息从所述模型服务器中确定待训练的模型框架,以及基于所述训练数据表提取建模入模特征和建模目标变量,基于所述建模资源,通过所述待训练的模型框架、所述建模入模特征和所述建模目标变量进行模型训练,生成所述数据挖掘模型。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述的数据预测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至7中任一项所述的数据预测方法的步骤。