1.一种业务数据处理方法,其特征在于,包括:
获取业务单据的属性指标数据;所述属性指标数据包括保单关键信息、保单的基本信息、业务员信息、投保人信息及投保人与公司交互动作信息;
对所述业务单据的保单关键信息、保单的基本信息、业务员信息、投保人信息及投保人与公司交互动作信息进行分析和整理,获取所述业务单据的若干字段变量;
以第一计算规则,对所述业务单据的若干字段变量进行初步筛选,得到初步筛选后的变量;所述第一计算规则包括计算所述属性指标数据的最大值、最小值、计算平均偏差或标准偏差;
对初步筛选后的变量,以第二计算规则,计算每一变量的信息值IV,所述IV为反映每一变量的预测能力的指标;所述第二计算规则包括将变量WOE编码方式离散化之后,根据公式计算IVi,对IVi求和得到IV;其中,#Bi为各个离散化区间自变量中为流失保单的样本量,#Bt为自变量中为流失保单的样本量,#Gi为各个离散化区间自变量中为正常交费保单的样本量,#Gt为自变量中为正常交费保单的样本量;
获取IV大于或等于预设阈值的变量作为模型变量;
将提取的所述模型变量输入预先建立的业务流失预测模型,得到对应业务单据的业务流失估计分值。
2.根据权利要求1所述的方法,其特征在于,还包括:
根据所述业务单据的业务流失估计分值,获取所述业务单据的流失影响因素,所述流失影响因素至少包括一种属性指标数据;
根据所述业务单据的流失影响因素获取相应的攻关策略;
将所述业务单据的业务流失估计分值、流失影响因素以及相应的攻关策略,推送给相关业务人员。
3.根据权利要求1所述的方法,其特征在于,所述获取IV大于或等于预设阈值的变量作为模型变量的步骤之后还包括:对获取的模型变量进行相关性检验,获取具有相关性的变量组中IV最大的模型变量作为最终的模型变量。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述获取业务单据的属性指标数据的步骤之前还包括:构建所述业务流失预测模型,具体包括:
获取样本业务单据的属性指标数据;
对所述样本业务单据的属性指标数据进行分析,从中提取样本模型变量;
获取所述样本业务单据的业务流失估计分值;
根据所述样本模型变量,以及所述样本业务单据的业务流失估计分值,建立业务流失预测模型。
5.根据权利要求4所述的方法,其特征在于,还包括:
对所述业务流失预测模型进行验证。
6.一种业务数据处理装置,其特征在于,包括:
数据获取模块,用于获取业务单据的属性指标数据;所述属性指标数据包括保单关键信息、保单的基本信息、业务员信息、投保人信息及投保人与公司交互动作信息;
分析提取模块,用于对所述业务单据的保单关键信息、保单的基本信息、业务员信息、投保人信息及投保人与公司交互动作信息进行分析和整理,获取所述业务单据的若干字段变量;以第一计算规则,对所述业务单据的若干字段变量进行初步筛选,得到初步筛选后的变量;所述第一计算规则包括计算所述属性指标数据的最大值、最小值、计算平均偏差或标准偏差;对初步筛选后的变量,以第二计算规则,计算每一变量的信息值IV,所述IV为反映每一变量的预测能力的指标;获取IV大于或等于预设阈值的变量作为模型变量;所述第二计算规则包括将变量WOE编码方式离散化之后,根据公式 计算IVi,对IVi求和得到IV;其中,#Bi为各个离散 化区间自变量中为流失保单的样本量,#Bt为自变量中为流失保单的样本量,#Gi为各个离散化区间自变量中为正常交费保单的样本量,#Gt为自变量中为正常交费保单的样本量;
处理模块,用于将提取的所述模型变量输入预先建立的业务流失预测模型,得到对应业务单据的业务流失估计分值。
7.根据权利要求6所述的装置,其特征在于,还包括:
策略推送模块,用于根据所述业务单据的业务流失估计分值,获取所述业务单据的流失影响因素,所述流失影响因素至少包括一种属性指标数据;根据所述业务单据的流失影响因素获取相应的攻关策略;将所述业务单据的业务流失估计分值、流失影响因素以及相应的攻关策略,推送给相关业务人员。
8.根据权利要求6所述的装置,其特征在于,
所述分析提取模块,进一步还用于对获取的模型变量进行相关性检验,获取具有相关性的变量组中IV最大的模型变量作为最终的模型变量。
9.根据权利要求6、7或8所述的装置,其特征在于,还包括:模型构建模块,用于构建所述业务流失预测模型,具体用于:
获取样本业务单据的属性指标数据;对所述样本业务单据的属性指标数据进行分析,从中提取样本模型变量;获取所述样本业务单据的业务流失估计分值;根据所述样本模型变量,以及所述样本业务单据的业务流失估计分值,建立业务流失预测模型;
模型验证模块,用于对所述业务流失预测模型进行验证。