利索能及
我要发布
收藏
专利号: 2018104967267
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种确定事件影响因素的方法,其特征在于,包括:

获取与事件相关的多个数据样本,所述数据样本包括标签特征值和多个因素特征值,所述标签特征值用于指示事件结果,每个所述因素特征值分别与一个预设的样本因素对应;

将所述多个数据样本与预设的学习模型进行拟合,并将拟合完成的所述学习模型输出为因素结构树;

从所述因素结构树的结构节点中确定出因素节点,并将与所述因素节点对应的样本因素输出为所述事件的影响因素。

2.如权利要求1所述的方法,其特征在于,所述将所述多个数据样本与预设的学习模型进行拟合,并将拟合完成的所述学习模型输出为因素结构树,包括:根据所述多个数据样本构建数据样本集,将每个所述数据样本的标签特征值设置为所述数据样本集的标签参数,并将每个所述数据样本的所述多个因素特征值设置为所述数据样本集的输入参数;

获取所述输入参数内与每个所述样本因素对应的所述因素特征值的取值范围,并对所述取值范围进行二分操作直至得到N个二分点,其中,N为大于零的整数;

根据所述数据样本集构建所述因素结构树的根节点,并计算根据多个所述样本因素对应的所述N个二分点对所述根节点进行分裂得到的最佳分裂收益;

若所述最佳分裂收益大于预设的收益阈值,则根据所述最佳分裂收益对应的二分点对所述根节点进行二分操作;

对将所述根节点进行二分操作后得到的节点继续进行二分操作,直到基于二分操作得到的节点构建的所述因素结构树达到预设的停止条件。

3.如权利要求2所述的方法,其特征在于,所述计算根据所述N个二分点对所述根节点进行分裂得到的最佳分裂收益,包括:根据所述二分点将所述数据样本集分为第一样本集和第二样本集,并将所述第一样本集和第二样本集输入预设的收益算式,得到分裂收益;

获取多个所述样本因素的所述N个二分点对应的多个所述分裂收益,并将数值最大的所述分裂收益作为所述最佳分裂收益。

4.如权利要求1所述的方法,其特征在于,若存在多个所述影响因素,所述将与所述因素节点对应的样本因素输出为所述事件的影响因素,还包括:统计所述因素节点在所述因素结构树中出现的出现次数;

根据所述出现次数对与所述因素节点对应的多个所述影响因素进行排序,并输出排序后的多个所述影响因素。

5.如权利要求1所述的方法,其特征在于,所述从所述因素结构树的结构节点中确定出因素节点,包括:分别获取每个所述结构节点在所述因素结构树中的权重值;

将所述权重值大于预设的权重阈值的所述结构节点作为所述因素节点进行输出。

6.一种终端设备,其特征在于,所述终端设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下步骤:获取与事件相关的多个数据样本,所述数据样本包括标签特征值和多个因素特征值,所述标签特征值用于指示事件结果,每个所述因素特征值分别与一个预设的样本因素对应;

将所述多个数据样本与预设的学习模型进行拟合,并将拟合完成的所述学习模型输出为因素结构树;

从所述因素结构树的结构节点中确定出因素节点,并将与所述因素节点对应的样本因素输出为所述事件的影响因素。

7.如权利要求6所述的终端设备,其特征在于,所述将所述多个数据样本与预设的学习模型进行拟合,并将拟合完成的所述学习模型输出为因素结构树,包括:根据所述多个数据样本构建数据样本集,将每个所述数据样本的标签特征值设置为所述数据样本集的标签参数,并将每个所述数据样本的所述多个因素特征值设置为所述数据样本集的输入参数;

获取所述输入参数内与每个所述样本因素对应的所述因素特征值的取值范围,并对所述取值范围进行二分操作直至得到N个二分点,其中,N为大于零的整数;

根据所述数据样本集构建所述因素结构树的根节点,并计算根据多个所述样本因素对应的所述N个二分点对所述根节点进行分裂得到的最佳分裂收益;

若所述最佳分裂收益大于预设的收益阈值,则根据所述最佳分裂收益对应的二分点对所述根节点进行二分操作;

对将所述根节点进行二分操作后得到的节点继续进行二分操作,直到基于二分操作得到的节点构建的所述因素结构树达到预设的停止条件。

8.如权利要求7所述的终端设备,其特征在于,所述计算根据所述N个二分点对所述根节点进行分裂得到的最佳分裂收益,包括:根据所述二分点将所述数据样本集分为第一样本集和第二样本集,并将所述第一样本集和第二样本集输入预设的收益算式,得到分裂收益;

获取多个所述样本因素的所述N个二分点对应的多个所述分裂收益,并将数值最大的所述分裂收益作为所述最佳分裂收益。

9.如权利要求6所述的终端设备,其特征在于,若存在多个所述影响因素,所述将与所述因素节点对应的样本因素输出为所述事件的影响因素,还包括:统计所述因素节点在所述因素结构树中出现的出现次数;

根据所述出现次数对与所述因素节点对应的多个所述影响因素进行排序,并输出排序后的多个所述影响因素。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述方法的步骤。