利索能及
我要发布
收藏
专利号: 2021101997879
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种用户行为预测方法,其特征在于,所述用户行为预测方法包括:响应于用户行为预测指令,根据所述用户行为预测指令确定源域及目标域,所述目标域是指新产品,所述源域是指与所述新产品类似的已有产品,所述根据所述用户行为预测指令确定源域及目标域包括:解析所述用户行为预测指令的方法体,得到所述用户行为预测指令所携带的信息;获取第一预设标签及第二预设标签;根据所述第一预设标签构建第一正则表达式,及根据所述第二预设标签构建第二正则表达式;利用所述第一正则表达式在所述用户行为预测指令所携带的信息中进行遍历,并将遍历到的数据确定为第一标识;

利用所述第二正则表达式在所述用户行为预测指令所携带的信息中进行遍历,并将遍历到的数据确定为第二标识;根据所述第一标识确定所述源域,及根据所述第二标识确定所述目标域;

获取所述源域的数据构建源域数据集,及获取所述目标域的数据构建目标域数据集;

初始化所述源域数据集及所述目标域数据集的权重,得到初始权重;

根据所述源域数据集、所述目标域数据集及所述初始权重对逻辑回归分类器执行预设轮数的迭代训练,并保存每轮迭代得到的基分类器;

获取测试数据集,并计算每个基分类器在所述测试数据集上的KS值,并将所述KS值最高的基分类器确定为目标分类器;

获取待处理数据,将所述待处理数据输入至所述目标分类器,并根据所述目标分类器的输出确定行为预测结果。

2.如权利要求1所述的用户行为预测方法,其特征在于,所述初始权重的公式如下:其中, 表示第i个样本的初始权重取值,n表示所述源域数据集中的样本数量,m表示所述目标域数据集中的样本数量,i∈[1,n+m]。

3.如权利要求2所述的用户行为预测方法,其特征在于,所述方法还包括:计算所述源域数据集与所述目标域数据集的并集,得到样本集;

对于每轮迭代训练,配置用于计算所述源域数据集的权重的第一阈值,及配置用于计算所述目标域数据集的权重的第二阈值;

对于所述样本集中的每个样本,基于每轮迭代训练得到的基分类器计算分类结果;

获取每个样本的实际标签,及获取每轮迭代训练过程中所述源域数据集及所述目标域数据集的权重;

根据所述第一阈值、所述第二阈值、所述分类结果及所述实际标签更新每轮迭代训练过程中所述源域数据集及所述目标域数据集的权重;

利用更新后的权重执行下一轮迭代训练。

4.如权利要求3所述的用户行为预测方法,其特征在于,所述第一阈值的公式如下:其中,β表示所述第一阈值,N表示所述预设轮数;

所述第二阈值的公式如下:

其中,βt表示所述第二阈值,Ut表示所述目标域数据集上产生的错误率,公式如下:其中, 表示第i个样本在第t轮迭代过程中的权重,ht(xi)表示第i个样本在第t轮迭代过程中的分类结果,c(xi)表示第i个样本的实际标签。

5.如权利要求3所述的用户行为预测方法,其特征在于,所述基于每轮迭代训练得到的基分类器计算分类结果包括:

获取历史数据及每个历史数据的实际标签;

从所述实际标签中识别配置行为对应的标签作为目标标签,并计算所述目标标签在所述历史数据中的占比作为转化率;

通过所述转化率确定分位点作为分类阈值;

当所述基分类器的输出大于或者等于所述分类阈值时,确定所述分类结果为1;或者当所述基分类器的输出小于所述分类阈值时,确定所述分类结果为0。

6.如权利要求4所述的用户行为预测方法,其特征在于,所述更新后的权重的公式如下:

其中, 表示更新后第i个样本在第(t+1)轮迭代过程中的权重。

7.一种用户行为预测装置,其特征在于,所述用户行为预测装置包括:确定单元,用于响应于用户行为预测指令,根据所述用户行为预测指令确定源域及目标域,所述目标域是指新产品,所述源域是指与所述新产品类似的已有产品,所述根据所述用户行为预测指令确定源域及目标域包括:解析所述用户行为预测指令的方法体,得到所述用户行为预测指令所携带的信息;获取第一预设标签及第二预设标签;根据所述第一预设标签构建第一正则表达式,及根据所述第二预设标签构建第二正则表达式;利用所述第一正则表达式在所述用户行为预测指令所携带的信息中进行遍历,并将遍历到的数据确定为第一标识;利用所述第二正则表达式在所述用户行为预测指令所携带的信息中进行遍历,并将遍历到的数据确定为第二标识;根据所述第一标识确定所述源域,及根据所述第二标识确定所述目标域;

获取单元,用于获取所述源域的数据构建源域数据集,及获取所述目标域的数据构建目标域数据集;

初始化单元,用于初始化所述源域数据集及所述目标域数据集的权重,得到初始权重;

训练单元,用于根据所述源域数据集、所述目标域数据集及所述初始权重对逻辑回归分类器执行预设轮数的迭代训练,并保存每轮迭代得到的基分类器;

计算单元,用于获取测试数据集,并计算每个基分类器在所述测试数据集上的KS值,并将所述KS值最高的基分类器确定为目标分类器;

所述确定单元,还用于获取待处理数据,将所述待处理数据输入至所述目标分类器,并根据所述目标分类器的输出确定行为预测结果。

8.一种电子设备,其特征在于,所述电子设备包括:存储器,存储至少一个指令;及

处理器,执行所述存储器中存储的指令以实现如权利要求1至6中任意一项所述的用户行为预测方法。

9.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现如权利要求1至6中任意一项所述的用户行为预测方法。