1.一种用户判别模型训练方法,其特征在于,所述用户判别模型包括行为特征提取模块和判别模块,所述方法包括:
获取训练样本集,所述训练样本集包括多个训练样本的样本信息和样本标签,其中,一个训练样本的样本信息包括一个用户对应的行为编码,所述行为编码用于指示所述一个用户在预设时间周期内的网页浏览行为,一个样本标签用于指示一个用户是否属于预设行为用户,所述预设行为用户是指进行与预设类型的网页相关联的行为的用户;
从所述训练样本集中选取目标训练样本、所述目标训练样本的正参考样本和所述目标训练样本的负参考样本,并将所述目标训练样本、所述正参考样本和所述负参考样本各自的样本信息分别输入至所述行为特征提取模块,以得到所述目标训练样本、所述正参考样本和所述负参考样本各自对应的行为特征;其中,所述目标训练样本为所述训练样本集中的任意一个训练样本,所述正参考样本的样本标签与所述目标训练样本的样本标签相同,所述负参考样本的样本标签与所述目标训练样本的样本标签不同;
将所述目标训练样本、所述正参考样本和所述负参考样本各自对应的行为特征分别输入至所述判别模块,以获取所述目标训练样本、所述正参考样本和所述负参考样本各自对应的判别结果,一个判别结果用于指示一个训练样本对应的用户是否属于所述预设行为用户;
根据所述目标训练样本、所述正参考样本和所述负参考样本各自对应的行为特征,以及,所述目标训练样本、所述正参考样本和所述负参考样本各自对应的判别结果,以及,所述目标训练样本、所述正参考样本和所述负参考样本各自的样本标签,对所述用户判别模型进行调参,返回执行所述从所述训练样本集中选取目标训练样本、所述目标训练样本的正参考样本和所述目标训练样本的负参考样本的步骤,直至所述用户判别模型收敛,将收敛后的用户判别模型确定为目标用户判别模型。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标训练样本、所述正参考样本和所述负参考样本各自对应的行为特征,以及,所述目标训练样本、所述正参考样本和所述负参考样本各自对应的判别结果,以及,所述目标训练样本、所述正参考样本和所述负参考样本各自的样本标签,对所述用户判别模型进行调参,包括:根据所述目标训练样本对应的行为特征与所述正参考样本对应的行为特征之间的差距,以及,所述目标训练样本对应的行为特征与所述负参考样本对应的行为特征之间的差距,计算特征提取损失,所述特征提取损失用于指示所述用户判别模型进行特征提取的精准度;
根据所述目标训练样本对应的判别结果与所述目标训练样本的样本标签之间的差距、所述正参考样本对应的判别结果与所述正参考样本的样本标签之间的差距,以及,所述负参考样本对应的判别结果与所述负参考样本的样本标签之间的差距,计算判别损失,所述判别损失用于指示用户判别模型进行判别的精准度;
根据所述特征提取损失和所述判别损失,得到所述用户判别模型的损失;
根据所述用户判别模型的损失,对所述用户判别模型进行调参。
3.根据权利要求1所述的方法,其特征在于;所述获取训练样本集,包括:获取第一用户在所述预设时间周期内的网页浏览行为数据,所述第一用户为任一用户,所述网页浏览行为数据包括第一行为对应的行为时间数据、第二行为对应的行为时间数据和/或第三行为对应的行为时间数据,所述第一行为是指浏览所述预设类型的网页,所述第二行为是指浏览除所述预设类型以外的网页,所述第三行为是指未浏览网页;
按预设划分频率,将所述预设时间周期划分为多个时间片段;
对所述第一用户在各时间片段内的网页浏览行为数据进行编码,以得到所述第一用户对应的行为编码。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一用户在各时间片段内的网页浏览行为数据进行编码,以得到所述第一用户对应的行为编码,包括:若目标时间片段中第一用户进行目标行为的时长大于预设时间阈值,则将所述目标时间片段内的网页浏览行为数据编码为所述目标行为对应的行为编码,所述目标时间片段为所述多个时间片段中的任一时间片段,所述目标行为为所述第一行为、所述第二行为或所述第三行为。
5.根据权利要求3所述的方法,其特征在于,所述一个训练样本的样本信息还包括一个用户对应的行为时长编码,所述行为时长编码用于指示所述一个用户在所述预设时间周期内的浏览行为时长信息;
所述获取训练样本集,还包括:
根据所述第一行为对应的行为时间数据,确定所述第一行为对应的总时长;
根据所述第二行为对应的行为时间数据,确定所述第二行为对应的总时长;
根据所述第三行为对应的行为时间数据,确定所述第三行为对应的总时长;
对所述第一行为对应的总时长、所述第二行为对应的总时长以及所述第三行为对应的总时长进行编码,得到所述第一用户对应的行为时长编码。
6.一种用户判别方法,其特征在于,包括:获取目标用户的用户行为信息,所述用户行为信息包括目标行为编码,所述目标行为编码用于指示所述目标用户在预设时间周期内的网页浏览行为;
将所述用户行为信息输入至目标用户判别模型中,以得到所述目标用户的判别结果,所述判别结果用于指示所述目标用户是否为潜在的预设行为用户,所述目标用户判别模型为通过权利要求1‑5任一项所述的用户判别模型训练方法训练得到,所述预设行为用户是指进行与预设类型的网页相关联的行为的用户。
7.一种用户判别模型训练装置,其特征在于,所述用户判别模型包括行为特征提取模块和判别模块,所述用户判别模型训练装置包括:样本获取模块,用于获取训练样本集,所述训练样本集包括多个训练样本的样本信息和样本标签,其中,一个训练样本的样本信息包括一个用户对应的行为编码,所述行为编码用于指示所述一个用户在预设时间周期内的网页浏览行为,一个样本标签用于指示一个用户是否属于预设行为用户,所述预设行为用户是指进行与预设类型的网页相关联的行为的用户;
第一输入模块,用于从所述训练样本集中选取目标训练样本、所述目标训练样本的正参考样本和所述目标训练样本的负参考样本,并将所述目标训练样本、所述正参考样本和所述负参考样本各自的样本信息分别输入至所述行为特征提取模块,以得到所述目标训练样本、所述正参考样本和所述负参考样本各自对应的行为特征;其中,所述目标训练样本为所述训练样本集中的任意一个训练样本,所述正参考样本的样本标签与所述目标训练样本的样本标签相同,所述负参考样本的样本标签与所述目标训练样本的样本标签不同;
第二输入模块,用于将所述目标训练样本、所述正参考样本和所述负参考样本各自对应的行为特征分别输入至所述判别模块,以获取所述目标训练样本、所述正参考样本和所述负参考样本各自对应的判别结果,一个判别结果用于指示一个训练样本对应的用户是否属于所述预设行为用户;
调参模块,用于根据所述目标训练样本、所述正参考样本和所述负参考样本各自对应的行为特征,以及,所述目标训练样本、所述正参考样本和所述负参考样本各自对应的判别结果,以及,所述目标训练样本、所述正参考样本和所述负参考样本各自的样本标签,对所述用户判别模型进行调参,触发第一输入模块执行所述从所述训练样本集中选取目标训练样本、所述目标训练样本的正参考样本和所述目标训练样本的负参考样本的步骤,直至所述用户判别模型收敛,将收敛后的用户判别模型确定为目标用户判别模型。
8.一种用户判别装置,其特征在于,包括:行为获取模块,用于获取目标用户的用户行为信息,所述用户行为信息包括目标行为编码,所述目标行为编码用于指示所述目标用户在预设时间周期内的网页浏览行为;
结果输出模块,用于将所述用户行为信息输入至目标用户判别模型中,以得到所述目标用户的判别结果,所述判别结果用于指示所述目标用户是否为潜在的预设行为用户,所述目标用户判别模型为通过权利要求1‑5任一项所述的用户判别模型训练方法训练得到,所述预设行为用户是指进行与预设类型的网页相关联的行为的用户。
9.一种计算机设备,其特征在于,包括存储器以及处理器,所述处理器用于执行存储在所述存储器中的一个或多个计算机程序,所述处理器在执行所述一个或多个计算机程序时,使得所述计算机设备实现如权利要求1‑7任一项或权利要求8所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1‑7任一项或权利要求8所述的方法。